Informație

Ce înseamnă literele „p” și „c” în descrierile mutațiilor?


Exemplu:

NM_000525.3 (KCNJ11):c. 67A> G ( p. Lys23Glu) ȘI Diabetul zaharat neonatal permanent

„P” înseamnă „polimorfism”?

Ce înseamnă litera „c”?


Conform liniilor directoare HGVS, ar trebui utilizat un prefix de literă pentru a indica secvența de referință utilizată. Prefixele acceptate sunt:

  • „G.” pentru o secvență de referință genomică
  • „M.” pentru o secvență de referință mitocondrială
  • „C.” pentru o secvență de referință ADN de codificare
  • „N.” pentru o secvență de referință ADN necodificatoare
  • „R”. pentru o secvență de referință ARN (transcriere)
  • „P.” pentru o secvență de referință proteică

Ce înseamnă literele „p” și „c” în descrierile mutațiilor? - Biologie

Subtotal (articole) .00

Au un cod promoțional? Introduceți-l în timpul plății!

Cele mai populare accesorii pentru noul dvs. telescop!

Începeți aici pentru a găsi perfectul
telescop pentru tine!

NOU: Binoclu Nature DX ED

Binoclul premiat Celestron Nature DX primește un upgrade major cu adăugarea de obiective ED.

NOU: Elements ThermoTank 3

Pe traseu, la locul de muncă, în clasă sau pur și simplu stând acasă relaxându-vă - Celestron Elements ThermoTank 3 vă va menține mâinile toastate.

NOU: Elements ThermoTorch 5

Acest dispozitiv robust 3-în-1 are o lanternă tactică cu 3 moduri adevărată, un încălzitor de mână și o bancă de alimentare portabilă pentru reîncărcarea electronice personale în deplasare.


Genomul Coronavirusului

Coronavirusul este o membrană grasă cu instrucțiuni genetice pentru a face milioane de copii ale sale. Instrucțiunile sunt codificate în 30.000 de „litere” de ARN - a, c, g și u - pe care celula infectată le citește și se traduce în mai multe tipuri de proteine ​​virale.

Instrucțiuni ARN pentru fabricarea proteinei ORF1a

Începutul genomului coronavirusului

Începutul genomului coronavirusului


Ce este o mutație MTHFR?

Metilenetetrahidrofolat reductaza, sau MTHFR, este o enzimă care descompune aminoacidul homocisteină. Gena MTHFR care codifică această enzimă are potențialul de a muta, care poate interfera cu capacitatea enzimei de a funcționa normal sau o poate dezactiva complet.

Oamenii au două MTHFR gene, moștenind una de la fiecare dintre părinții lor. Mutațiile pot afecta unul (heterozigoți) sau ambii (homozigoți) dintre aceste gene.

Există două tipuri sau variante comune de MTHFR mutație: C677T și A1298C.

Mutații în MTHFR genele apar la aproximativ 25% dintre persoanele de origine hispanică și 10-15% dintre caucazienii din America de Nord.

Aceste mutații, în cazuri rare, conduc la niveluri ridicate de homocisteină în sânge, care pot contribui la numeroase afecțiuni de sănătate, cum ar fi:

În acest articol, ne uităm la MTHFR mutații în detaliu, inclusiv condițiile de sănătate conexe, diagnosticul și opțiunile de tratament. De asemenea, discutăm cum MTHFR mutațiile pot afecta sarcina.

Distribuiți pe Pinterest Un medic poate examina istoricul medical al unei persoane atunci când diagnostică o mutație MTHFR.

Mutații în MTHFR gena poate afecta capacitatea organismului de a procesa aminoacizii - și anume homocisteina - ceea ce poate duce la rezultate negative asupra sănătății.

Condiții cu care cercetătorii s-au asociat MTHFR mutațiile genice includ:

    , care este termenul pentru niveluri anormal de ridicate de homocisteină în sânge sau urină, o afecțiune neurologică care afectează coordonarea
  • neuropatie periferică, o afecțiune neurologică care afectează nervii, o afecțiune prezentă la naștere în care capul este mai mic decât de obicei, o curbură anormală a coloanei vertebrale, ceea ce înseamnă că o persoană are o lipsă de celule roșii din sânge
  • boli cardiovasculare, cum ar fi cheaguri de sânge, atacuri cerebrale și atacuri de cord
  • tulburări de sănătate mintală și comportament, cum ar fi depresia și tulburarea de hiperactivitate cu deficit de atenție (ADHD)

Simptomele variază atât în ​​rândul indivizilor, cât și în funcție de tipul mutației. De obicei, oamenii nu știu că au MTHFR mutație, cu excepția cazului în care au simptome severe sau sunt supuse testelor genetice.

Având una sau două MTHFR mutațiile pot crește ușor nivelurile de homocisteină prezente în sânge. Această afecțiune se numește homocistinemie.

Homocisteina este un aminoacid pe care organismul îl produce prin descompunerea proteinelor alimentare. Nivelurile ridicate de homocisteină pot deteriora vasele de sânge și pot duce la formarea de cheaguri de sânge. Persoanele care au un nivel ridicat de homocisteină tind să aibă un nivel scăzut de vitamina B-12.


Rearanjări cromozomiale în Neurospora și alte ciuperci filamentoase

David D. Perkins, în Advances in Genetics, 1997

Fundaluri pentru rearanjări în Neurospora

Citogenetica fungică a fost inițiată de Barbara McClintock în 1944 în timpul unei vizite de 10 săptămâni la Universitatea Stanford la invitația lui G. W. Beadle (McClintock, 1945). Mai devreme, când McClintock și Beadle erau ambii studenți la Cornell, ea revoluționase citogenetica porumbului folosind tehnica de squash a lui Belling (1927) pentru a pregăti microsporocitele pentru examinare, o metodă mai informativă și mai convenabilă decât înglobarea și secționarea tradiționale. Ea a adaptat metoda pentru Neurospora asci și a reușit să arate că cei șapte Neurospora cromozomii s-ar putea distinge prin mărimea și morfologia lor, chiar dacă (așa cum știm acum) conținutul lor de ADN este cu două ordine de mărime mai mic decât cel al porumbului.

În prima ei Neurospora McClintock a descris cariotipul la pahitene și la metafaza postmeiotică și a arătat că meioza este în esență aceeași ca la plante și animale. Ea a examinat, de asemenea, trei translocații reciproce putative, a identificat cvadrivalenți ai profazei I și segregarea în heterozigoți structurali la modelele avortului ascosporic în ascile liniare. În anii care au urmat, studii citologice și genetice ale Neurospora translocațiile au fost extinse de studenții ei Singleton (1948) și St. Lawrence (1953), și de Barry (1960b, 1967) și Phillips (1967). Pentru o evaluare a lucrării lui McClintock cu Neurospora, vezi Perkins (1992a).

Rearanjări utilizate cel mai devreme Neurospora studiile au fost detectate din cauza legăturilor genetice neașteptate. De atunci, însă, rearanjările au fost de obicei recunoscute ca fiind aberante, deoarece o fracțiune din ascospori din cruci de Rearanjare × Normal sunt nepigmentate (numite „albe”), spre deosebire de ascospori din încrucișări homozigote din punct de vedere structural, care sunt aproape toate negre. Eșecul pigmentării rezultă din deficiențele generate de recombinarea meiotică. Acestea duc la maturizarea arestată și moartea timpurie a oricărui ascospor care primește un genom deficitar. Nu numai heterozigoza pentru o rearanjare este semnalată vizual de ascosporii nepigmentați, ci și sporii pigmentați și nepigmentați apar în modele și frecvențe caracteristice diferitelor tipuri de aberații.

Modele de avort cu ascospori pot fi văzute în ascuri liniare când sunt deschise peritecii, aceasta a fost metoda utilizată de McClintock. Rearanjările cromozomiale pot fi, de asemenea, detectate prin inspectarea ascosporilor care sunt împușcați din peritecii de maturare. Sporii sunt expulzați ca grupuri neordonate de opt care provin din ascuri individuale. Tipul de reamenajare poate fi de obicei dedus din frecvențele relative ale ascurilor neordonate cu un număr diferit de ascospori nepigmentați, avortați (Perkins, 1966, 1974). Sute de rearanjări au fost identificate în Neurospora folosind această abordare. Acestea au fost confirmate genetic, iar punctele lor de întrerupere au fost cartografiate.

The Neurospora rearanjările au fost folosite la mai multe utilizări.

Atribuirea grupurilor de legătură și a genelor la cromozomi și segmente de cromozomi distincte citologic (St. Lawrence, 1953 Phillips, 1967 Barry, 1967 Perkins și Barry, 1977).

Studierea polarității recombinării intragenice (Murray, 1968).

Arătând că un recombinator acționează numai în cis (Catcheside și Angel, 1974).

Utilizarea tulpinilor cu translocații multiple pentru a crește eficiența detectării legăturii (Perkins și colab., 1969 ).

Construirea unui echilibrat și utilizarea acestuia pentru a examina tulpinile din natură pentru prezența unor alele letale recesive în fază sexuală sau dăunătoare (Leslie, 1985).

Producerea de duplicări și deficiențe ale conținutului definit (vezi Perkins, 1974 Perkins și Barry, 1977). (Termenii „duplicare” sau „duplicare segmentară” vor fi folosiți pentru a desemna fie un segment de cromozom care este prezent ca două copii nontandem, fie o tulpină care conține un astfel de segment. O tulpină de duplicare poate fi numită și „diploid parțial”.)

Folosind rearanjări care generează dubluri pentru a mapa gene, centromeri și grupuri de legături (Perkins, 1974, 1986 Perkins și Barry, 1977 pentru alte exemple, vezi Davis, 1979 Metzenberg și colab., 1985 ). (Tmetoda sa precisă este analogă cu cartarea ștergerii în fag. Baza pentru cartografierea prin acoperire prin duplicare este prezentată în Figura 1.)

Figura 1 . Un exemplu al modului în care genele și punctele de întrerupere sunt mapate de media de duplicare. Genotipuri de descendenți viabili în ascuri dintr-o cruce de translocație inserțională (centromeri negri) × Normal (centromeri albi), unde părintele cu secvență normală conținea un marker recesiv (d) în interiorul segmentului translocat și un alt marker recesiv (b) în afara segmentului . Segmentul translocat este prezentat nepereche cu omologul său poziționat nonnal. Cele două diagrame de sus arată consecințele segregării ditype parentale și ditype neparentale a centromerilor și a punctelor de întrerupere, fără trecere. Trecerea în oricare dintre regiunile interstițiale dintre centromeri și puncte de întrerupere are ca rezultat asci tetratip, a căror constituire este prezentată în cele două diagrame de jos. Descendenții de duplicare sunt heterozigoți D / d, fenotip D +. Produsele deficitare sunt inviabile. Raportul fenotipic dominant: recesiv dintre descendenții viabili este 1: 2 pentru b, care nu este acoperit, și 2: 1 pentru d, care este acoperit. Așteptările ar fi similare pentru translocațiile cvasiterminale. Aceste rapoarte se aplică markerilor care nu se recombină cu un punct de întrerupere a translocației. Trecerea între b și translocație ar schimba raportul B: b către egalitate. Pentru o translocație inserțională sau cvasiterminală cu 60% tetratipuri, tipurile de ascus neordonate așteptate ar fi 20% 8B: 0 W, 60% 6B: 2 W, 20% 4B: 4 W, 0% 2B: 6 W și 0% 0B : 8 W.

Utilizarea duplicărilor pentru identificarea genelor care determină incompatibilitatea vegetativă (Newmeyer și Taylor, 1967 Perkins, 1975 Perkins și colab., 1993a Mylyk, 1975, 1976 Arganoza și colab., 1994 Glass și Kuldau, 1992 Leslie, 1995). (Dacă D și d în Figura 1 au fost alele la un astfel de locus, heterozigoza în descendenții de duplicare ar fi semnalată de un fenotip anormal caracteristic.)

Determinarea efectelor de dominanță și dozare în studiile de reglare (Metzenberg și colab., 1974 Metzenberg și Chia, 1979). Demonstrarea diferențelor de dominanță între fazele sexuale și vegetative ( Turner, 1977).

Clarificarea bazei efectelor poziției transgenice care conduc la exprimarea independentă de activator a genelor reglementate pozitiv (Versaw și Metzenberg, 1996).

Căutarea unui efect de poziție de tip variație (Johnson, 1979).

Determinarea efectului mutanților sensibili la mutageni asupra stabilității cromozomilor (Schroeder, 1970, 1986 Newmeyer și Galeazzi, 1977, 1978).

Determinarea relației centromerului - distanța punctului de întrerupere la nedisjunctiune de la cvadrivalenții de translocație (Perkins și Raju, 1995).

Studierea organizatorului nucleolului (NOR), localizarea acestuia pe harta genetică, recombinarea în interiorul NOR și între blocurile NOR și deplasate ale rADN, modificări ale numărului de repetare a rADN, pronosticitatea ADNr la rupere și limitarea pauzelor cu noi telomeri ( Phillips, 1967 Barry și Perkins, 1969 Perkins și colab., 1980, 1984, 1986, 1995a Rodland și Russell, 1982, 1983 Russell și Rodland, 1986 Butler și Metzenberg, 1989, 1990 Butler, 1992).

Determinarea orientării 3′ – 5 ′ a genelor secvențiate în raport cu hărțile de legătură (Paluh și colab., 1990 Schmidhauser și colab., 1990 ).

Furnizarea punctului de plecare pentru o plimbare cromozomială și determinarea direcției acesteia (Smith și Glass, 1996).

Determinarea secvențelor de nucleotide între joncțiunile punctului de întrerupere (Asch și colab., 1992 Cambareri și Kinsey, 1997 vezi Perkins, 1995).

Identificarea ADN-urilor cromozomiale separate prin electroforeză cu gel de câmp pulsat (Orbach și colab., 1988 ).

Furnizarea cromozomilor trunchiați cu care să se pregătească biblioteci specifice regiunii pentru construirea contigurilor și clonarea genelor de interes (Ballario și colab., 1989, 1996 ).

Demonstrarea ajustării sinaptice în inversiunile heterozigote (Bojko, 1990).

Studierea mutației punctuale induse de repetarea premeiotică (RIP) a genelor conținute în duplicări segmentare (Perkins și colab., 1997 ).

Obținerea heterocarionilor cu duplicări și deficiențe complementare în nucleele constitutive (D. D. Perkins, nepublicat).

Metodele și rezultatele timpurii cu rearanjări au fost descrise de Perkins (1966, 1974) și au fost revizuite într-un context citogenetic mai larg de Perkins și Barry (1977). O compilație de informații pe 167 Neurospora rearanjamentele au fost anexate la revizuirea din 1977. În acel moment, doar o mână de rearanjări cromozomiale erau cunoscute în alte microorganisme eucariote decât Neurospora crassa și Aspergillus nidulans.


Discuţie

Numărul de secvențe de genom și proteine ​​disponibile a crescut enorm în ultimul deceniu, datorită progreselor în tehnologiile de secvențiere de generația următoare. În această bogăție de date noi, am descoperit un număr mare de variante de codare nevăzute anterior cu semnificație funcțională necunoscută. Pentru a ne ajuta în analiza acestor noi date, au fost dezvoltați predictori de calcul, dar instruirea și evaluarea acestor predictori suferă adesea de părtiniri. Experimentele DMS oferă un etalon ideal pentru testarea predictorilor, asigurându-se că niciunul dintre datele de instruire nu este inclus în evaluare. Disponibilitatea unui număr mare de astfel de seturi de date DMS experimentale a facilitat acest studiu.

Suntem conștienți de faptul că numeroși factori tehnici și de calcul pot afecta calitatea datelor din studiile DMS. Acestea pot proveni din procedura experimentală și, prin urmare, pot fi evaluate prin reproductibilitate în replici biologice sau incertitudine de măsurare evaluată prin replici tehnice. Cea mai mare sursă de eroare din DMS se întâlnește în etapa de secvențiere, în care secvențierea următoarei generații citește de obicei între 1/100 și 1/1000 de baze incorect (Ma și colab, 2019). Multe grupuri adoptă o strategie de codare a barei pentru a aborda această problemă, astfel încât o secvență artificială unică cu mai multe baze este asociată cu fiecare variantă. În plus, citirile sub un anumit prag de calitate sunt respinse și variantele care sunt prezente la o rată sub un prag de detecție dat sunt eliminate. Mai multe grupuri oferă atât scorurile complete de fitness, cât și un filtru pentru rezultate de înaltă calitate (Starita și colab, 2015 Mighell și colab, 2018). În aceste cazuri, constatăm că rezultatele filtrate de înaltă calitate au o corelație medie mai mare cu VEP-urile (Tabelele EV12 și EV13), precum și o putere predictivă superioară pentru mutațiile bolii (Fig 3).

Dintre cei 46 de predictori diferiți evaluați în acest studiu, descoperim că un singur program, DeepSequence, iese în evidență în mod clar față de toate celelalte, atât în ​​ceea ce privește performanța, cât și în ceea ce privește metodologia. DeepSequence a arătat cele mai puternice corelații cu datele DMS la oameni și bacterii și a fost cel mai mare predictor de calcul al mutațiilor bolii umane. Majoritatea metodelor de învățare automată utilizează mai multe caracteristici, inclusiv adesea o măsură de conservare a secvenței la locul de interes, și apoi învață tiparele acestor caracteristici care au ca rezultat o mutație clasificată ca dăunătoare sau benignă. DeepSequence folosește modele generative profunde pentru a integra simultan factori din întreaga secvență, mai degrabă decât unul sau câteva site-uri. Acest tip de problemă este în mare măsură intraductibilă pentru învățarea automată tradițională, dat fiind numărul de parametri implicați, însă DeepSequence depășește acest lucru învățând factorii latenți care stau la baza secvenței proteice. Această abordare produce, de asemenea, avantaje în ceea ce privește prejudecățile inerente metodelor supravegheate. Ne putem aștepta ca o metodă de învățare automată confruntată cu un exemplu pe care a fost instruit să o clasifice corect de cele mai multe ori, producând o evaluare nereprezentativă a acurateței sale. DeepSequence folosește alinieri de secvențe multiple și nu vede niciodată date proteice marcate, rezultând scoruri care nu sunt părtinitoare de exemple de instruire. Cu toate acestea, acest lucru nu înseamnă că DeepSequence este o metodă complet imparțială. Scorurile care sunt generate depind în întregime de baza de date din care sunt trase mai multe alinieri de secvență. Dacă anumite secvențe sunt subreprezentate, atunci predicțiile pentru acestea vor fi de calitate mai scăzută, cum ar fi rezultatele pe care le observăm pentru proteinele virale extrase din baza de date UniRef100. Succesul pe care DeepSequence l-a obținut în prezicerea efectelor de mutație pentru proteinele umane arată că modelele profunde generative ar putea fi calea de urmat în acest domeniu, eliminând dependența de seturi de date etichetate pentru a face predicții.

Unul dintre VEP-urile pe care le-am evaluat, Envision, este instruit cu o abordare de învățare supravegheată folosind date DMS, mai degrabă decât variante patogene și benigne etichetate. Această metodă utilizează un număr de aceleași seturi de DMS pe care le-am folosit în această analiză pentru instruire (BRCA1 (a), HSP82, UBI4 (a și b), PAB1 și bla (a)), astfel, clasificarea acestei metode în tabelul EV7 este aproape sigur supus prejudecății de formare. Cu toate acestea, este interesant faptul că, în ciuda acestui avantaj, Envision produce doar performanțe generale moderate pentru seturile de date DMS umane (deși are rangul 1 pentru TPK1). În ceea ce privește prezicerea mutațiilor patogene, Envision funcționează bine pentru BRCA1 clasându-se pe locul 3 în rândul VEP-urilor și P53, clasându-se pe locul 4, dar performanța sa este remarcabilă pentru celelalte proteine. În special, deși Envision nu a fost instruit pe un set de date P53, a fost evaluat folosind unul (deși nu același set de date DMS utilizat în acest studiu). În timp ce abordarea utilizată de Envision este inovatoare, evaluarea performanței sale cu DMS are aceleași avertismente ca evaluarea performanței altor VEP supravegheați folosind baze de date de mutație patogenă.Astfel, este remarcabil faptul că, în ciuda acestui avantaj, Envision a prezentat doar performanțe modeste față de datele DMS.

Majoritatea predictorilor, supravegheați sau nu, sunt supuși optimizării hiperparametrului, un proces de ajustare a variabilelor interne precum rata de învățare, arhitectura rețelei sau regularizarea pentru a obține performanțe mai bune. Acest proces implică în mod invariabil testarea în mod repetat a performanței predictorului cu un anumit set de date „test” și are potențialul de a introduce o altă sursă de prejudecată, chiar și în metodele nesupravegheate. Utilizarea datelor DMS pentru evaluarea acestor metode ar trebui să reducă considerabil impactul acestui efect pentru toate metodele, cu excepția Envision și, eventual, a DeepSequence, care ar fi putut fi optimizate în raport cu datele DMS utilizate în evaluarea inițială. Envision nu funcționează în mod excepțional, indiferent și arătăm că DeepSequence funcționează bine atunci când este evaluat folosind date pe care cu siguranță nu le-a văzut (Tabelul EV9).

Anumite experimente DMS par să arate performanțe remarcabile la identificarea mutațiilor bolii. Este interesant să comparăm performanța cu privire la fenotipurile experimentale utilizate, deoarece utilitatea unui fenotip experimental pentru identificarea mutațiilor patogene ar trebui să fie legată de mecanismul prin care mutațiile provoacă boli. Observăm că acele experimente DMS bazate pe teste de creștere competitivă par să funcționeze deosebit de bine, clasându-se mai presus de toate predictorii de calcul pentru trei dintre cele patru proteine ​​unde sunt disponibile. Pentru BRCA1, unde există seturi de date DMS bazate pe trei fenotipuri experimentale diferite, testul bazat pe rata de creștere (Findlay și colab, 2018) funcționează mult mai bine decât cele bazate pe drojdie de activitate hibridă-două sau E3 ubiquitin ligază (Starita și colab, 2015). Rata de creștere este probabil un fenotip experimental foarte general, care va reflecta orice pierdere de funcție care apare la nivel molecular. În schimb, dacă unele dintre mutațiile BRCA1 patogene au acționat printr-un alt mecanism decât perturbarea interacțiunii sale cu partenerii de legare specifici (BARD1) sau perturbarea activității E3, acest lucru ar putea explica subperformanța datelor DMS pe baza acestor fenotipuri alternative. Interesant este însă că datele HRAS DMS, care sunt, de asemenea, superioare tuturor predictorilor de calcul, se bazează pe o sondă hibridă a interacțiunii sale cu RasGAP (Bandaru și colab, 2017), sugerând că întreruperea acestei interacțiuni reflectă mecanismele moleculare care stau la baza bolii.

PTEN este, de asemenea, demn de remarcat, deoarece are și diferite seturi de date DMS disponibile pe baza unor fenotipuri experimentale diferite. Ecranul pentru setul de date PTEN (b) evaluează întreruperea unui circuit genetic genetic în drojdie, sondând în esență activitatea fosfatazei. Acest set de date este superior tuturor celor cu excepția a patru VEP, sugerând că reflectă în mod rezonabil mecanismele bolii moleculare. În schimb, ecranul fenotipic pentru PTEN (a) măsoară abundența proteinelor în celulă prin fluorescența EGFP legată de proteină (Matreyek și colab, 2018). Această tehnică, numită VAMP-seq, identifică variante instabile termodinamic, cu toate acestea, aceasta poate eșua în a surprinde mecanismele bolii care acționează prin întreruperea interacțiunii și pierderea sau câștigarea funcției care nu au legătură cu destabilizarea. Într-adevăr, s-a observat în acest studiu că variantele dominant-negative nu au fost semnificativ diferite de tipul sălbatic, în concordanță cu observația noastră anterioară că mutațiile dominant-negative tind să fie foarte ușoare la nivel structural al proteinelor (McEntagart și colab, 2016). Astfel, trebuie să se acorde mare atenție atunci când se selectează un fenotip experimental. În absența unui test fenotipic mai bun legat în mod specific de un mecanism de boală cunoscut, experimentele bazate pe creștere pot fi cel mai general mod de a testa pierderea funcției proteinelor și, prin urmare, cel mai util pentru prezicerea bolii.

Rezultatele noastre în analiza capacității predictive a seturilor de date DMS recapitulează în mare măsură rezultatele prezentate în studiile originale. Setul de date CALM1 (Weile și colab, 2017) se raportează că au performanțe superioare de precizie-rechemare decât PolyPhen-2 și PROVEAN, pe care le găsim și (pentru scorurile brute, mai degrabă decât scorurile răsturnate). Setul de date TPK1 (Weile și colab, 2017) au permis separarea completă a alelelor neutre și ale bolii, așa cum au făcut PolyPhen-2 și PROVEAN, dar numai după filtrare suplimentară pentru alelele bolii recesive, pe care nu le-am efectuat. Setul de date BRCA1 (a) (Starita și colab, 2015) este folosit de autori pentru a instrui un model care să prezică salvarea reparării ADN-ului direct omologic, cu toate acestea, predicțiile se fac în principal în afara regiunii de acoperire DMS pe care nu suntem în măsură să o evaluăm. BRCA1 (b) (Findlay și colab, 2018) este raportat de către autori că separă mutațiile patogene și benigne în ClinVar aproape perfect, rezultat pe care îl vedem și în analiza noastră. PTEN (a) (Matreyek și colab, 2018) setul de date este declarat pentru a identifica peste 90% din variantele patogene PTEN, deși nu se dă o rată fals pozitivă, deoarece nici o variantă PTEN nu a fost clasificată oficial ca benignă. Din nou, rezultatele noastre sunt similare, având în vedere AUC de înaltă precizie-rechemare a setului de date PTEN (a), dar ASC ROC considerabil mai scăzută indică o rată semnificativă fals pozitivă. În cele din urmă, autorii PTEN (b) (Mighell și colab, 2018) au folosit o abordare similară cu noi, folosind variante gnomAD pentru a înlocui substituțiile benigne. Rezultatele lor indică faptul că datele lor au o valoare predictivă pozitivă superioară decât PROVEAN, SIFT și PolyPhen-2, pe care le găsim și noi.

Cele două cele mai frecvent utilizate VEP sunt probabil PolyPhen-2 și SIFT, ambele fiind încă foarte utilizate pe scară largă în prioritizarea variantelor. Niciunul dintre aceștia nu a prezentat performanțe excepționale în acest studiu, clasându-se pe locul 14 și 25 față de datele DMS umane (deși SIFT4G, o implementare bazată pe conservarea genomică a algoritmului SIFT (Vaser și colab, 2016) clasat pe locul 9). Prin urmare, recomandăm alte VEP-uri pe baza analizelor noastre. Din păcate, DeepSequence este foarte intens din punct de vedere al calculului și ar putea fi destul de dificil să ruleze un utilizator final tipic. De asemenea, nu are praguri de boală definite, acestea ar trebui să fie evaluate pe bază de proteină cu proteină, probabil prin analiza variantelor putativ benigne (de exemplu, gnomAD). Prin urmare, subliniem SNAP2, DEOGEN2, SNPs & GO și SuSPect, care, de asemenea, au avut tendința de a funcționa bine împotriva seturilor de date DMS și au interfețe web ușor de utilizat. Vă recomandăm în continuare REVEL - deși nu are o interfață web, a fost precalculat pentru toți cromozomii umani și este disponibil online pentru descărcare. Sugerăm că aceste metode ar face alegeri bune pentru prioritizarea variantelor de rutină. Important, însă, toți au arătat variații mari în performanța lor între diferite proteine, sugerând că nu ar trebui să se bazeze încă prea mult pe rezultatele unui singur predictor.

În timp ce conservarea evoluției este larg acceptată ca fiind cea mai predictivă caracteristică utilizată în predicția efectelor variante, unele VEP integrează și caracteristici derivate din structuri proteice determinate experimental (PolyPhen-2, S3D-PROF, SNP & GOs3D, DEOGEN2 și MPC). Este interesant faptul că includerea modelelor structurale proteice nu pare să fie deosebit de utilă pentru VEP-uri. În principiu, deoarece mecanismele bolii pot fi adesea explicate prin efecte structurale ale proteinelor (Steward și colab, 2003) s-ar putea aștepta ca structura proteinelor să fie utilă. S-ar putea ca valoarea informațiilor evolutive să reducă pur și simplu orice contribuție din includerea structurii, adică dacă o mutație dăunează la nivel structural, acest lucru se va reflecta probabil în conservarea evolutivă a acelui reziduu. Mai mult, multe mutații patogene nu sunt foarte dăunătoare la nivel structural al proteinelor, de exemplu cele asociate cu un efect dominant-negativ în complexele proteice (Bergendahl și colab, 2019) sau cele care afectează specificitatea legării factorului de transcripție (Williamson și colab, 2019). Este posibil ca viitoarele strategii care iau în considerare diversele mecanisme moleculare care stau la baza bolii genetice umane și proprietățile structurale unice ale proteinelor individuale vor putea folosi mai bine cantitatea uriașă de date structurale proteice disponibile acum.

Valoarea datelor DMS pentru identificarea directă a mutațiilor patogene este deosebit de interesantă, pe baza rezultatelor pe care le-am observat aici. Având în vedere alegerea corectă a fenotipului experimental, experimentele DMS sunt probabil mai bune decât (sau cel puțin competitiv cu) cei mai buni VEP de calcul. Aplicabilitatea datelor DMS pentru prioritizarea variantelor directe este limitată în prezent de fracțiunea mică de reziduuri de proteine ​​umane pentru care s-au efectuat experimente DMS. În următorii ani, pe măsură ce se studiază mai multe proteine ​​și se îmbunătățesc strategiile experimentale, ne așteptăm ca utilizarea acestor date pentru identificarea variantelor dăunătoare să devină de rutină.


Ce a vrut să spună Erwin? Fizica informației de la genomica materialelor cristalelor aperiodice și a apei la catalizatori de informații moleculare și viață

Erwin Schrödinger a atribuit în mod celebru și prevăzător vehiculul care transmite informațiile ereditare care stau la baza vieții către un „cristal aperiodic”. Comparăm și contrastăm acest lucru, descoperit abia mai târziu a fi stocat în ADN-ul biomoleculei liniare, cu materialele cvasi-unidimensionale stratificate cu informații, investigate de câmpul emergent al cristalografie haotică. În ciuda diferențelor de funcționalitate, aceleași informații măsoară structura de captare și noutatea în ambele, sugerând o coerență intimă între caracterul informațional al materiei biotice și abiotice - o fizică a informației aplicabilă pe scară largă. Revizuim solidele stratificate și luăm în considerare trei exemple ale modului în care tehnicile teoretice ale informației și calculelor sunt aplicate pentru a înțelege structura lor. În special, (i) revizuim eforturile recente de a aplica noi tipuri de măsuri de informare pentru a cuantifica cristalele dezordonate (ii) discutăm structura gheții I în termeni teoretici ai informației și (iii) relatăm investigațiile recente asupra structurii tris ( biciclo [2.1.1] hexeno) benzen, arătând modul în care o analiză teoretică a informației oferă o perspectivă suplimentară asupra structurii sale. Apoi ilustrăm o nouă a doua lege a termodinamicii care descrie procesarea informațiilor în materiale active cu dimensiuni reduse, revizuind Demonul lui Maxwell și o nouă clasă de dispozitive moleculare care acționează ca catalizatori ai informației. În cele din urmă, concluzionăm prin specularea asupra modului în care aceste idei din știința materialelor informaționale pot avea impact asupra biologiei.

1. Introducere

Pentru a ține cont de „proprietățile speciale” ale vieții - de ex. mișcare, metabolism, reproducere, dezvoltare - înțelepciunea dominantă din timpul lui Aristotel până în secolul al XIX-lea a fost că materia organică diferea într-un mod fundamental de materia anorganică. În timp ce această noțiune, numită vitalism, poate părea ciudat pentru oamenii de știință din secolul al XXI-lea, a rămas influențat până când chimistul Friedrich Wöhler a arătat că, în mod neașteptat, un compus organic cunoscut, ureea, ar putea fi sintetizat artificial din acid cianic și amoniac [1]. Acest proces de fabricație, deși diferit de cel utilizat în sistemele biologice, a servit totuși ca un indiciu important că diviziunea dintre materia vie și cea vie nu era absolută. Procesele abiotice ar putea face substanțe până acum întâlnite doar în materiale derivate biologic. În plus, vedem că - și nu pentru ultima dată - rezultatele obținute de la o disciplină, chimia, au avut consecințe importante în alta, biologia. Această confluență a diverselor căi de cercetare care se unesc într-o imagine conceptuală din ce în ce mai largă a Naturii este, desigur, o temă des repetată în științe. Alte exemple celebre includ descoperirea lui Newton că mișcarea corpurilor cerești, cum ar fi luna și planetele, și a celor terestre sub influența gravitației, cum ar fi mărul proverbial, sunt ambele manifestări ale unei legi universale a atracției gravitaționale James Clerk Maxwell unificarea electricității și magnetismului în faimoasele sale ecuații și demonstrația lui James Prescott Joule că caloricul nu era altceva decât energie cu un alt nume, formalizat acum în Prima Lege a Termodinamicii. Într-adevăr, E. O. Wilson ia poziția extremă că toate cunoașterea umană, de la cea mai concretă dintre științe la cea mai puțin precisă dintre artele liberale, este în cele din urmă interconectată [2].

Nu trebuie să mergem atât de departe ca Wilson. Este suficient pentru scopurile noastre să ne dăm seama că, în timp ce științele „abiotice” precum fizica, chimia, astronomia și geologia împărtășesc interconectări puternice evidente, biologia a rămas relativ departe. Aceasta nu înseamnă că biologia nu a beneficiat foarte mult de cunoștințele care i-au fost transferate din alte științe fizice. În plus față de exemplul de uree de mai sus, rețineți că metabolismul este esențial o chestiune de utilizare și transformare a energiei - o noțiune concretă și operațională în fizică. Și, de asemenea, biologia a beneficiat enorm de tehnicile și descoperirile făcute în alte științe. Într-adevăr, în 1937 Max Delbrück (Premiul Nobel pentru fiziologie sau medicină 1969) și-a adaptat pregătirea în astrofizică și fizică teoretică pentru a testa susceptibilitatea genelor la mutații, stimulând interesul fizicienilor pentru biologie și stabilind biologia moleculară. Mai familiar, însă, a fost infamata imagine de difracție cu raze X, cunoscută sub numele de „fotografia 51” din laboratorul Rosalind Franklin, care a oferit o perspectivă cheie pe principalul genetician James Watson și fizicianul Francis Crick (Premiul Nobel pentru fiziologie sau medicină 1962), care a propus dubla structură elicoidală a ADN-ului [3]. În ciuda celor de mai sus, biologia este în mod clar cea mai puțin bine integrată în familia științelor. Putem specula că complexitatea vieții și fenomenele noi pe care le afișează sunt cel puțin parțial responsabile pentru acest lucru. Chiar și unul dintre cele mai elementare organisme, Mycoplasma genitalium, are un genom de „numai” 580 070 perechi de baze [4]. Biologia este complicată.

Și probabil datorită acestei complicații, „științele” matematice 1 au avut cel mai mic impact în biologia teoretică. În general, tehnicile matematice avansate care saturează orice text teoretic de fizică nu găsesc niciun echivalent în textele de biologie. Cu toate acestea, există un domeniu în care, probabil, biologia a depășit științele sale surori: încorporarea teoria informației [5,6] în descrierea sistemelor fizice. Și vom sugera că biologia a sculptat o cale conceptuală pe care științele fizice abiotice ar face bine să o imite. Înainte de a merge prea mult înainte, totuși, să începem la începutul secolului al XX-lea și să vizităm unul dintre numeroasele progrese revoluționare care au introdus epoca fizicii „moderne” și care rămâne astăzi o sondă cheie a structurii biologice moleculare.

2. Structură, cristale aperiodice și informații

Imensele progrese conceptuale în fizică realizate în prima treime a secolului al XX-lea sunt legiune, dar aici ne concentrăm asupra contribuțiilor la structura materiei. În timp ce Max von Laue (Premiul Nobel pentru fizică 1914) este creditat cu descoperirea difracției razelor X de către cristale, este echipa tatălui și fiului, Sir William Henry Bragg și William Lawrence Bragg (Premiul Nobel pentru fizică) 1915), care primesc o mare parte din credit pentru exploatarea acestuia ca instrument de determinare a structurii cristaline. Pentru o repetare periodică a unor tipare, așa cum s-ar putea găsi în cristalele simple precum NaCl, tiparul de difracție este dominat de reflexii foarte puternice la unghiuri particulare, numite Reflecții Bragg. Se știe că împrăștierea difuză mult mai slabă apare între reflexele Bragg și a fost observată încă din 1912 de Walter Friedrich. În timp ce această împrăștiere difuză poate fi explicată prin mișcarea termică a atomilor constituenți, aceasta ar putea fi cu adevărat un vestitor al abaterilor de la ordinea periodică perfectă. Dar presupunerea periodicității simplifică foarte mult analiza tiparelor de difracție, iar primii ani de cristalografie au fost marcați cu un succes enorm în rezolvarea structurilor periodice care păreau atât de comune. Într-adevăr, se poate susține că acest program de cercetare, care a avut atât de mult succes în descrierea unui anumit tip de structură - structura periodică, „repetarea infinită în spațiu a unităților structurale identice” - a venit cu prețul dezvoltării instrumentelor teoretice alternative.

În ceea ce privește biologia, cunoscând rezultatele Delbrück privind mutațiile, fizicianul proeminent Erwin Schrödinger (Premiul Nobel pentru fizică 1933) era ocupat să considere viața din punct de vedere fizic. În cartea sa clasică din 1944, Ce este viața? [7], Schrödinger introduce două concepte care ne interesează aici. Primul este negentropie, sau entropia pe care un organism o exportă în împrejurimile sale pentru a-și menține entropia internă scăzută. Dacă cineva consideră entropia ca o măsură a tulburării, atunci a doua lege a termodinamicii arată clar că, pentru ca un organism să mențină o anumită structură, trebuie să scape de tulburarea care însoțește procesele de menținere a vieții. Al doilea și la fel de important este ideea că mecanismul ereditar care trebuie să existe pentru ca trăsăturile indivizilor să poată fi transmise descendenților ar putea fi adăpostit în ceea ce el a numit un cristal aperiodic. Deși H. L. Müller a făcut o propunere similară cu peste 20 de ani înainte, pledoaria lui Schrödinger a captat imaginația lui Crick și Watson pentru a investiga serios această posibilitate. Cristalul aperiodic al lui Schrödinger era un substrat material, poate o moleculă, care nu avea o periodicitate strictă. Motivul pentru aceasta este că repetarea exactă a unui motiv, cu alte cuvinte un cristal, este informație slabă - prea slabă pentru a purta ereditatea. Fără o anumită imprevizibilitate sau noutate, nu se învață și nu se comunică nimic nou. Este remarcabil faptul că Schrödinger a făcut această predicție înainte de a se articula o înțelegere cantitativă a informațiilor.

În 1947, trei fizicieni de la Bell Telephone Laboratories, John Bardeen, Walter Brattain și William Shockley (Premiul Nobel pentru fizică 1956), au inventat un mic dispozitiv care a revoluționat proiectarea circuitelor electrice: tranzistorul, care a introdus era electronică.Semnificația sa a fost imediat recunoscută și un comunicat de presă a fost emis în mod corespunzător în anul următor. Cu toate acestea, probabil [8], acesta a fost doar al doilea cel mai important anunț care a ieșit din Laboratoarele Bell în 1948. Primul a venit de la un matematician, inginer și criptograf în vârstă de 32 de ani, Claude E. Shannon, 2 sub forma unei lucrări în Jurnalul tehnic al sistemului Bell cu titlul modest de „O teorie matematică a comunicării” [5].

Principala premisă a lui Shannon este că informația este un grad de surpriză. Dat fiind un sursa de informatieX—Un set de mesaje <X> care apar cu probabilități - un mesaj individual autoinformare este . Astfel, evenimentele predictibile () nu sunt informative - H (X) = 0 - deoarece nu sunt surprinzătoare. Evenimentele imprevizibile, cum ar fi întoarcerea unei monede corecte, sunt extrem de informative:. Când se utilizează logaritmi baza 2, unitatea de informații este pic sau cifră binară. Primul rezultat major al lui Shannon a fost acela de a arăta că informația de sine medie, ceea ce el a numit entropie paralel cu Boltzmann și Gibbs în vocabular și notație, măsoară cât de comprimabile sunt mesajele unei surse. Cu toate acestea, cuantificarea informațiilor a fost pur și simplu preliminară motivației principale a lui Shannon. Lucrând pentru Bell Telephone Company, o întreprindere de comunicații, principalul său obiectiv a fost de a stabili constrângeri operaționale pentru comunicarea informațiilor prin intermediul echipamentelor de transmisie zgomotoase, predispuse la erori, pe care le-a formalizat ca canal de comunicare. Rezultatul a fost cel mai faimos și mai amplu rezultat al său: atâta timp cât entropia sursă este mai mică decât capacitatea de transmisie a canalului - atunci, chiar dacă sunt introduse erori, există o modalitate de a codifica mesajele sursă astfel încât receptorul care observă ieșirea canalului zgomotos poate exact reconstituie mesajele originale. Acest rezultat unic este esențial pentru aproape toate tehnologiile de comunicare care conduc economiile moderne actuale.

Shannon însuși a fost destul de atent să-și distanțeze teoria cantitativă cu privire la cantitatea de informații dintr-o sursă de discuțiile despre semnificația informației sau conținutul semantic al acestor informații [9]. Obiectivul său a fost rezultatul operațional care tocmai a fost relatat, ceea ce nu a necesitat să știe ce informații au fost comunicate. Cu toate acestea, așa cum vom explica, măsura informației și semantica sa se dovedesc a oferi un instrument central și cantitativ pentru înțelegerea organizării materialelor care sunt mai mult decât cristale periodice - materiale care nu sunt repetări regulate ale celulelor unitare identice. Numim această aplicație a teoriei informației lui Shannon la structura materială „cristalografie haotică”, din motive care vor deveni evidente.

Ce fel de materiale nu sunt cristale? O clasă evidentă este aceea în care atomii de tip aleatoriu sunt așezați aleator în spațiu. Dicotomia rezultată - materialele sunt fie periodice, fie aleatorii - este o viziune prea simplă. Există un spectru. Un prim exemplu, unul controversat la vremea sa, a venit în descoperirea cvasicristalelor [10]: metale cu ordinea orientativă pe distanțe lungi, o fază icosaedrică, dar fără simetrie translațională. Acest lucru a căzut atât de departe în afara dihotomiei periodice-aleatorii încât a fost la câțiva ani după detectarea experimentală că cvasicristalele au fost larg acceptate (Premiul Nobel pentru chimie 2011). 3

Având în vedere acest spectru larg, este nevoie de instrumente care să descrie cu ușurință procesele care variază de la periodicitate la aleatorie și să capteze structurile intermediare semi-ordonate, semi-dezordonate. Teoria informației este unul dintre aceste instrumente. Vom descrie cum se aplică structurii materiale, formând efortul cristalografiei haotice. O perspectivă convingătoare este că, deși începem cu un accent doar pe surpriză și predicție, suntem conduși la noțiuni noi de structură, simetrii parțiale și stocare a informațiilor.

3. De la măsuri de informare la structură

Deși fundamentală pentru practica științei, o înțelegere aprofundată a informațiilor obținute din măsurători individuale a fost examinată în detaliu doar recent [15,16]. Problemele cheie la îndemână sunt ușor de enunțat: având în vedere o istorie a unor astfel de măsurători, cât de mult se învață dintr-o observație anume? Cât din trecut este util pentru prezicerea rezultatelor măsurătorilor viitoare? În ce măsură o măsurare este pur și simplu aleatorie și nu structură? Câte informații obținute în prezent sunt transmise către viitor? Poate nu în mod surprinzător, luând în considerare aceste întrebări în lumina teoriei informației [6] a relevat o serie de noi măsuri computaționale și informaționale care oferă informații importante despre modul în care corelațiile se manifestă în diferite tipuri de structuri.

După cum sa menționat mai sus, calul de lucru al teoriei informației este Entropia Shannon [5] a unei variabile aleatorii X: , unde X sunt realizările posibile ale variabilei discrete X și este probabilitatea de a observa X. În timp ce entropia Shannon are multe interpretări, cea mai utilă aici este că este cantitatea medie de informații pe care o observație o dezvăluie atunci când se măsoară acea variabilă. Măsurătorile reale sunt adesea secvențiale în timp și s-ar putea aștepta să existe corelații între măsurători. Extinderea entropiei Shannon la o serie de măsurători urmează în mod natural prin înlocuirea variabilei aleatoare unice X cu secvența X1,X2,…XL a variabilelor aleatorii - adesea scrise X L —Și realizarea unei singure măsurători X prin seria de măsurători X1,X2,…XL, acesta din urmă a fost notat în mod convenabil X L . Astfel, luând în considerare trecuturi succesive mai lungi -X−1, atunci X−2X−1și așa mai departe - se poate cuantifica cât de puțin măsură de măsurare este incertă X0 este. Sau, afirmat diferit, putem cuantifica cât de multă cunoaștere a trecutului reduce informațiile învățate în prezent: H [X0] ≥H [X0 | X−1] ≥H [X0 | X−1,X−2] ≥ ⋯, unde am introdus entropia condițională Shannon H [X | ⋅]. De asemenea, este util să se ia în considerare rata de entropie hμ, informația învățată în medie pe observație, după ce a văzut un trecut infinit: hμ= H [X0 | …X−3X−2X−1].

Întrucât teoria informației a fost inițial dezvoltată în contextul comunicării, imaginat ca o progresie temporală a simbolurilor, o noțiune naturală a trecutului, prezentului și viitorului a pătruns în teorie. Funcționarea sub această prejudecată a introdus o săgeată preferată a timpului. În consecință, utilitatea condiționării actual măsurători sau simboluri observate pe viitor observațiile nu erau evidente. Din punct de vedere matematic, desigur, nu există nici un impediment inerent pentru a face acest lucru. Cu toate acestea, înlocuirea unei serii temporale cu una spațială ridică prejudecata direcțională, deschizând o cale de identificare a altor măsuri de informații care tratează trecutul și viitorul pe picior de egalitate [15,17-20].

De exemplu, luați în considerare o singură măsurare a variabilei aleatorii X. Cantitatea maximă teoretică de informații pe care o putem învăța este doar H [X] (figura 1A). Cu toate acestea, dacă există corelații sau regularități în date, unele dintre acestea ar fi putut fi anticipate din observațiile anterioare. Să numim această parte rata de redundanțăρμ= Eu [X0:…X−3X−2X−1] - cel comun sau informații reciproce între prezent X0 și trecutul ...X−3X−2X−1. Cealaltă parte a informației nu a putut fi anticipată, este cu adevărat aleatorie și este justă hμ. Astfel, cantitatea de informații H [X0] disponibil într-o singură măsurare X0 se descompune în mod natural în aceste două părți, așa cum se arată în figura 1b.

Figura 1. Disecarea informațiilor H [X] învățat dintr-o măsurare a unei singure variabile aleatorii X. (Adaptat de la James și colab. [15], cu permisiunea.) (Versiune online color.)

Cu toate acestea, condiționarea suplimentară produce o descompunere suplimentară a fiecăruia dintre acestea. În primul rând, porțiunea aleatorie hμ se împarte în două părți: rata de informații efemererμ si rata de informații legatăbμ. Rata de informații efemere rμ= H [X0 | …X−3X−2X−1,X1X2X3…] Este informația care există doar în prezent. Nu este previzibil din trecut și nici nu este comunicat viitorului. Existând doar în prezent, este efemer. Rata de informații legată bμ= Eu [X0:X1X2X3… | …X−3X−2X−1] este informația partajată între prezent și viitor, dar nu este în trecut. Ca atare, măsoară rata la care informațiile generate spontan (hμ) este stocat activ de un sistem. În al doilea rând, rata de redundanță se împarte și în două părți, prima fiind din nou bμ și a doua parte numită rata de informații enigmaticăqμ. Acesta din urmă este o informație reciprocă pe trei căi [...X−3X−2X−1:X0:X1X2X3…] Împărtășit între trecut, prezent și viitor.

„Descompunerea” netă a informațiilor H [X0] într-o singură măsurare este ilustrată în figura 1c. Aceasta este doar o mostră a modalităților posibile prin care informațiile pot fi partiționate semantic între trecut, prezent și viitor. figura 1d, de exemplu, este o descompunere în disipat rμ și informații utile wμ. Mai mult, alte măsuri suplimentare, discutate de James și colab. [15,16,21], au fost definite și explorate. Important, acum toate pot fi calculate analitic dintr-un proces ϵ-mașină [22,23], odată ce aceasta este în mână.

4. Cristalografia haotică

Înarmat cu acest nou arsenal de măsuri de informare structurală, este prezentată o imagine detaliată și cantitativă a modului în care informațiile sunt împărțite între trecut, prezent și viitor. Având în vedere acestea, calcul intrinsec este definit ca modul în care sistemele stochează, organizează și transformă informațiile istorice și spațiale [24,25]. Diferite procese pot avea cantitativ și calitativ diferite tipuri de calcul intrinsec, iar înțelegerea acestor diferențe oferă o perspectivă asupra modului în care este structurat un sistem [26].

Cristalografie haotică (ChC) [23,27-33] 4 este atunci aplicarea acestor metode teoretice de informare și calcul pentru a descoperi și caracteriza structura în materiale. Reinterpretează axa timpului, utilizată mai sus din motive pedagogice, pentru o coordonată spațială unidimensională de-a lungul unei direcții într-un material. Alegerea numelui se dorește a fi evocativă: păstrăm termenul „cristalografie” pentru a sublinia continuitatea cu obiectivele trecute de înțelegere a structurii materiale și introducem termenul „haotic” pentru a asocia această nouă abordare cu noțiunile de tulburare, complexitate și procesare a informațiilor . Folosind cristalografia haotică, putem descrie modalitățile prin care această descompunere a informațiilor captează cantitativ structura cristalină - distingând structura care ar putea fi de așteptat, adică structura periodică repetitivă, de acea structură ne așteptată, adică structura de defectare. Materialele care sunt descrise în mod util și în mod util în acest cadru sunt numite cristale haotice.

Evident, studiul tulburării în sistemele de materie condensată este departe de a fi nou, dar prea des a fost umbrit de cristalografia materialelor ordonate periodic, numită cristalografie clasică [35-37]. Mackay a susținut îndelung și persistent ca sfera cristalografiei să fie extinsă pentru a include organizarea pe multe scale de lungime, precum și pentru a include forme de organizare care nu sunt neapărat periodice. Într-o serie de articole de peste 40 de ani [12,36-42], Mackay a promovat ideea că cristalografia este - sau cel puțin ar trebui să fie - o știință generală a structurii. 5 Suntem de acord. Acest program de cercetare, dublat cristalografie generalizată, susține o mare parte din spațiul conceptual, incluzând organizarea ierarhică, simetria pentagonală, automatele celulare, cristale aperiodice, periodicități incomensurabile, ochelari, cristale lichide liotrope, mezofaze și cristale finite - pentru a numi doar câteva [36]. De asemenea, sunt incluse concepte din teoria informației și calcul. Atunci când selectăm denumirea de „cristalografie haotică”, atunci ne diferențiem eforturile de acest program mai difuz pentru a ne concentra în mod strâns asupra modului în care informațiile și calculul elucidează structura și organizarea materialelor.

Ar trebui să observăm că cristalografia haotică nu este singura sau chiar prima încercare de a încorpora ideile teoretice ale informației și calculului în cristalografie. Unele eforturi din anii 1980 s-au concentrat pe utilizarea teoriei informației ca instrument pentru rezolvarea „problemei de fază” [43-45]. Mai recent, Lalik [46] a folosit teoria informației ca metrică pentru a măsura gradul de distorsiune în poliedrele de coordonare din cristale, calculând „diferența în conținutul informației Shannon între distribuțiile uniforme și neuniforme ale ordinelor de legătură din poliedre”. Estevez-Rams & amp González-Férez [47] au aplicat complexitatea algoritmică sau Kolmogorov – Chaitin sarcinii de cuantificare a structurii cristaline atât pentru exemplarele ordonate, cât și pentru cele dezordonate, precum și cvasicristale. Ei au contribuit la discuția în curs de desfășurare a definiției unui cristal, sugerând că noțiunile teoretice ale informației și calculelor oferă o perspectivă asupra structurii materiei. Deși cu siguranță are un interes conceptual, din păcate, complexitatea Kolmogorov-Chaitin este, în general, incalculabilă, făcând această abordare de utilizare practică limitată. Krivovichev [48,49] a calculat complexitățile topologice ale structurilor cristaline ca măsuri bazate pe informații Shannon pe graficul coeficientului aferent. El a studiat în plus cele 2000 de structuri cele mai complexe din baza de date a structurii cristaline anorganice pentru a determina care structură anorganică este cea mai complexă [50]. 6 Acest program de cercetare pare, cel puțin în acest moment, să fie în mare parte, dacă nu exclusiv limitat la structuri pur cristaline.

Din câte știm, termenul „cristal haotic” a fost folosit în două contexte anterioare. În 1991, Leuschner [51] a introdus mai multe modele de structură pentru cristale unidimensionale, capabile să producă un comportament complet periodic, cvasi-periodic și haotic. Acesta din urmă a fost realizat folosind Harta Logistică [24] ca generator de incertitudine în secvența de stivuire - folosind-o efectiv ca generator de numere aleatorii. Mai târziu, Le Berre și colab. [52], în contextul formării de tipare a stării staționare a sistemelor bidimensionale, a definit un cristal haotic ca fiind „orice structură fără ordine pe distanțe lungi, dar omogenă din punct de vedere statistic din punct de vedere statistic”. Utilizarea termenului nostru este atât mai puțin restrictivă, pentru a ține cont de ordinea pe termen lung, cât și mai generală, pentru a permite o gamă largă de tipuri de tulburări. Ar trebui să apară faptul că cristalul haotic pe care îl descriem aici este doar genul de cristal pe care Schrödinger și-l imagina ca purtător al eredității. În timp ce el l-a numit cristal aperiodic, acest termen a fost uzurpat pentru a descrie un tip foarte special de abatere de la periodicitate, genul care se găsește pentru a păstra vârfuri ascuțite în modelul de difracție [53]. Astfel, folosim termenul de cristal haotic pentru a indica o noțiune mai largă de necristalinitate, una care cuprinde structuri cu o densitate de entropie diferită de zero, așa cum este necesar pentru orice structură, cum ar fi ADN-ul, pentru a găzdui informații. 7

(a) Informatică materială a defecțiunilor și defectelor

Deoarece cristalografia clasică se concentrează în mare măsură pe structuri periodice, întâmpină dificultăți în clasificarea structurilor care nu se potrivesc acestei paradigme. Cele mai multe eforturi s-au concentrat pe descrierea modului în care un cristal, care probabil ar fi putut fi perfect ordonat, nu atinge acest ideal. De exemplu, în structurile strânse, Frank [55] distinge două tipuri de defecte de strat: intrinsec și extrinsecă. Pentru defecte intrinseci, fiecare strat din material poate fi considerat ca aparținând uneia dintre cele două structuri cristaline: fie cel din stânga defectului, fie cel din dreapta. Este ca și cum două cristale perfecte, nedefectate, sunt lipite împreună, iar interfața dintre ele este vina. Prin contrast, se poate întâmpla ca un anumit strat să nu poată fi considerat ca o extensie naturală a structurii cristaline de pe ambele părți ale defectului. Acestea sunt defecte extrinseci. O altă schemă de clasificare își are originea în mecanismul care a produs defectul. În structurile strânse, sunt defecte întâlnite frecvent defecte de creștere—Adică cele care apar în timpul procesului de creștere a cristalelor defecte de deformare—Care sunt adesea asociate cu unele stresuri mecanice post-formare la cristal și defectele de deplasare a stratului—Care poate apărea prin difuzie între straturile adiacente. Deoarece fiecare dintre ele este definită în raport cu structura sa cristalină mamă, fiecare tip de structură cristalină are de obicei propria sa morfologie distinctivă pentru fiecare tip de defecțiune.

Rezultatul este o menajerie confuză de secvențe de stivuire care se abat de la normal. Această colecție poate să nu fie exhaustivă, în funcție de cât de mare este considerat un cartier și nici secvențe particulare nu pot fi atribuite fără ambiguitate unui anumit tip de structură de defecțiune. Într-adevăr, în cazul în care există mai multe tipuri de defecte sau mecanisme multiple de producere a defecțiunilor, o încercare de analiză a structurii defectului poate fi nedeterminată [27]. Defecțiunile pot fi, de asemenea, clasificate în funcție de modul în care defecțiunile sunt legate spațial între ele. Absența corelației între defecte implică erori aleatorii. Alternativ, prezența unei defecțiuni poate influența probabilitatea de a găsi o altă defecțiune în apropiere. Acest ultim fenomen se numește Nu la nimereală este defect și nu este neobișnuit la exemplarele puternic defectate. În cele din urmă, în unele materiale, defectele par a fi interjecționate în mod regulat în specimen, iar acest lucru este denumit erori periodice. Se consideră că luxațiile șuruburilor sunt o cauză comună a acestor ultime defecte [56].

Aceste categorizări fenomenologice, deși sunt deseori utile și sensibile, în special pentru cristalele slab defecte, nu sunt lipsite de dificultăți. În primul rând, este clar că fiecare se bazează pe presupunerea că starea nativă sau ideală a specimenului trebuie să fie o structură periodică. Această părtinire, poate nu intenționată, retrogradează stivuirea non-periodică la o statură mai mică, așa cum este evident în utilizarea termenului „vina”. Poate fi mai degrabă că tulburarea este starea naturală a specimenului [57], caz în care utilizarea unui cadru care încorporează această caracteristică a materiei în avans se va dovedi mai satisfăcătoare.De fapt, nici măcar nu este clar că ordinea periodică ar trebui să fie starea fundamentală pentru multe tipuri de materiale, chiar și pentru cele cu interacțiuni cu interval finit și în absența reglării fine a parametrilor de cuplare energetică între straturi [58], așa cum este găsit în modelele axiale ale celui mai apropiat vecin Ising (ANNNI) [59]. În al doilea rând, o analiză a structurii de stivuire bazată pe aceste categorii poate să nu fie neechivocă, mai ales în cazul defectelor grele. În al treilea rând, această vizualizare este valabilă doar în limita existenței unui cristal părinte, adică se aplică numai în limita slabă de defectare.

Coerența poate fi adusă acestei imagini complicate a structurii materiale prin utilizarea teoriei informației [33]. O viziune complementară poate fi postulată întrebând cum informațiile sunt partajate și distribuite într-un cristal, iar un candidat natural pentru acest tip de analiză este de a utiliza măsurile de informare de mai sus. Deși expoziția anterioară a folosit un vocabular temporal al trecutului, prezentului și viitorului, nu există nicio schimbare matematică a teoriei dacă adoptăm în schimb punctul de vedere că secvențele observate sunt configurații spațiale. Adică, există măsurători care sunt la stânga măsurării actuale, măsurarea actuală în sine și acele măsurători la dreapta măsurării curente. Pentru materialele cvasi-unidimensionale, presupunem fiecare măsurare ca orientarea unui strat. Această vedere a unei secvențe de orientări ale stratului se traduce printr-un diagramă de informații sau Eu-diagramă, așa cum se arată în figura 2. Acolo, vedem cum informațiile sunt împărțite între diferitele jumătăți ale specimenului și stratul curent. Măsurile de informare date în termeni de informații reciproce pot fi interpretate ca corelații de straturi în cadrul specimenului. Important, deși, în mod obișnuit, se face o medie a acestora peste cristal, este posibil să nu se realizeze media respectivă, ci să se examineze strat cu strat. După cum se arată în James și colab. [16], măsurile teoretice ale informației pot fi destul de sensibile la modificările parametrilor sistemului și ne așteptăm să ofere un barometru care să cuantifice aspecte importante ale structurii materialului.

Figura 2. Diagrama informațională care prezintă anatomia informațională a lui H [X0] în contextul stivuirii spațiale complete a straturilor într-un cristal haotic. Lăsa X0 fie stratul de interes, X:0=…X−2X−1 să fie o secțiune arbitrară lungă, dar finită a specimenului din stânga X0, și X1:=X1X2… În mod similar să fie o secțiune arbitrară lungă, dar finită a specimenului din dreapta X0. Informațiile din stânga X:0 partiții H [X0] în două bucăți: hμ și ρμ. Informațiile din dreapta X1: apoi le partiționează în rμ, Două bμs și qμ. (Reamintim figura 1 care a descompus doar H [X0].) Aceasta lasă o componentă σμ, informații evazive, care este partajat de stânga și dreapta, dar nu se află în stratul actual. Când este pozitiv, indică faptul că nu toată corelația dintre jumătatea configurației stânga și dreapta este conținută local și deci există mecanisme interne ascunse care poartă corelația [21]. (Adaptat de la James și colab. [15], cu permisiunea.) (Versiune online color.)

De exemplu, se știe că calculele structurii electronice care rezultă din potențiale unidimensionale depind de corelații perechi [60,61], spectrul de probabilitate de transmisie al unui electron prin astfel de potențiale fiind adesea guvernat de lungimea corelației. Cantitățile teoretice ale informației, cu viziunea lor mai nuanțată a lungimilor corelației în ceea ce privește informațiile condiționale și reciproce, oferă o imagine mai detaliată a rolului tulburării în structura electronică. Una dintre măsurile mai simple și mai comune ale corelației globale este informația reciprocă între cele două jumătăți ale unui specimen: exces de entropieE= Eu [...X−3X−2X−1:X0X1X2…]. Inspecția diagramei informaționale relevă descompunerea acesteia în atomi de informație: E=bμ+qμ+σμ.

În plus, nu numai că structura globală este importantă, ci și defectele locale pot introduce abateri locale de la structura medie, așa cum se vede în localizarea Anderson [61]. Acesta este un domeniu actual de interes pentru cercetare [62]. În mod similar, regiunile de surplus de încărcare sau epuizare pot afecta alte proprietăți, cum ar fi transmiterea luminii. Zona fotonicii dezordonate încearcă să înțeleagă și să exploateze astfel de structuri pentru noile tehnologii [63].

Astfel, se pot pune o serie de întrebări cu privire la distribuția informațiilor în cristal, așa cum este dezvăluit în structura sa. De exemplu, câtă informație se obține din măsurarea curentă? Acest lucru este împărțit cu vecinii săi sau este localizat? Luând în considerare întrebări precum acestea, se ajunge la o nouă clasificare a structurii dezordonate din cristale.

(b) Cristale haotice: structură în tulburare

Rezultatul net este o teorie consecventă, cantitativă și predictivă a structurii în materiale dezordonate, care se extinde dincolo de defecțiuni și tulburări slabe și care se aplică întregului spectru al structurii materialului, de la cristalul periodic ideal la materialele amorfă și amestecurile complexe pe distanțe lungi între ele. După cum remarcă Ball [64], pe scurt, avem o nouă viziune a ceea ce sunt și pot fi cristalele. Varn & amp Crutchfield [33] revizuiește cum funcționează în detaliu.

Să ilustrăm modul în care cristalografia haotică se aplică materialelor din lumea reală - structurile strânse de gheață și o moleculă complexă folosită pentru a testa chimia aromaticității benzenului. Apoi, combinând aceste rezultate cu analize cristalografice haotice anterioare ale sulfurii de zinc (ZnS), demonstrăm cum apare o viziune unificată a organizării în materiale.

(i) Tulburarea stratului în gheață I

Deși adesea considerat ca fiind doar mijlocul vieții - deși unul esențial 8 - a existat o creștere a aprecierii rolului activ pe care îl joacă apa în procesele biologice. Ca exemplu, Ball [65,66] citează interacțiunea generică a două proteine. Dacă ambele sunt dizolvate în mediul celular, moleculele de apă care intervin trebuie îndepărtate pentru a avea loc o interacțiune. Apa este, desigur, polară, iar deplasarea ultimelor straturi de apă poate fi non-banală, în funcție de exemplu în ce măsură siturile de activare a proteinelor sunt fie hidrofile, fie hidrofobe. În plus, ar trebui să ne așteptăm ca proprietățile filmelor subțiri de apă, cum ar fi vâscozitatea, să se abată semnificativ de la proprietățile lor în vrac. Chiar și simularea polipeptidelor complexe este incompletă în absența luării în considerare a influenței apei [65]. Ca un alt exemplu, există dovezi că viața creează și precipită formarea de gheață. Fără influența impurităților care acționează ca centre de nucleație neomogenă a gheții, se poate aștepta ca apa din nori să înghețe la 235 K sau chiar până la 243 K prin nucleația omogenă a gheții [67]. Impuritățile precum funinginea, particulele metalice și agenții biologici pot crește această temperatură. Într-adevăr, Murray și colab. [68] raportează că peste 258 K singurele materiale cunoscute pentru a promova nucleația gheții sunt cele biologice. Un agent biologic deosebit de eficient este bacteria Pseudomonas syringae care, datorită complexelor proteice de pe suprafața celulei sale, poate iniția înghețarea la temperaturi de până la 271 K [69]. Deși rolul său particular poate fi foarte variat în funcție de circumstanțe, așa cum subliniază Ball [65], privirea „ea [apa] în esență ca fundal pe care sunt așezate componentele moleculare ale vieții” este simplistă și naivă.

Având în vedere simplitatea structurală a unei molecule de apă - H2O - și importanța sa pentru sistemele biologice, precum și pentru alte sisteme naturale, este probabil surprinzător faptul că, atât în ​​formele sale lichide, cât și în cele solide, H2O rămâne oarecum misterios. În stare lichidă, moleculele de apă formează „rețele”, unde conexiunile sunt realizate din legături de hidrogen, dând substanței o structură considerabilă. La fel și gheața prezintă o structură considerabilă și variabilă. Există nu mai puțin de 15 polimorfe distincte de gheață cunoscute (de obicei specificate cu cifre romane) [70], deși unele dintre ele există doar în condiții prea extreme pentru a fi observate în mod obișnuit pe terestre [71], iar unele sunt, de asemenea, metastabile. În plus, pe măsură ce condițiile termodinamice se schimbă, aceste diferite polimorfe pot suferi transformări în stare solidă de la o formă la alta. Se numește polimorf comun întâlnit de obicei în viața de zi cu zi gheata hexagonala (gheata Ih). De ceva timp, o formă alternativă de gheață, gheață cubică (gheata Ic), a fost considerat a fi o modificare de temperatură scăzută care coexista cu gheața Ih la temperaturi de până la 240 K [72]. Cu toate acestea, studii recente [73] au concluzionat că, de fapt, observațiile anterioare nu sunt probabil această formă pur cubică, ci mai degrabă un amestec de stivuiri cubice și hexagonale, numite gheață dezordonată, prescurtat (ice Isd) de Malkin și colab. [74] și (gheață Icap) de Hansen și colab. [75]. Dacă acest lucru va fi confirmat sau nu de studii suplimentare, ice Ic oferă o condiție de graniță convenabilă asupra structurilor posibile care ar putea exista și vom proceda ca și cum ar fi gheața Ic este o posibilă fază metastabilă. Peste 170 K, gheață Isd se transformă ireversibil în gheață Ih.

Structural, gheața I (gheața Ih, gheață Ic, gheață Isd) poate fi gândit ca un material stratificat. Oxigenii din moleculele de apă se organizează în straturi formate din inele îndoite cu șase membri [74]. 9 Aceste straturi pot presupune în continuare doar trei posibile orientări de stivuire, numite A, B sau C, la fel ca în structurile strânse [76]. Straturile sunt organizate astfel încât, la scanarea materialului, straturile să se formeze straturi duble, unde fiecare strat individual din acest strat dublu trebuie să aibă aceeași orientare. În plus, la fel ca în cazul ambalajului strâns, straturile duble adiacente nu pot avea aceeași orientare. Deoarece erorile de stivuire se limitează la întreruperi între straturile duble, unul ia de obicei un strat dublu ca strat modular (ML) [77] și o etichetează după A, B sau C. Astfel, gheața Ih este dat de …ABAB... (sau echivalent ...BCBC... sau ...CACA…), Și gheață Ic de …ABCABC... (sau echivalent ...CBACBA…). Uneori este mai convenabil să lucrați cu o etichetare alternativă, denumită notația Wyckoff – Jagodzinski [76]. Se iau în considerare tripletele ML și se etichetează ML ca fiind oricare h sau c, în funcție de faptul că este hexagonal (h) sau cubic (c) legat de vecinii săi. De exemplu, cele mai multe patru ML ML din secvența de stivuire ABCBCA ar fi scris ca chhc. Ar trebui să fie evident că orice structură de stivuire, indiferent dacă este ordonată sau dezordonată, poate fi exprimată ca unele hc secvenţă. Gheața Ih structura de stivuire este afișată în figura 3A si gheata Ic este în figura 3b. O posibilă secvență de stivuire dezordonată este prezentată în figura 3c.

Figura 3. (A) Stivuirea straturilor în gheață hexagonală (gheață Ih). Axa verticală este normală față de suprafața (0001) bazală a gheții hexagonale. Sunt arătați doar atomii de oxigen (sfere), care sunt conectați prin legături de hidrogen (linii). (b) Stivuirea straturilor în gheață cubică (gheață Ic), cu axa verticală normală față de planul (111). (c) Un exemplu de secvență de stivuire care poate proveni din stivuirea de gheață dezordonată (gheață Isd). Straturile sunt marcate în funcție de faptul că stratul este hexagonal (H) sau cubic (C) legat de vecinii săi. (Adaptat de la Malkin și colab. [73], cu permisiunea.) (Versiune online color.)

Cu toate acestea, în pofida unui flux recent de studii teoretice, de simulare și de studii experimentale [69,72-75,77-81], există încă multe lucruri care nu se înțeleg despre formarea gheții sau transformările dintre diferiții polimorfi [70]. Într-un efort de a înțelege coexistența gheții Ih si gheata Ic la temperaturi scăzute, Thürmer & amp Nie [72] au examinat formarea lor pe Pt prin microscopie cu tunel de scanare și microscopie cu forță atomică. Au găsit o interacțiune complexă între formarea inițială a gheții Ih grupuri care cresc prin nucleația stratului și, în cele din urmă, se unesc. Detaliile coalescenței și natura limitelor domeniului dintre centrele de nucleație influențează puternic dacă creșterea ulterioară este gheață Ih sau gheață Ic. Foarte important, ele demonstrează că filmele de gheață cu grosime arbitrară pot fi imaginate la rezoluția stratului molecular. Mai multe grupuri [73-75,78] au aplicat model de tulburare lui Jagodzinski [82,83] la modele de difracție cu raze X simulate sau experimentale, folosind o gamă de influență între straturi, numită Reichweite, de s= 2,3,4. Au descoperit că este necesar să se utilizeze s= 4 pentru a descrie câteva mostre. Simulările dinamicii moleculare [80] au arătat că gheața care cristalizează la 180 K conține atât gheață Ic si gheata Ih într-un raport de 2: 1, în timp ce alte studii de simulare a dinamicii moleculare [84] au descoperit că perechile de defecte punctuale pot juca un rol important în schimbarea straturilor din gheață I. Cu toate acestea, alte simulări moleculare [85] au sugerat că o nouă fază de gheață , numit gheață 0, poate oferi o explicație termodinamică pentru unele caracteristici ale creșterii gheții.

Cristalografia haotică oferă informații importante despre tipurile de modele adecvate și natura proceselor de stivuire observate, precum și ajută la compararea studiilor experimentale, de simulare și teoretice. În acest fel, cristalografia haotică oferă o platformă comună pentru a raporta aceste observații și calcule diverse.

Să începem cu modelele utilizate. The ϵ-mașini care descriu gheața Ih si gheata Ic sunt prezentate în figura 4A,b. Sunt destul de asemănătoare, ambele având doar o stare și o tranziție fiecare. Computațional, sunt destul de simple. De asemenea, simplu este ϵ-mașină prezentată în figura 4c. Există două tranziții dintr-o singură stare, cu probabilitatea de a c fiind α0 si un h fiind . 10 Se pare că precedentele două modele sunt doar cazuri speciale ale acestuia din urmă. Recunoaștem că aceste trei modele descriu independentă și distribuită identic (IID) procese de stivuire. Acestea nu implică nicio corelație între simboluri. Cu toate acestea, schema de codare utilizată aici, transformarea fișierului ABC notația la notația Wyckoff – Jagodzinski, se bazează pe constrângeri de stivuire și dă efectiv o distanță de influență de doi ML. Identificăm această gamă de influență ca fiind Reichweites.

Figura 4. ϵ-Machine care descriu stivuirea gheții I. Nodurile reprezintă stări cauzale și sunt conectate prin arcuri etichetate s | p, Unde s este simbolul emis și p este probabilitatea de a face o astfel de tranziție. (A) ϵ-mașină pentru gheață Ih și (b) gheață Ic. Modele pentru secvențe de stivuire dezordonate ale structurilor strâns împachetate au fost introduse de Jagodzinski [82,83]. Parametrul model care specifică intervalul de influență dintre ML se numește Reichweites. (c) Cel mai simplu ϵ-mașină în hc notație care dă o gheață Isd secvență de stivuire (s= 2 gheață Isd). (d) ϵ-mașină pentru s= 3 gheață Isd și (e) s= 4 gheață Isd. (Versiune online color.)

Următorul model utilizat în mod obișnuit este cel al lui Jagodzinski s= 3 model de tulburare din figura 4d. Aici, următorul simbol din secvență depinde doar de simbolul anterior (fie h sau c), făcând din acesta un model Markov de prim ordin. Ultimul model explorat în literatură este cel al lui Jagodzinski s= 4 model de tulburare, iar acest lucru este descris în figura 4e. Deoarece probabilitatea de a observa următorul simbol depinde de cele două simboluri anterioare, recunoaștem acest lucru ca un model Markov de ordinul doi. Din nou, cartografierea ABC notația la notația Wyckoff – Jagodzinski se pliază într-o gamă suplimentară de influență de doi ML în ceea ce privește stivuirea fizică a ML-urilor. Este evident că s-ar putea continua acest proces, având în vedere tot mai mare Reichweite, adică modele Markov de ordin superior, la nesfârșit. Cu toate acestea, procesele Markov cu raza finită sunt doar o mică parte din posibilele procese în stare finită pe care ar putea să le ia în considerare. Prin stare finită, înțelegem că există un număr finit de stări, dar acest lucru nu înseamnă că gama de influență trebuie să fie finită. Simulările transformărilor simple în stare solidă în ZnS (de asemenea, o structură strânsă) de la structura de stivuire hexagonală la cea cubică dezordonată au produs procese de stivuire cu o gamă infinită de influență [28]. Astfel, suntem conduși să suspectăm că, în ciuda acordului excelent dintre modelele de difracție experimentale și teoretice raportate de unii cercetători pentru gheața I, procesul real poate aparține unei clase de calcul mai sofisticate. Cristalografia haotică, cu accent pe măsurile teoretice ale informației și calculelor, permite recunoașterea posibilității și într-adevăr punerea întrebărilor relevante.

Cum putem observa sau deduce prezența unor astfel de procese de stivuire sofisticate? O modalitate este tehnicile de inferență îmbunătățite. În timp ce cristalografia haotică are un algoritm de inferență, ϵ-teoria reconstrucției spectrale a mașinilor [27,30] care detectează procesele cu interval finit de tiparele de difracție, există posibilitatea extinderii acestuia pentru a include procese de ordine infinită. De asemenea, studiile de simulare discutate mai devreme pot duce la secvențe de stivuire dezordonate și există tehnici, cum ar fi algoritmii de fuzionare a subarborelui [24] și inferența structurii bayesiene [86], care pot descoperi aceste procese în stare finită, dar cu interval infinit din date secvențiale. . Acest lucru sugerează că nivelul adecvat de comparație între teorie, simulare și experiment nu este un semnal (modelul de difracție), ci mai degrabă procesul de stivuire în sine, așa cum este specificat de ϵ-mașinărie. Cristalografia haotică este o platformă pentru o astfel de comparație.

De asemenea, prin studierea ϵ-arhitectura cauzală a mașinii, adică dispunerea stărilor cauzale și tranzițiile care le leagă, este posibil să se descopere tipurile de defecte prezente. Într-adevăr, acest lucru s-a făcut pentru polipotipurile ZnS [27,29]. Recent, au fost propuse mai multe tipuri diferite de defecte pentru gheața I [77] și o analiză adecvată a acestora ϵ-mașina, combinată cu studii teoretice și experimentale, poate elucida care defecte sunt importante într-un anumit specimen.Acest lucru ar putea fi destul de valoros, deoarece există multe căi posibile de formare pentru exemplarele de gheață dezordonate și diferite mecanisme, cum ar fi transformările în stare solidă versus creștere, lasă probabil o amprentă digitală în arhitectura cauzală.

(ii) Organizarea aromaticității

Benzenul este renumit pentru caracterul său curios „aromat” care provine direct din cele șase π electroni împărțiți între cei șase atomi de carbon și plutesc deasupra și sub planul inelului său de atom de carbon. Pentru a înțelege acest caracter, chimiștii încearcă să localizeze delocalizat π electroni, parțial pentru a înțelege caracterul fizic al benzenului și parțial pentru a găsi noi modalități de a controla reactivitatea chimică și de a descoperi noi căi sintetice. Un obiectiv este acela de a proiecta noul motiv electronic al benzenului pentru a acționa ca un catalizator de reacție controlabil. Există un program activ de cercetare pentru a modifica proprietățile aromatice ale benzenului prin adăugarea de inele „biciclice” în afara inelului principal. Acest lucru a dus la crearea tris (biciclo [2.1.1] hexeno) benzen (TBHB). Structura TBHB este esențială pentru înțelegerea modului de localizare a benzenului π electroni [87].

Relatăm sondele experimentale recente ale structurii TBHB, demonstrând modul în care o analiză teoretică a informației oferă informații suplimentare. TBHB este o moleculă în mare măsură plană care a atras atenția ca una dintre primele hidrocarburi benzenoide mononucleare confirmate cu o geometrie asemănătoare ciclohexatrienelor [88]. Figura 5A arată structura moleculară a TBHB și figura 5b oferă o schemă de formulă. Un interes deosebit îl are inelul central benzenic, unde unghiurile interne ale legăturilor carbon-carbon sunt toate de 120 °, dar există o modificare remarcabilă a celor două lungimi de legături inechivalente între carboni (1,438 (5) −1,349 (6) Å) [88]. Un interes suplimentar este structura cristalografică a TBHB. Aici se observă două morfologii cristaline, monoclinice și hexagonale [90]. Pentru această din urmă structură, studiile de difracție cu raze X relevă o împrăștiere difuză semnificativă de-a lungul tijelor în spațiul reciproc, un semn distinctiv al tulburării plane. Figura 6A arată pozițiile tijelor difuze în spațiul reciproc și figura 6b oferă o ilustrare a structurii medii a stratului TBHB. Vom numi extensia acestei configurații într-o matrice periodică bidimensională ML pentru TBHB.

Figura 5. (A) Structura moleculară a TBHB. Sferele negre reprezintă atomi de carbon, în timp ce albul este atom de hidrogen. (b) Așa-numita reprezentare a „formei scheletice” a TBHB. (Adaptare după Michels-Clark și colab. [89], cu permisiunea.)

Figura 6. (A) Schema planului spațial reciproc hk0. Cercurile reprezintă pozițiile împrăștierii difuze (hk≠3n) și traversează pozițiile reflecțiilor Bragg-like (hk=3n). (b) Structura medie a stratului pentru TBHB cu simetria stratului fiind. O matrice bidimensională de molecule TBHB astfel aranjate se numește a strat modular (ML). (Adaptat din Bürgi și colab. [91], cu permisiunea.)

De interes mai recent [89,91], și problema care ne preocupă aici, este cuantificarea și descrierea structurilor de stivuire dezordonate observate în TBHB. Pentru a face acest lucru, trebuie să specificăm posibilele aranjamente de stivuire ML-ML și să stabilim o nomenclatură convenabilă pentru a exprima structurile de stivuire extinse. Regulile și convențiile de stivuire pentru straturile de TBHB pot fi rezumate după cum urmează. 11 (i) Deși există trei moduri în care pot fi stivuite două ML-uri, ele sunt echivalente din punct de vedere geometric și sunt corelate printr-o rotație de 120 ° în jurul direcției de stivuire. Astfel, există doar un singur tip de relație ML-ML. (ii) Pentru triplete de ML, există două aranjamente de stivuire inechivalente din punct de vedere geometric. Pentru cazul în care o moleculă din (eu+2) ML este direct peste unul în euML, acest aranjament se numește eclipsat. Cealaltă posibilitate distinctă este că (eu+2) ML ocupă una din celelalte două poziții. Acestea sunt echivalente din punct de vedere geometric, fiind legate de o operație oglindă și sunt numite îndoit. Cu toate acestea, pe măsură ce unul avansează de-a lungul direcției de stivuire, aceste două din urmă pot fi diferențiate ca rotind fie în sensul acelor de ceasornic, fie în sensul acelor de ceasornic. Deci, împreună, trebuie să facem distincția între trei triplete diferite de secvențe de stivuire: un triplet eclipsat, pe care îl simbolizăm prin e, un triplet îndoit în sensul acelor de ceasornic, pe care îl vom simboliza prin l, și un triplet îndoit în sens invers acelor de ceasornic, simbolizat prin r. 12 Colectăm aceste posibilități în set.

Să ne imaginăm o fereastră glisantă care permite observarea a doar trei ML-uri la un moment dat. Acelei secvențe de trei ML i se atribuie apoi un simbol din. Fereastra crește apoi de-a lungul direcției de stivuire cu un ML, astfel încât ultimul ML din secvență să fie ascuns și să fie dezvăluit un ML nou. Această nouă secvență de trei ML poate fi din nou specificată de unul dintre simbolurile din, astfel încât secvența de patru ML este dată de o secvență de două litere din. Astfel, o secvență de stivuire fizică poate fi scrisă ca o secvență peste setul acestor triplete,.

Recent, Michels-Clark și colab. [89] au comparat trei metode diferite de determinare a structurii de stivuire pentru TBHB dezordonat din tiparele de difracție: evoluția diferențială, optimizarea roiului de particule și un algoritm genetic. Deși intens din punct de vedere computerizat, au găsit un acord excelent între modelele de difracție calculate și de referință, obținând un R-aptitudinea factorilor pentru cel mai bun algoritm de evoluție diferențială de caz. Analizăm cazul în detaliu acum.

Michels-Clark și colab. [89] presupune un proces Markov de ordinul doi în rle notare, 13 astfel încât probabilitățile simbolurilor succesive depind doar de cele două simboluri anterioare văzute, adică pe care le numesc motive structurale. Michels-Clark și colab. [89] raportează direct probabilitatea de e ca urmare a e as, care este doar două abateri standard peste 0. În plus, probabilitatea de ee secvența în sine este doar 0,00033. Astfel, neglijăm ee secvență atunci când construim modelul ascuns Markov. Michels-Clark și colab. [89,92] corelează probabilitățile de tranziție între motivele structurale și parametrii modelului, astfel încât să putem calcula direct probabilitățile de tranziție din orice soluție a parametrilor modelului. 14 Luând valorile pentru cea mai bună soluție de evoluție diferențială de caz date în tabelul 2 din [89], calculăm aceste probabilități. Făcând acest lucru, constatăm că și. Această echivalență a lungimii-două futures între lungimea-două trecuturi ll și rl sugerează că aceste două trecuturi ar trebui combinate într-o singură stare cauzală. 15 Un argument similar este valabil pentru rr și lr. Astfel, colectăm trecuturile ll și rl într-o singură stare și în același grup rr și lr în statul unic. Celelalte patru posibile lungimi - două treceri -re,le,er,el- fiecare are un viitor unic, și astfel fiecare își formează propria sa stare cauzală. Rezultatul în șase stări ϵ-mașina este prezentată în figura 7. Acum putem oferi o interpretare cristalografică haotică a procesului de stivuire.

Figura 7. Arhitectura stării cauzale TBHB. Alfabetul este. În această nomenclatură, procesul este de ordinul doi Markovian și stările cauzale sunt specificate prin lungimea lor-două trecuturi, unde trecuturile ll și rl au fost fuzionate într-o singură stare cauzală și în mod similar pentru trecuturi rr și lr în. Fiecare stare cauzală este etichetată cu probabilitatea sa de stare asimptotică. Astfel, se observă că procesul de stivuire este dominat de cele două stări cauzale și, având probabilități de tranziție mari și aproape egale între ele (cele mai mari două arcuri de tranziție (verzi)). Spre deosebire de structurile aproape cristaline, nu există o buclă închisă flancată de stări de satelit mai puțin frecventate, deseori interpretate ca structuri de defectare. Aici, în schimb, structura dominantă este dezordonată, sugerând că ne gândim la acest lucru ca la un „anticristal”. Rețineți că suma probabilităților de tranziție care ies din două dintre stări și, este puțin mai mică de 1. Acest lucru se datorează faptului că aici neglijăm ee secvența de stivuire (a se vedea textul). (Versiune online color.)

Cea mai curioasă caracteristică a acestei structuri este perechea sa extrem de dezordonată de stări centrale și, fiecare cu o probabilitate de stare asimptotică de 0,456. Dacă neglijăm pentru moment simbolul e (care are doar o probabilitate de), acest nucleu cu două stări reprezintă un proces aproape aleatoriu între cele două simboluri l și r. Cu doar o probabilitate de 0,024, șiruri compuse din aleatoare lr secvențele sunt întrerupte de e. Acum, din state și vin cele mai neobișnuite probabilități de tranziție pe ϵ-mașină: vedem asta. Adică, aproape întotdeauna (0,978 probabilitate) se observă că simbolul care urmează e este opus cel care a precedat e:

Adesea, se examinează arhitectura cauzală pentru indicii despre tipurile de defecte care ar putea fi prezente. Dar, din moment ce cele mai vizitate state (și) nu reprezintă un ciclu, nu există un cristal părinte aici. În schimb, s-ar putea considera că procesul subiacent este aleatoriu între l și r și doar ocazional întrerupt de e, astfel încât e joacă rolul unei greșeli. Dacă da, ne gândim la aceasta ca la o eroare extrinsecă, ca e nu face parte din structura de pe ambele părți. În orice caz, arhitectura cauzală a stivuirii TBHB prezintă o inversiune interesantă a dihotomiei obișnuite a structurii cristal-defect. Stările de bază și cele care dau naștere la stivuirea dezordonată și stările periferice mai puțin vizitate, în special și, care servesc la constrângerea probabilităților de stivuire a secvențelor și, prin urmare, impun un fel de „structură”. În această perspectivă, poate că nu este prea extrem să ne gândim la TBHB ca la un fel de „anti-cristal”.

(iii) Către o viziune unificată a structurii materiale

Cum se potrivesc toate acestea? Să contrastăm corvoada cristalografului însărcinată cu determinarea structurii unui material periodic și a celui neperiodic. Pentru cazul periodic complet tridimensional, există șapte sisteme de cristale posibile: triclinic, monoclinic, ortogonal, tetragonal, cub, trigonal și hexagonal. Unul, desigur, poate fi mai specific și rețineți că există 230 de grupuri spațiale cristalografice. Un cristal periodic trebuie să aparțină unuia și numai unuia dintre ele. Astfel, cristalografia este echipată cu instrumente care împart spațiul tuturor structurilor de cristal posibile într-un număr finit de seturi care nu se suprapun. Dintre numărul uimitor de moduri în care s-ar putea imagina punerea împreună a atomilor într-o matrice tridimensională periodică, acest sistem limitat de clasificare epuizează posibilitățile. Se poate discuta asemănările dintre diferitele sisteme [93] și altfel se poate aborda o înțelegere autentică a varietăților de structuri posibile. Dar se poate spune același lucru și pentru materialele non-periodice?

Pentru a simplifica discuția, să ne limităm atenția la cazul unidimensional al stivuirii a 1000 ML. Să presupunem că acesta este peste un alfabet de cardinalitate doi. Câte posibile secvențe de stivuire există? 16 Ei bine, există 2 1000 ≈10 301. Având în vedere că există aproximativ 10 80 de protoni în Universul observabil, este clar că o listă cuprinzătoare pur și simplu nu este posibilă. Și, dacă ar fi fost, este îndoielnic cât de util ar fi. Atunci, pentru aceste materiale dezordonate, suntem obligați să apelăm la metodele statistice. În loc de o schemă de clasificare cu granulație fină la nivelul secvențelor individuale, colectăm în schimb toate secvențele care au aceleași proprietăți statistice într-un set. În mod colocvial, fiecare set reprezintă un proces de stivuire. Operațional, încercăm să identificăm la ce proces aparține o anumită secvență și apoi analizăm procesul în locul secvenței particulare.

Fiecare dintre graficele din figurile 4 și 7 specifică un anumit proces și definește un model Markov ascuns. Deși există încă un număr infinit de procese posibile în limita secvențelor nedefinit de lungi, a fost impus un fel de ordine. De exemplu, putem enumera toate procesele pe un alfabet cu două simboluri, cu o singură stare. Există doar unul și este prezentat în figura 4c. (Figura 4A,b sunt doar cazuri speciale din figura 4c.) Pentru procesele binare în două stări, există 13 [86]. 17 Pentru procesele binare, a fost tabelat numărul de procese distincte de până la șase stări [95]. Astfel, cristalografia haotică face pentru materialele dezordonate același serviciu pe care cristalografia clasică o face pentru cele perfect ordonate: organizează și structurează spațiul posibilelor aranjamente atomice. Mai mult, permite compararea modelelor ascunse Markov între diferite materiale în același mod în care structurile cristaline din diferite materiale sunt comparate în funcție de care, de exemplu, sistemul de cristal le aparține.

Susținem atunci că modelele ascunse Markov care descriu nu numai specimene diferite ale aceluiași material, ci diferite materiale pot fi comparate, fie prin examinarea directă a modelului grafic al procesului, fie prin măsuri de informare care caracterizează diverse cerințe de calcul. De exemplu, putem compara măsurile de calcul intrinsec între cele două materiale considerate în subsecțiunile anterioare, precum și cel al unui al treilea material stratificat, ZnS. Dintre numeroasele măsuri pe care le puteți selecta, alegem să examinăm organizarea informațională a acestor materiale prin intermediul unui diagramă complexitate – entropie [25]. O diagramă de complexitate-entropie trasează, pentru fiecare proces de stivuire, rata de entropie hμ a unei secvențe de simboluri discutate în §3 și a informațiilor reciproce între cele două jumătăți ale specimenului, excesul de entropie E, introdus în §4. Aceste măsuri pot fi calculate direct din modelul ascuns Markov pentru procesele de stivuire.

Începem cu gheață. Rețineți că gheața Ic si gheata Ih ambele sunt descrise de mașini cu o singură stare și, astfel, fiecare jumătate a cristalului nu împarte nicio informație cu cealaltă jumătate, oferind E(Euc)=E(Euh) = 0 biți. În mod similar, fiind perfect ordonați, găsim hμ(Euc)=hμ(Euh) = 0 biți ML −1. Pentru gheață eusd, calculăm această cantitate pentru un număr de exemplare experimentale raportate în literatură. Ojoc și colab. . s= 4 Modelul tulburării Jagodzinski pentru a analiza rezultatele acestora și constatăm prin calcul direct din datele date în tabelul lor 4 că aceste informații măsoară grupul în intervalul de E(Eusd) ≈0.10−0.15 biți și hμ(Eusd) ≈0,75−0,90 biți ML −1. Murray și colab. [78] au efectuat studii similare pe gheața I depusă ca gheață amorfă din faza de vapori pe un substrat de sticlă la 110 K. Eșantionul a fost încălzit ulterior cu o rată de 1 K pe minut și au raportat modele de difracție înregistrate la temperaturi selectate în intervalul 125-160 K. Și ei au analizat modelele de difracție folosind s= 4 Modelul tulburării Jagodzinski, deși au constatat că efectele memoriei erau neglijabile. Constatăm prin calcul direct din datele date în tabelul lor 1 că aceste măsuri de informații se strâng aproape E(Eusd) ≈0 biți și hμ(Eusd) ≈0.95−1.00 biți ML −1. La fel putem face și pentru TBHB. Găsim E(TBHB) = 0,21 biți și hμ(TBHB) = 1,1 biți ML −1. Pentru comparație, luăm în considerare și aceste cantități pentru mai multe exemplare de ZnS analizate în altă parte [29]. În cele din urmă, pentru a contrasta cu aceste eșantioane dezordonate, considerăm un proces unidimensional care are caracteristici similare cu cele ale unui cvasicristal, Procesul Thue – Morse (Proces TM) [96]. Ca un cvasicristal, este complet „ordonat”, dar non-periodic. Avem biți, unde N este numărul de straturi din specimen și hμ(TM) = 0 biți ML −1.

Deoarece tulburarea maximă posibilă de stivuire este de 1 bit ML -1 pentru gheața I, vedem că gheața dezordonată I este într-adevăr, bine, dezordonată. În plus, foarte puține informații (E) este împărțit între diferitele jumătăți. Există puține persoane care pot prezice aproximativ jumătate din specimen cunoscând cealaltă jumătate. Gruparea acestor măsuri informaționale conferă credibilitate noțiunii că gheața Isd este o formă „nouă” de gheață. Cu toate acestea, vom fi prudenți atunci când ne referim la aceasta ca la o fază termodinamică distinctă a gheții. Observați că nu numai că nu este bine definit în spațiul secvențial de stivuire, adică există multe secvențe care corespund gheaței Isd, dar vedem și din răspândirea măsurilor de informare asupra diagramei complexitate – entropie, nici în spațiul de proces nu este bine definit. Preferăm interpretarea conform căreia aceste exemplare sunt cristale haotice, fiecare fiind descris de un model Markov ascuns diferit și fiecare prezentând diferite măsuri de procesare a informațiilor. Astfel, ele nu constituie într-adevăr o fază separată în același sens cu gheața Ic si gheata Ih sunt. Ice Isd este, cel puțin în acest moment, un termen umbrelă pentru gheața I cu o stivuire în mare parte aleatorie de straturi hexagonale și cubice. Observăm că măsurile teoretice ale informației pot distinge între gheața Isd probe având diferite istorice în condiții termodinamice diferite.

În mod similar, TBHB pare să fie foarte dezorganizat. Observăm că, deoarece există trei orientări posibile de stivuire pentru fiecare ML, entropia maximă de stivuire este. Într-adevăr, așa cum sa menționat anterior, nu există un ciclu periodic central pe graficul din figura 7, așa cum se vede în mod obișnuit în materialele defecte. De asemenea, în mod similar, nu sunt distribuite prea multe informații între cele două jumătăți. ZnS prezintă cel mai puțin entropic dintre exemplarele dezordonate pe care le considerăm. La fel ca exemplarele de gheață pe care le-am considerat, cele ZnS sunt fie dezordonate, fie prinse în transformarea dintre fazele cristaline: o fază hexagonală și una cubică. Cu toate acestea, în mod generic, ZnS pare să aibă stări intermediare mai structurate, sugerând o transformare mai structurată, probabil ca urmare a constrângerilor semnificative asupra tipurilor de mecanisme de dezordonare în joc.Putem specula că, deși gheața I și ZnS pot fi descrise ambele ca structuri strânse, mecanismele de dezordonare și transformare sunt cel puțin cantitative, dacă nu calitative, diferite pentru fiecare.

Examinând figura 8, vedem că diagrama complexitate-entropie oferă, de asemenea, o partiționare pentru tipurile de structuri care pot exista. De exemplu, orice proces periodic are entropie zero, astfel, pe o diagramă de complexitate-entropie, toate cristalele perfecte sunt limitate la axa verticală. Astfel, concretizează cât de specială este cristalinitatea. În mod similar, cvasi-cristale locuiesc în colțul din stânga sus al diagramei, de asemenea limitat la axa verticală. Astfel, deși destul de interesante, cvasicristalele sunt organizații informaționale mai degrabă speciale. Tot spațiul din dreapta axei verticale este ocupat de cristale entropice - doar tipurile de specimene pe care cristalografia haotică le potrivi în mod ideal. Astfel, cristalografia haotică introduce instrumente pentru cuantificarea acestor structuri și reprezintă o expansiune semnificativă în domeniul cristalografiei clasice.

Figura 8. Varietatea calculului intrinsec, astfel cum este dezvăluită de o diagramă de complexitate-entropie pentru arhitectura materialelor. Pentru gheața dezordonată, trasăm valorile calculate din experimente pe Isd (* din tabelul 1 din [78] și din tabelul 4 din [73]) TBHB (din [89]) și ZnS (din [29]). Pentru referință, trasăm punctul de complexitate – entropie atât pentru Ih și euc (⊗) precum și eusd (•). Nu este prezentat punctul pentru procesul TM (a se vedea textul), un surogat unidimensional pentru un cvasicristal. L-am găsi nedefinit sus pe axa verticală. (Excesul de entropie este divergent, cu o rată de entropie foarte mică pentru exemplarele mari.) Diferite valori ale calculului intrinsec indică diferențe semnificative în organizarea procesului de stivuire pentru fiecare material, precum și densitățile lor de entropie. (Versiune online color.)

Deși susținem că înțelegerea structurii în sine este un scop suficient de demn, suntem conștienți de faptul că unul dintre fructele care trebuie recoltate din această anchetă este posibila exploatare a legăturii dintre structura și funcţie. 18 Relația dintre structură și proprietățile materiale este destul de cunoscută. Carbonul poate exista ca un cristal cubic centrat pe față și, atunci când un exemplar este astfel comandat, îl numim un diamant. Mai frecvent, carbonul se găsește în foi hexagonale și este cunoscut sub numele de grafit. Carbonul poate fi, de asemenea, aranjat sub formă de nanotuburi și cochilii sferice numite informal Bile Bucky. Și, deși fiecare dintre acestea este echivalent prin compoziție, proprietățile lor materiale sunt foarte diferite. Structura contează. Mai puțin drastic, diferite tipuri de structuri de stivuire schimbă proprietățile materialelor în moduri mai subtile. Brafman & amp Steinberger [98] au remarcat faptul că, trecând de la un tip de structură de stivuire periodică în ZnS la altul, gradul de birirefringență se schimbă. Într-adevăr, această schimbare părea să depindă doar de un singur parametru, hexagonalitatea, care este fracția de straturi legate hexagonal de vecinii lor, dată de. Și, probabil, în consecință, a făcut-o într-un mod foarte neted și previzibil. Știm că structura de stivuire afectează alte proprietăți materiale, cum ar fi modelul de difracție și, în mod clar, funcțiile de corelație. Este nevoie de puțină imaginație pentru a specula că alte proprietăți pot fi afectate în mod similar.

Să revenim apoi la cazul stivuirii a 1000 ML. Să presupunem că vom însărcina un om de știință cu materiale pentru a investiga posibilele proprietăți materiale obținute din diferite secvențe de stivuire. Chiar și în cazul binar simplu, așa cum am văzut mai sus, există aproximativ 10 301 de astfel de secvențe. Astfel, (abordarea certă naivă a) unei analize detaliate secvență cu secvență este imposibilă - fie experimental, teoretic sau prin simulare. Cu toate acestea, în absența oricărei teorii a dezordinii în materiale, s-ar putea considera necesară o astfel de abordare de investigare a forței brute. O perspectivă de cristalografie haotică echipează imediat cercetătorul în materiale cu instrumente pentru abordarea problemei. Ea știe, de exemplu, că multe proprietăți ale materialelor sunt dictate și calculabile numai din cunoașterea procesului de stivuire. Astfel, în loc să încercați să abordați problema secvență cu secvență, este profitabil să abordați proces cu proces. Deși spațiul este încă enorm, este considerabil mai mic și, important, este acum sistematizat. Începând cu procese simple și trecând la altele mai complexe, ar putea fi, de exemplu, o strategie eficientă. 19 Mai mult, proprietățile nu pot depinde nici măcar de detaliile procesului de stivuire, ci pot fi corelate cu proprietățile statistice generale sau cu măsurile teoretice ale informației. Cazul birefringenței ZnS sugerează acest lucru. Un singur parametru statistic se corelează cu birefringența observată cel puțin pentru secvențele de stivuire periodice. De asemenea, se știe că modelul de difracție depinde doar de corelațiile perechi dintre ML. Este bine cunoscut faptul că diferite procese de stivuire pot avea aceleași funcții de corelație, sugerând că o abordare chiar mai puțin fină poate fi profitabilă. În măsura în care proprietățile de transmisie prin potențiale dezordonate depind doar de funcțiile de corelație [61], și aici poate fi utilă o abordare mai puțin fină.

Ne putem opune și ne putem întreba dacă ni se garantează că toate proprietățile materiale sunt aceleași pentru toate realizările unui proces. Nu suntem. Cu toate acestea, rezultatele teoretice care sugerează parametrii importanți de luat în considerare, împreună cu observațiile experimentale și rezultatele simulărilor, pot da încredere că o anumită proprietate studiată este o proprietate de ansamblu. Fără îndoială, o mare parte din legătura dintre proprietățile teoretice ale informației și proprietățile materialelor rămâne neexplorată. Pe linia prezentată aici și în paralel cu gândurile principiale, dar speculative ale lui Schrödinger despre organizarea vieții, indiciile abundente ale conexiunilor intime sunt prea promițătoare și posibilele recompense ale găsirii și exploatării unor astfel de conexiuni sunt prea bogate pentru a nu fi explorate.

Remarcăm, de asemenea, că exercițiul de predicție a proprietăților materialelor din structură nu este nicidecum academic: Inițiativa pentru genomul materialelor [99] este un efort coordonat și dedicat care cuprinde studii teoretice, experimentale și de simulare care încearcă să facă exact acest lucru. Având în vedere varietatea pură a aranjamentelor posibile ale atomilor, o schemă organizațională care structurează spațiul posibilităților este o necesitate absolută. În caz contrar, cercetătorii se vor baza pe intuiție - formidabilă cu siguranță, dar prea adesea nesigură - singuri pentru a propune și a asambla configurații posibile cu proprietăți materiale noi. Fără prea multă exagerare, este asemănător cu lovirea unei tastaturi, sperând să scoată la iveală unul dintre sonetele lui Shakespeare: posibil da, dar este mult mai probabil dacă se cunosc regulile gramaticii engleze.

5. Termodinamica calculului materialului

Până în acest moment, ne-am concentrat exclusiv pe proprietățile informaționale încorporate în structura statică a materialelor „haotice”, ignorând dinamica temporală ... a creșterii lor, comportamentul lor funcțional în „sălbatic” și altele asemenea. O poveste completă, totuși, necesită o contabilitate termodinamică a aspectelor informaționale ale unor astfel de materiale - energia configurațiilor lor de echilibru și neechilibru, energia modului în care acestea devin, cum sunt transformate și ce funcții susțin. Aici, pentru a ilustra conexiunile dintre informațiile intrinseci și costurile energetice, trecem în revistă pe scurt explorările recente ale demonului lui Maxwell și un model cu clichet care descrie modul în care „motoarele” moleculare pot stoca și prelucra informații pe măsură ce traversează o secvență de control.

(a) Motorul cu o singură moleculă al lui Szilard

Macromoleculele biologice [100-102] îndeplinesc sarcini care implică manipularea simultană a energiei, informațiilor și materiei. Deși uneori putem identifica o astfel de funcționare - în curentul porții unui canal ionic cu membrană [103.104] care susține propagarea trenurilor de vârf de-a lungul unui axon neuronal sau într-o proteină motorie care transportă substanțe nutritive pe autostrăzile microtubulilor unei celule [100] - nu este bine înțeles. Înțelegerea apelează la o termodinamică a sistemelor nano-scala care funcționează departe de echilibru și la o fizică a informațiilor care identifică cantitativ organizația și funcția. La bază, trebuie să rectificăm această funcționare cu generația de entropie dictată de a doua lege a termodinamicii. James Clerk Maxwell l-a prezentat pe Demon care acum îi poartă numele pentru a evidenția paradoxul esențial. Dacă un demon poate măsura starea unui sistem molecular și poate lua măsuri pe baza acestor cunoștințe, a doua lege poate fi încălcată: sortarea moleculelor lente și rapide pe laturile separate ale unei partiții creează un gradient de temperatură pe care un motor termic îl poate transforma în lucru util . În acest fel, „inteligența” demonică - sau, în vocabularul nostru, procesarea informațiilor - poate converti fluctuațiile termice (energie dezorganizată) în lucru (energie organizată).

În 1929, Leo Szilard a introdus un Demon Maxwellian ideal pentru examinarea rolului procesării informațiilor în Legea a II-a [105], un experiment de gândire care un deceniu mai târziu a oferit un impuls teoriei comunicării lui Shannon [106]. Motorul lui Szilard este format din trei componente: un controler (Demon), un sistem termodinamic (o moleculă într-o cutie) și un rezervor de căldură care menține ambele termicizate la o temperatură T. Funcționează printr-un mecanism simplu al unui ciclu de măsurare, control și ștergere în trei pași. În timpul măsurării, o barieră este introdusă la jumătatea căsuței, constrângând molecula fie la jumătatea stângă sau dreaptă a cutiei, iar memoria demonului se schimbă pentru a reflecta pe ce parte este molecula. În etapa de control termodinamic, Demonul folosește aceste cunoștințe pentru a permite moleculei să împingă bariera către partea opusă moleculei, extragând lucrările din rezervorul termic. În etapa de ștergere, Demonul își resetează memoria finită la o stare implicită, astfel încât să poată efectua din nou măsurători. Periodicul protocol ciclul de măsurare, control și ștergere se repetă la nesfârșit și deterministic. Rezultatul net este extragerea muncii din rezervor echilibrată de entropie creată de schimbări în memoria Demonului. A doua lege este respectată și Demonul exorcizat, deoarece aruncarea entropiei în baia de căldură necesită un flux de lucru care compensează exact energia câștigată în timpul etapei de control.

Conectând dinamica neliniară la termodinamica motorului lui Szilard, am arătat recent că protocolul său de măsurare-control-barieră-ștergere-glisare este echivalent cu o hartă bidimensională în timp discret de la pătratul unității la sine [107]. Această construcție explicită stabilește că Motorul lui Szilard este un sistem haotic ale cărui hărți componente sunt transformări termodinamice - ceea ce numim acum un sistem termodinamic în bucăți. O animație a motorului Szilard, reformată ca acest sistem dinamic haotic, poate fi vizualizată la http://csc.ucdavis.edu/

Ce înseamnă haosul din motorul Szilard? Sistemul comun generează informații - informații pe care Demonul trebuie să le măsoare în mod repetat pentru a rămâne sincronizat cu poziția moleculei. Pe de o parte, informațiile sunt generate de rezervorul de căldură prin extinderea spațiului de stare în timpul controlului. Aceasta este instabilitatea haotică din Motor atunci când este privită ca un sistem dinamic. Și, pe de altă parte, informațiile sunt stocate de Demon (temporar) astfel încât să poată extrage energie din rezervor permițând partiției să se deplaseze în direcția corespunzătoare. Pentru a readuce motorul în aceeași stare inițială, informațiile stocate trebuie șterse. Acest lucru contractează dinamic spațiul de stat și, prin urmare, este disipativ la nivel local, cedând energie rezervorului.

Rata generală de producție a informațiilor este dată de entropia Kolmogorov-Sinai a motorului hμ [108]. Aceasta măsoară fluxul de informații din subsistemul molecular în Demon: informații culese din rezervor și utilizate de Demon pentru a converti energia termică în muncă. Simplu spus, gradul de haos determină rata de extracție a energiei din rezervor. Mai mult, în configurația sa de bază cu bariera plasată în mijlocul cutiei și stările sale de memorie fiind de dimensiuni egale, măsurătorile poziției moleculei Demonului sunt optime. Folosește toate informațiile generate hμ de sistemul termodinamic: reamintind §3, toate informațiile generate hμ este o informație legată bμ niciuna dintre informațiile generate nu se pierde (rμ dispare).

Din punct de vedere critic, motorul Szilard dinamic arată că o credință larg răspândită despre costurile termodinamice ale procesării informațiilor - așa-numitul principiu Landauer [109-113]: fiecare cost șters al energiei disipate pe biți și actul de măsurare nu au niciun cost termodinamic - este în cel mai bun caz un caz special [107.114–116]. 20 Deoarece locația partiției variază și celulele de memorie Demon își schimbă dimensiunea, atât măsurarea, cât și ștergerea pot disipa orice cantitate pozitivă sau negativă de căldură. Mai exact, există configurații ale motorului Szilard care încalcă direct principiul Landauer: ștergerea este liberă termodinamic și măsurarea este costisitoare - un principiu anti-Landauer. Rezultatul este că motorul Szilard atinge o limită inferioară a disipării energiei exprimată ca suma costurilor termodinamice de măsurare și ștergere. În acest sens, motorul Szilard captează o optimitate în conversia informațiilor în lucru, care este analogă cu eficiența optimă a unui motor Carnot atunci când transformă o diferență de energie termică în lucru.

(b) Catalizatori informaționali

Motorul lui Szilard este unul dintre cele mai simple dispozitive termodinamice controlate care dezvăluie tensiunea dintre Legea a II-a și funcționalitatea unei entități sau subsisteme de colectare a informațiilor (Demonul). Lucrul net extras echilibrează exact costurile termodinamice (entropice). Acesta a fost principalul punct al lui Szilard, deși vedem că motorul său nu era foarte funcțional, doar în concordanță cu a doua lege. Contribuția majoră a fost că, cu mult înainte de teoria informației lui Shannon, Szilard a recunoscut importanța achiziției și stocării informațiilor demonului în rezolvarea paradoxului lui Maxwell.

Acest lucru ne permite să trecem la un dispozitiv mai sofisticat care folosește un rezervor de informații (un șir de biți aleatori) pentru a extrage lucrările pozitive nete dintr-un rezervor de căldură. Pentru a stabili scena pentru termodinamica care ne interesează, dar rămânând în spiritul materialelor complexe, să ne imaginăm din nou motorul Szilard implementat ca o enzimă macromoleculă ale cărei stări conformaționale implementează protocolul de măsurare-control-ștergere. Mai mult, lăsați această enzimă să traverseze un cristal periodic unidimensional - să zicem, un fir de ADN - citind perechile sale de baze succesive pentru a obține măsurători individuale, control și ștergere a comenzilor protocolului. Termodinamica precedentă și analiza informațională se aplică astfel unui astfel de motor molecular - un sistem controlat activ care poate rectifica fluctuațiile, fiind doar temporar, local incompatibil cu Legea a doua.

Să mergem cu un pas mai departe, totuși, pentru a ne imagina o enzimă funcțională care, pe parcursul unui ciclu termodinamic, extrage lucrări nete pozitive dintr-un rezervor de informații pentru a stoca sau elibera energie pe măsură ce asamblează sau dezasamblează un lanț de componente moleculare mici. În acest sens, înlocuim molecula „control” unidimensională cu un set de biți aleatori care intră în echilibru local cu enzima. La fel ca și ei, dinamica enzimei se schimbă pentru a cataliza asamblarea componentelor. Schimbarea permite enzimei să utilizeze selectiv energia dintr-un rezervor, să spunem un mediu bogat în ATP la ale cărui molecule accesează mașina atunci când este necesară energie (ATP → ADP) sau renunțată (ADP → ATP). Figura 9 ilustrează noua mașină moleculară funcțională.

Figura 9. Catalizator de informații: un demon Maxwellian molecular enzimatic se termizează cu o succesiune de biți aleatori (rezervor de informații), fiecare schimbându-și activitatea catalitică pentru a depăși barierele energetice pentru a asambla un lanț de componente moleculare simple. Mediul înconjurător, la temperatură constantă T, furnizează molecule bogate în energie necesare pentru a conduce reacțiile catalizate și moleculele componente ale lanțului (cf. clichetul de informații din [117]). (Versiune online color.)

În acest fel, enzima imaginată acționează ca o catalizator de informații care facilitează, prin alte reacții nefavorabile termodinamic, asamblarea lanțului de componente moleculare. În anii 1940, Leon Brillouin [118] și Norbert Wiener [119], primii pionieri în fizica informației, considerau enzimele doar ca aceste tipuri de catalizatori. În special, Brillouin a propus o „cataliză negativă” destul de similară ca substrat molecular care a generat negentropia - principiul de ordonare pe care Schrödinger l-a identificat ca fiind necesar pentru susținerea proceselor de viață în concordanță cu a doua lege. Abia mult mai târziu, astfel de „molecule informaționale” vor fi susținute de biologii evolutivi John Maynard Smith și Eörs Szathmáry [120].

Recent am analizat termodinamica unei clase de catalizatori de informații memorabile [117] pentru care toate corelațiile dintre componentele sistemului ar putea fi explicate în mod explicit. Acest lucru a dat un tratament analitic exact al modificării informațiilor Shannon relevante termodinamic din rezervorul de informații de intrare (șir de biți cu rata de entropie hμ) la un rezervor de evacuare (șir de biți cu rata de entropie). Rezultatul a fost o a doua lege rafinată și aplicabilă pe scară largă, care explică în mod corespunzător procesarea informației intrinseci reflectată în acumularea corelațiilor temporale. Pe de o parte, rezultatul oferă o limită superioară informațională asupra muncii medii maxime 〈W〉 Extras pe ciclu:

Această a doua lege ne permite să identificăm funcțiile termodinamice ale demonului. În funcție de parametrii modelului, acționează ca un motor, extragerea energiei dintr-un singur rezervor și transformarea ei în lucru (〈W〉 & Gt0) prin randomizarea informațiilor de intrare (hμ′−hμ& gt0), sau ca un radieră de informații, ștergerea informațiilor (hμ′−hμ& lt0) în intrarea la costul intrării externe a muncii (〈W〉 & Lt0). Mai mult, Demon acceptă o funcționalitate contraintuitivă. Spre deosebire de radierele anterioare, care a scăzut doar incertitudinea pe un singur bit H [X0], prezintă un nou tip de radieră care elimină incertitudinile pe mai mulți biți prin adăugarea de corelație (ordinea temporală), în timp ce incertitudinile pe un singur bit sunt de fapt crescute (H ′ [X0] −H [X0] & gt0). Această modalitate duce la o interpretare provocatoare a proceselor vieții: existența Demonilor naturali cu memorie (stări interne) este un semn că aceștia au fost adaptați pentru a influența fluctuațiile corelate temporal în mediul lor.

6. Concluzie

Am parcurs un drum lung de la perspicacitatea lui Schrödinger asupra cristalelor aperiodice. Am susținut, pe mai multe scări destul de diferite de spațiu și timp și mai multe domenii de aplicare distincte, că există o legătură intimă între fizica vieții și înțelegerea bazei informaționale a proceselor biologice atunci când este privită în termeni de materiale complexe constitutive ale vieții. Am remarcat, pe parcurs, legătura strânsă dintre noile tehnici experimentale și noile fundații teoretice - o conexiune necesară pentru a ne înțelege organizarea biologică și procesele. Am susținut importanța structurii și ne-am străduit să arătăm că acum putem vorbi direct și cantitativ despre organizare în materiale dezordonate, o consecință a îndepărtării de vizualizarea cristalelor doar periodice [42,64]. Aceste materiale structurate-dezordonate, în capacitatea lor de a stoca și prelucra informații, probabil au jucat un rol în tranziția de la simple molecule la organizații materiale care au devenit substraturi care susțin biologia [121]. Pentru biologie, desigur, „tulburarea” sa necristalină este mult mai mult, codifică informațiile necesare vieții. Astfel, materia biologică este mai mult decât o „materie moale” umedă și squishy, ​​este o informație. ADN, ARN și proteine ​​sunt molecule de informații [118-120]. Atât de mult încât ADN-ul, de exemplu, poate fi programat [122-124]. Și, într-un mod complementar, paralelele care conduc dezvoltarea noastră aici oferă probabil o perspectivă alternativă asupra „genomicii materiale” [99].

Ceea ce distinge materia biologică de simpla materie fizică este că informațiile din prima codifică organizația și că această organizație preia o funcție catalitică prin interacțiuni într-un mediu divers din punct de vedere structural. Mai mult decât atât și critic, aceste personaje sunt exprimate într-un mod care duce la structuri chimice din ce în ce mai noi, complexe - structuri care se formează în entități cu rate de replicare diferențiale [125]. Și entitățile cu replicare ridicată, la rândul lor, modifică mediul, construind „nișe” care îmbunătățesc replicarea, completând un ciclu termodinamic a cărui dinamică evolutivă pe termen lung este considerată creativă cu durată deschisă.

Am văzut că reflectarea la viziunea lui Schrödinger asupra bazei fizice a vieții a ridicat probleme de ordine, tulburare și structură în materiale unidimensionale. Cristalografia haotică - lipsită de „tirania binevoitoare a cristalului” [126] - a apărut ca o teorie generală pentru organizarea materialelor strânse. A oferit o modalitate consecventă de a descrie, în același timp, ordinea și tulburarea în stivuirea stratului în gheață și compuși aromatici și, în general, în cristale haotice unidimensionale. Și, în acest sens, sugerează un rol pe care îl poate juca (dez) comandarea locală în îmbunătățirea modului în care funcționează sinergic biomoleculele în soluție. Problema funcției biologice ne-a forțat să cercetăm mai profund consecvența acesteia cu cea de-a doua lege a termodinamicii. Ne-am îndreptat apoi spre a analiza două cazuri simple de demoni moleculari maxwellieni pentru a ilustra că a doua lege a termodinamicii este perfect compatibilă cu caracterul informațional și funcționalitatea moleculelor inteligente - că termodinamica poate începe să descrie energia acestor catalizatori informaționali.

Desigur, am abordat doar într-un mod sumar câteva dintre provocările majore pe care le pune o viziune informațională asupra materiei. Shannon a introdus informații ca surpriză și am arătat că acest lucru a dus cu ușurință la a vedea cum informațiile sunt create, stocate și transmise. Totuși, am abordat doar întrebarea permanentă despre modul în care aceste tipuri de informații contribuie la funcționalitatea materială. Motorul Szilard și catalizatorii de informații conexe au sugerat cum vom ajunge să analizăm informațiile funcționale în materiale complexe și biomolecule. Sperăm că perspectiva informațională va fi suficient de fructuoasă pentru a se extinde la analiza modului în care aceste obiecte structurate funcționează în mediile lor - cum, de exemplu, apa joacă un rol critic în interacțiunile și funcțiile biomoleculare.

Notă adăugată în dovadă

S-a adus la cunoștința noastră că recent Cartwright & amp Mackay [42] au speculat că gheața cubică ar putea fi considerată profitabil ca un cristal haotic unidimensional datorită caracterului său dezordonat și aperiodic. Rețineți că le confirmăm suspiciunile și facem exact acest lucru în §4b (i). Mulțumim lui Julyan Cartwright pentru că a subliniat acest lucru. Desigur, predarea noțiunii de cristal haotic este faimosul „cristal turbulent” al lui Ruelle [127], un cristal care rupe simetria translațională și are „o structură modulată într-un mod non-cvasiperiodic”. Se așteaptă ca astfel de cristale să arate o oarecare „neclaritate” în reflexiile ascuțite ale modelului de difracție, precum și împrăștierea difuză și ar fi similare noțiunii de cristal haotic discutat aici. Ne diferențiem eforturile de aceste descrieri anterioare insistând că măsurile și metodele teoretice ale informației și calculului sunt platforma adecvată pentru a cuantifica structurile cristaline dezordonate.


Înregistrează-te pentruSpectrubuletine informative

Acest articol a fost publicat inițial în iunie 2017. A fost revizuit pentru a reflecta cercetări mai recente.

Cercetătorii au știut că genele contribuie la autism încă din anii 1970, când o echipă a descoperit că gemenii identici împart adesea această afecțiune. De atunci, oamenii de știință au acumulat potențiali vinovați genetici în autism, proces pe care tehnologiile de decodare a ADN-ului l-au accelerat în ultimul deceniu.

Pe măsură ce această lucrare a progresat, oamenii de știință au descoperit o varietate de tipuri de modificări genetice care pot sta la baza autismului. Cu cât oamenii de știință sapă mai mult ADN-ul, cu atât contribuția sa la autism pare mai complicată.

Cum știu cercetătorii genele? a contribui la autism?
De la primul studiu al autismului în 1977, mai multe echipe au comparat ratele de autism la gemeni și au arătat că autismul este foarte ereditar. Când o gemenă identică are autism, există aproximativ 80% șanse ca și cealaltă gemenă să o aibă. Rata corespunzătoare pentru gemenii fraterni este de aproximativ 40%.

Cu toate acestea, genetica nu este pe deplin responsabilă de șansele unui copil de a avea autism. Factorii de mediu contribuie, de asemenea, la această afecțiune - deși cercetătorii nu sunt de acord cu privire la contribuțiile relative ale genelor și mediului. Unele influențe ale mediului, cum ar fi expunerea la un răspuns imun matern în uter sau complicații în timpul nașterii, pot lucra cu factori genetici pentru a produce autism sau pentru a-și intensifica trăsăturile.

Există o genă a autismului?
Nu chiar. Există mai multe afecțiuni asociate cu autismul care provin din mutații într-o singură genă, inclusiv sindroamele fragile X și Rett. Dar mai puțin de 1 la sută din cazurile nesindromice de autism provin din mutații ale oricărei gene. Până acum, cel puțin, nu există „gena autismului” - ceea ce înseamnă că nicio genă nu este mutată în mod constant la fiecare persoană cu autism. De asemenea, nu pare să existe nicio genă care să provoace autism de fiecare dată când este mutată.

Totuși, lista genelor implicate în autism este în creștere. Cercetătorii au numărat aproximativ 100 de gene pe care le consideră puternic legate de autism. Multe dintre aceste gene sunt importante pentru comunicarea dintre neuroni sau pentru a controla expresia altor gene.

Cum fac aceste gene a contribui la autism?
Modificările sau mutațiile ADN-ului acestor gene pot duce la autism. Unele mutații afectează o singură pereche de baze ADN sau „literă”. De fapt, toată lumea are mii din aceste variante genetice. O variantă care se găsește la 1 la sută sau mai mult din populație este considerată „comună” și se numește polimorfism cu un singur nucleotid sau SNP.

Variantele comune au de obicei efecte subtile și pot lucra împreună pentru a contribui la autism. Variantele „rare”, care se găsesc la mai puțin de 1% dintre oameni, tind să aibă efecte mai puternice. Multe dintre mutațiile legate de autism până acum au fost rare. Este semnificativ mai dificil să găsești variante comune asociate cu autismul. Cel mai mare studiu realizat până în prezent, publicat în 2019 și care a implicat peste 18.000 de persoane autiste și 27.000 de persoane non-autiste, a dezvăluit 12 regiuni ale genomului care adăpostesc variante comune legate de autism. Două regiuni suplimentare au apărut într-o re-analiză din 2020 a datelor din 2019, împreună cu aproximativ 6.000 de eșantioane suplimentare.

Alte modificări, cunoscute sub numele de variații ale numărului de copii (CNV), apar ca ștergeri sau duplicări ale unor întinderi lungi de ADN și includ deseori multe gene.

Dar mutațiile care contribuie la autism probabil nu sunt toate în gene, care reprezintă mai puțin de 2% din genom. Cercetătorii încearcă să pătrundă în restul de 98 la sută din genom pentru a căuta nereguli asociate cu autismul. Până în prezent, aceste regiuni sunt slab înțelese, dar unele dovezi leagă autismul de mutații din întinderi de ADN necodificat care conțin elemente reglatoare care controlează expresia genelor.

Sunt toti mutații la fel de nocive?
Nu. La nivel molecular, efectele mutațiilor pot diferi, chiar și între SNP-uri. Mutațiile pot fi fie dăunătoare, fie benigne, în funcție de multe celule pe care le afectează în organism și de cât de mult modifică funcția proteinei corespunzătoare. O mutație fără sens, de exemplu, schimbă un aminoacid în proteină cu altul. Dacă substituția nu modifică semnificativ proteina, este probabil să fie benignă. O mutație fără sens, pe de altă parte, introduce un semn „stop” într-o genă, determinând oprirea prematură a producției de proteine. Proteina rezultată este prea scurtă și funcționează slab, dacă este deloc.

Cum fac oamenii dobândi mutații?
Majoritatea mutațiilor sunt moștenite de la părinți și pot fi comune sau rare. Mutațiile pot apărea, de asemenea, în mod spontan într-un ovul sau în spermatozoizi, și astfel se găsesc numai la copil și nu la părinți. Cercetătorii pot găsi aceste rarede novoMutații prin compararea secvențelor ADN ale persoanelor care au autism cu cele ale membrilor familiei lor neafectate. Mutațiile spontane care apar după concepție sunt de obicei „mozaic”, ceea ce înseamnă că afectează doar unele dintre celulele din corp. Cu cât aceste mutații afectează mai puține celule, cu atât contribuțiile lor la trăsăturile autismului sunt mai mici.

Poate genetica să explice de ce sunt mai probabil băieții decât fetele sa ai autism?
Poate. Fetele cu autism par să aibă mai multe mutații decât băieții cu această afecțiune. Și băieții cu autism își moștenesc uneori mutațiile de la mame neafectate. Împreună, aceste rezultate sugerează că fetele pot fi cumva rezistente la mutații care contribuie la autism și au nevoie de un impact genetic mai mare pentru a avea această afecțiune.

Există vreo modalitate de a testa mutațiile înainte ca un copil să se nască?
Clinicienii examinează în mod obișnuit cromozomii unui copil în curs de dezvoltare pentru a identifica anomalii cromozomiale mari, inclusiv CNV. Există teste genetice prenatale pentru unele sindroame asociate cu autismul, cum ar fi sindromul X fragil. Dar chiar dacă un bebeluș în curs de dezvoltare are aceste mutații rare, nu există nicio modalitate de a ști cu certitudine dacă ulterior va fi diagnosticat cu autism.


Ce este genotipul? Ce este fenotipul?

Genotipul dvs. este identitatea dvs. genetică complet ereditară, este genomul vostru unic care ar fi dezvăluit prin secvențierea genomului personal. Cu toate acestea, cuvântul genotip se poate referi și la o anumită genă sau la un set de gene purtate de un individ. De exemplu, dacă aveți o mutație legată de diabet, vă puteți referi la genotipul dvs. doar cu privire la această mutație, fără a lua în considerare toate celelalte variante genetice pe care le aveți.

În schimb, fenotipul dvs. este o descriere a caracteristicilor dvs. fizice reale. Aceasta include caracteristici vizibile directe, cum ar fi înălțimea și culoarea ochilor, dar și starea generală de sănătate, istoricul bolii și chiar comportamentul și dispoziția generală. Te ingrasi usor? Ești neliniștit sau calm? Iti plac pisicile? Toate acestea sunt moduri în care vă prezentați lumii și, ca atare, sunt considerate fenotipuri. Cu toate acestea, nu toate fenotipurile sunt un rezultat direct al genotipului dvs. Șansele sunt ca dispoziția dvs. personală față de pisici să fie rezultatul experienței vieții voastre cu animalele de companie, mai degrabă decât o mutație într-o genă ipotetică a crescătorilor de pisici.

Majoritatea fenotipurilor sunt influențate atât de genotipul vostru, cât și de circumstanțele unice în care v-ați trăit viața, inclusiv tot ce vi s-a întâmplat vreodată. De multe ori ne referim la aceste două intrări ca „natură”, genomul unic pe care îl purtați și „hrăniți”, mediul în care v-ați trăit viața.


Referințe

Ferlay, J. și colab. Incidența și mortalitatea cancerului la nivel mondial: surse, metode și tipare majore în GLOBOCAN 2012. Jurnalul internațional al cancerului (2015).

Organizația Mondială a Sănătății. Cele mai recente date la nivel mondial privind cancerul: povara cancerului crește la 18,1 milioane de cazuri noi și 9,6 milioane de decese cauzate de cancer în 2018. Agenția Internațională pentru Cercetarea Cancerului (2018).

Janssen-Heijnen, M. L. și amp Coebergh, J.-W. W. Tendințe în incidența și prognosticul subtipurilor histologice ale cancerului pulmonar în America de Nord, Australia, Noua Zeelandă și Europa. Cancer de plamani 31, 123–137 (2001).

Rose-James, A. & amp Tt, S. Markeri moleculari cu relevanță predictivă și prognostică în cancerul pulmonar. Lung Cancer International (2012).

Jorge, S. E., Kobayashi, S. S. & amp Costa, D. B. Mutații ale receptorului factorului de creștere epidermică (EGFR) în cancerul pulmonar: date preclinice și clinice (2014).

Harrison, P. T., Vyse, S. & amp Huang, P. H. Mutații rare ale receptorului factorului de creștere epidermică (EGFR) în cancerul pulmonar cu celule mici. Seminarii în biologia cancerului 1-13 (2019).

Ferrer, I. și colab. KRAS-Cancer pulmonar cu celule mici, mutante: de la biologie la terapie (2018).

Zhang, S. M. și colab. Valoarea prognostică a EGFR și KRAS în cancerul pulmonar fără celule mici rezecate: o analiză sistematică și meta-analiză. Managementul și cercetarea cancerului (2018).

Fang, S. și amp Wang, Z. Mutațiile EGFR ca marker prognostic și predictiv în cancerul pulmonar cu celule mici (2014).

Martin, P., Leighl, N. B., Tsao, M. S. & amp Shepherd, F. A. Mutațiile KRAS ca markeri prognostici și predictivi în cancerul pulmonar cu celule mici (2013).

Planchard, D. și colab. Cancerul pulmonar metastatic cu celule mici: Ghiduri de practică clinică ESMO pentru diagnostic, tratament și urmărire. Analele de oncologie (2018).

Lynch, T. J. și colab. Activarea mutațiilor în receptorul factorului de creștere epidermică care stă la baza reacției cancerului pulmonar cu celule mici la Gefitinib. New England Journal of Medicine (2004).

Paez, J. G. și colab. Mutații EGFR în plămâni, cancer: corelație cu răspunsul clinic la terapia cu gefitinib. Ştiinţă (2004).

Pao, W. și colab. Mutațiile genei receptorilor EGF sunt frecvente în cancerele pulmonare de la „niciodată fumători” și sunt asociate cu sensibilitatea tumorilor la gefitinib și erlotinib. Lucrările Academiei Naționale de Științe din Statele Unite ale Americii (2004).

Schrank, Z. și colab. Terapiile actuale cu țintă moleculară în NSCLC și mecanismul lor de rezistență (2018).

Zhao, W. și colab. Către predicția automată a stării mutației EGFR în adenocarcinomul pulmonar cu învățare profundă 3D. Medicina cancerului (2019).

Tomasini, P., Walia, P., Labbe, C., Jao, K. și amp Leighl, N. B. Direcționarea căii KRAS în cancerul pulmonar cu celule mici. Oncologul (2016).

Canon, J. și colab. Inhibitorul clinic KRAS (G12C) AMG 510 determină imunitatea anti-tumorală. Natură (2019).

Fakih, M. și colab. Studiu de fază 1 care evaluează siguranța, tolerabilitatea, farmacocinetica (PK) și eficacitatea AMG 510, un inhibitor nou al moleculei mici KRAS G12C, în tumorile solide avansate. Jurnalul de Oncologie Clinică (2019).

Adderley, H., Blackhall, F. H. & amp Lindsay, C. R. Cancerul pulmonar cu celule non-mutante KRAS-mutant: convergerea moleculelor mici și inhibarea punctului de control imun. EBioMedicine 41, P711–716 (2019).

Mullard, A. Cracare KRAS. Nature Reviews Drug Discovery (2019).

Folch, E., Costa, D. B., Wright, J. & amp VanderLaan, P. A. Diagnosticul și stadializarea cancerului pulmonar în vârsta minim invazivă, cu cereri crescânde de analiză a țesuturilor (2015).

Jain, E. & amp Roy-Chowdhuri, S. Patologia moleculară a specimenelor de citologie a cancerului pulmonar o analiză concisă (2018).

Cai, L. L. și amp Wang, J. Biopsie lichidă pentru imunoterapia cancerului pulmonar (Recenzie) (2019).

Rizzo, S. și colab. Caracterizarea radiogenomică CT a mutațiilor EGFR, K-RAS și ALK în cancerul pulmonar cu celule mici. Radiologie europeană (2016).

Bakr, S. și colab. Un set de date radiogenomic al cancerului pulmonar cu celule mici. Date științifice 5, 180202 (2018).

Bodalal, Z., Trebeschi, S., Nguyen-Kim, T. D. L., Schats, W. & amp Beets-Tan, R. Radiogenomics: bridging imaging and genomics (2019).

Digumarthy, S. R., Padole, A. M., Gullo, R. L., Sequist, L. V. & amp Kalra, M. K. Poate ct analiza radiomică în nsclc să prezică histologia și starea mutației egfr? Medicament 98 (2019).

Mei, D., Luo, Y., Wang, Y. & amp Gong, J. Ct analiza texturii adenocarcinomului pulmonar: caracteristicile radiomice pot fi biomarkeri surogat pentru stările de mutație egfr. Imagistica cancerului 18, 52 (2018).

Liu, Y. și colab. Caracteristicile radiomice sunt asociate cu starea mutației egfr în adenocarcinoamele pulmonare. Cancerul pulmonar clinic 17, 441–448 (2016).

Wang, S. și colab. Predicția stării mutației EGFR în adenocarcinomul pulmonar pe imaginea tomografiei computerizate utilizând învățarea profundă. European Respiratory Journal (2019).

Gevaert, O. și colab. Modelarea radiogenomică predictivă a stării mutației egfr în cancerul pulmonar. Rapoarte științifice 7, 41674 (2017).

Dias, C., Pinheiro, G., Cunha, A. & amp Oliveira, H. P. Radiogenomică: Gene legate de cancerul pulmonar Predicția stării mutației. În IbPRIA 2019: a 9-a conferință iberică privind recunoașterea modelelor și analiza imaginii (2019).

Clark, K. și colab. Arhiva de imagistică a cancerului (tcia): Menținerea și operarea unui depozit de informații publice. Journal of Digital Imaging 26, 1045–1057 (2013).

Gevaert, O. și colab. Cancerul pulmonar cu celule mici: identificarea biomarkerilor de imagistică prognostică prin utilizarea datelor microarray de exprimare a genei publice - Metode și rezultate preliminare. Radiologie (2012).

Shen, S., Han, S. X., Bui, A. A. și amp Hsu, W.O rețea neuronală convoluțională semantică ierarhică profundă interpretabilă pentru clasificarea malignității nodulilor pulmonari. Sisteme expert cu aplicații (2019).

Mei, D., Luo, Y., Wang, Y. & amp Gong, J. Analiza texturii CT a adenocarcinomului pulmonar: Caracteristicile radiomice pot fi biomarkeri surogat pentru stările de mutație EGFR. Imagistica cancerului (2018).

Papadopoulou, E. și colab. Determinarea stării mutaționale egfr și kras la pacienții greci cu cancer pulmonar cu celule mici. Scrisori oncologice 10, 2176–2184 (2015).

Varghese, A. M. și colab. Plămânii nu uită: compararea profilului de mutație kras și egfr și supraviețuirea fumătorilor colegi și niciodată a fumătorilor cu cancer pulmonar avansat. Jurnalul de Oncologie Toracică 8, 123–125 (2013).

Dogan, S. și colab. Epidemiologia moleculară a mutațiilor egfr și kras în 3.026 adenocarcinoame pulmonare: susceptibilitate mai mare a femeilor la cancerele de tip mutant kras legate de fumat. Cercetarea clinică a cancerului 18, 6169–6177 (2012).

Yip, S. S. și colab. Asocieri între mutații somatice și fenotipuri de imagistică metabolică în cancerul pulmonar cu celule mici. Journal of Nuclear Medicine (2017).

Yip, S. S. și colab. Impactul proiectării experimentale asupra radiomicii PET în prezicerea stării de mutație somatică. Jurnalul European de Radiologie (2017).

Zhang, H., Cai, W., Wang, Y., Liao, M. & amp Tian, ​​S. CT și caracteristici clinice care prezic riscul mutației EGFR în cancerul pulmonar cu celule mici: o revizuire sistematică și meta-analiză. Jurnalul internațional de oncologie clinică (2019).

Hosny, A. și colab. Învățare profundă pentru prognosticul cancerului pulmonar: un studiu retrospectiv de radiomică multi-cohortă. Medicina PLoS (2018).

Wilson, R. & amp Devaraj, A. Radiomica nodulilor pulmonari și a cancerului pulmonar (2017).

Yamashita, R., Nishio, M., Kinh, R., Do, G. & amp Togashi, K. Rețele neuronale convoluționale: o privire de ansamblu și o aplicație în radiologie. Insights Imaging 9, 611–629 (2018).

Davidson, M. R., Gazdar, A. F. & amp Clarke, B. E. Rolul pivot al patologiei în gestionarea cancerului pulmonar (2013).

Doshi, J. A., Hendrick, F. B., Graff, J. S. & amp Stuart, B. C. Data, Data Everywhere, But Access Rămâne o mare problemă pentru cercetători: o revizuire a politicilor de acces pentru datele de îngrijire a sănătății la nivel de pacient finanțate public. eGEMs (Generarea de dovezi și metode de amplificare pentru a îmbunătăți rezultatele pacienților) (2016).

Kahn, C. E., Carrino, J. A., Flynn, M. J., Peck, D. J. & amp Horii, S. C. Dicom și radiologie: trecut, prezent și viitor. Jurnalul Colegiului American de Radiologie 4, 652–657 (2007).

Bakr, S. și colab. Descriptor de date: Un set de date radiogenomic al cancerului pulmonar cu celule mici. Date științifice (2018).

Kalra, A. Dezvoltarea de modele umane fe din imagini medicale. În Yang, K.-H. (ed.) Metoda elementelor finite de bază aplicată biomecanicii lezării (2018).

Bolliger, S. A., Oesterhelweg, L., Spendlove, D., Ross, S. & amp Thali, M. J. Este posibilă diferențierea corpurilor străine întâlnite frecvent în cadavre prin măsurarea densității hounsfield? Revista de științe criminalistice 54, 1119–1122 (2009).

Van Griethuysen, J. J. și colab. Sistem computerizat de radiomică pentru decodarea fenotipului radiografic. Cercetarea cancerului 77, e104 – e107 (2017).

Prochazka, A., Grafova, L., Vyšata, O. & amp Caregroup, N. Transformare de undă tridimensională în procesarea volumului biomedical multidimensional. În Proc. al Conferinței internaționale IASTED despre grafică și realitate virtuală, Cambridge, 263–268 (2011).

Fotin, S. V., Reeves, A. P., Biancardi, A. M., Yankelevitz, D. F. & amp Henschke, C. I. O laplaciană multicanală a abordării de filtrare gaussiană pentru detectarea automatizată a nodulilor pulmonari de la scanări CT cu doze mici în plămâni. În Imagistica medicală 2009: Diagnostic asistat de computer, vol. 7260, 72601Q (International Society for Optics and Photonics, 2009).

Hansell, D. M. și colab. Societatea Fleischner: glosar de termeni pentru imagistica toracică. Radiologie 246, 697–722 (2008).

Abdi, H. și Williams, L. J. Analiza componentelor principale. În Enciclopedia Biometriei (2009).

Maaten, L. v. D. & amp Hinton, G. Vizualizarea datelor folosind t-sne. Jurnal de cercetare de învățare automată 9, 2579–2605 (2008).

Chawla, N. V., Bowyer, K. W., Hall, L. O. & amp Kegelmeyer, W. P. Smote: tehnică de supra-eșantionare a minorității sintetice. Jurnal de cercetare a inteligenței artificiale 16, 321–357 (2002).

Chen, T. și amp Guestrin, C. XGBoost: un sistem scalabil de creștere a copacilor. În Lucrările Conferinței internaționale ACM SIGKDD privind descoperirea cunoștințelor și extragerea datelor (2016).

Nishio, M. și colab. Diagnosticul computerizat al nodulului pulmonar utilizând gradient tree boosting și optimizarea bayesiană. Plus unu (2018).

Zhang, X. și colab. Identificarea ARN-urilor lungi necodificate legate de cancer folosind XGBoost cu o precizie ridicată. Față. Genet. 10, 1–14 (2019).


Priveste filmarea: SUNETUL SI LITERA P (Decembrie 2021).