Informație

Câte proteine ​​sunt în proteomul Pământului?


Numai oamenii au mii de proteine. Având în vedere acest lucru, se pare că numărul total de proteine ​​dintre toate speciile ar fi foarte mare.

Există estimări disponibile pentru câte proteine ​​există pe pământ în toate organismele? Aș fi, de asemenea, interesat de câte dintre acestea sunt proteine ​​unice, spre deosebire de proteinele care sunt foarte asemănătoare cu alte proteine, adică o estimare a proteinelor non-redundante alături de proteinele redundante.


Înregistrări curente

Potrivit Uniprot, există 85.381.808 înregistrări de proteine ​​și cu filtrul UniRef90 (adică eliminarea înregistrărilor care pot fi reprezentate de o intrare cu cel puțin 90% similaritate de secvență), există 42,424,511. Cu toate acestea, aceste baze de date sunt ținte în mișcare și se vor schimba în timp. Vom secvența mai multe specii, vom găsi noi izoforme de îmbinare și diverse alte metode vor extinde bazele de date. Într-adevăr, bazele de date vor fi trunchiate și din când în când, deoarece unele proteine ​​ipotetice se pot baza pe gene care se dovedesc a nu codifica proteinele până la urmă.

În 2007, un studiu a estimat că proteomul pământului va conține aproximativ 5 milioane de secvențe și că majoritatea acestora ar fi elucidate până în 2012. Bănuiesc că acesta este un studiu foarte amănunțit, cu toate acestea, s-au schimbat multe în ultimii 10 ani. Această estimare este de fapt mai mică decât cele aproape 9 milioane de specii estimate în studii mai recente.

Estimare aproximativă

Deci, hai să facem o parte din matematica din plic. Să presupunem că articolul care estimează aproape 9 milioane de specii este cam corect și că am catalogat doar aproximativ 1,2 milioane. Dar UniProt nu este nici măcar aproape de acest număr. UniProt conține 25477 nume științifice în vocabularul controlat. Deci, pentru 25 de mii de nume, avem 85 de milioane de înregistrări de proteine. Dacă am avea 8,75 milioane de nume? Sa presupunem:

$ frac {Predected ~ Proteins} {Predected ~ Species} = frac {Known ~ Proteins} {Known ~ Species} $

Putem rearanja acest lucru pentru a:

$ frac {Predict ~ Species ~ times ~ {Known ~ Proteins}} {Known ~ Species} = Predict ~ Proteine ​​$

Estimare generoasă (Uniprot, 335527 proteine ​​per specie):

$ frac {8750000 times {85381808}} {25477} = 2.932413e ^ {+ 10} $

Estimare conservatoare (Swissprot, 41 de proteine ​​pe specie):

$ frac {8750000 times {554241}} {13408} = 3.616952e ^ {+ 7} $

Din motive de completitudine, să presupunem că numărul de proteine ​​identice cu <90% va rămâne în jur de jumătate din valoarea respectivă. Putem spune că ar putea exista în jurul $ 1,8e ^ {+ 7} $ la $ 1,5 {e} ^ {+ 10} $ proteine ​​„unice”, mai puțin de un trilion ($ 1e ^ {+ 12} $). Având în vedere absurdul de generos de 335 de mii de proteine ​​și foarte zgârcit de 41 de proteine ​​pe specie, putem fi destul de siguri că, dacă există într-adevăr 8,75 milioane de specii, numărul proteinelor se va încadra între aceste estimări.

Cea mai mare presupunere aici este că proteinele au o relație liniară cu speciile, ceea ce este puțin probabil să fie cazul și, la o estimare generoasă, ne prefacem că nu există proteine ​​în UniProt care să nu aibă adnotări de specii. În ceea ce privește Swissprot, aceasta include doar proteinele care au fost curate manual, astfel încât aceasta ignoră multe proteine ​​care sunt sigure de presupus că există și acoperă de obicei numai proteinele care sunt de interes pentru oamenii de știință.


O corecție minoră la întrebarea dvs., UniProt listează aproximativ 20 de mii de gene care codifică proteine ​​în proteomul uman, nu milioane. Aceste gene care codifică proteinele sunt supuse diferitelor modificări post-translaționale și splicingului izoformului, deci vor exista mai multe proteine ​​finale decât 20k.


Cum se construiește o fabrică de proteine

Complexitatea structurilor moleculare din celulă este uimitoare. După ce au obținut un mare succes în elucidarea acestor structuri în ultimii ani, biologii își asumă acum următoarea provocare: să afle mai multe despre cum sunt construite. Un nou proiect de cercetare oferă acum informații despre un proces de construcție foarte neobișnuit în parazitul unicelular Trypanosoma brucei.

Celulele constau dintr-o multitudine de structuri moleculare, unele dintre ele prezentând o complexitate uluitoare. Ribozomii, fabricile de proteine ​​ale celulei, aparțin celor mai mari și mai sofisticate complexe și sunt alcătuite din ARN, precum și dintr-un număr mare de proteine. Ele există în fiecare ființă vie și sunt considerate una dintre mașinile celulare care s-a schimbat cel mai puțin în toate etapele evoluției. Dar există excepții: în mitocondrii, organitele celulare care servesc drept centrale electrice, ribozomii arată considerabil diferit.

Un utilaj extins

Oamenii de știință nu sunt interesați doar de structura și funcția unor astfel de ribozomi, ci și de „procesul de construcție” - cum gestionează celulele asamblarea acestor structuri complexe? Și în ce diferă aceste metode de construcție pentru diferite structuri? Este clar că este nevoie de un utilaj celular extins pentru a garanta o asamblare lină a tuturor cărămizilor de construcție. Acest utilaj celular responsabil pentru asamblarea ribozomilor în mitocondrii nu a fost încă descris. Acum, cercetătorii din grupul Andr & eacute Schneider de la Universitatea din Berna și din grupul Nenad Ban din ETH Zurich, au investigat procesul de asamblare a ribozomului mitocondrial folosind parazitul unicelular Trypanosoma brucei. Ei au fost capabili să urmărească procesul de construcție și să identifice mașinile celulare asociate dedicate asamblării acestor mitoribozomi. Deoarece T. brucei provoacă boli greu de tratat, inclusiv boala somnului, rezultatele ar putea duce la noi terapii. Proiectul a fost posibil de către Centrul Național de Competență în Cercetare „ARN & amp Disease”, care studiază rolul ARN-ului în mecanismele bolii. Descoperirile au fost publicate acum în „Ştiinţă."

Elemente necunoscute în „afacerea cu construcțiile”

Parazitul Trypanosoma brucei a fost folosit ca sistem model, deoarece mitoribozomii săi sunt deosebit de complecși și, prin urmare, este posibil să necesite multe etape de asamblare. Cercetătorii ar putea urma toți acești pași în detaliu. „Am găsit diferențe fascinante”, spune Moritz Niemann de la Departamentul de Chimie și Biochimie al Universității din Berna, coautor. În ribozomii mitocondriale ARN-ul poate fi considerat oțelul din betonul armat, în timp ce în alți ribozomi poate fi considerat că joacă un rol structural cheie ca în structurile pe bază de fier, cum ar fi Turnul Eiffel. Analiza a arătat că asamblarea mitoribozomilor în T. brucei are loc prin formarea mai multor intermediari de asamblare. De asemenea, implică un număr mare de proteine ​​care formează o imensă schelă adaptativă în jurul mitoribozomului emergent, care nu este prezent în structura finalizată. Martin Saurer de la Departamentul de Biologie al ETH Zurich și primul autor, spune că multe dintre aceste proteine ​​erau necunoscute în „afacerea cu construcțiile”. „Microscopia crio-electronică nu ne permite doar să vizualizăm complexe cunoscute, ci și să descoperim și să descriem un întreg proces celular: șantierul de construcție și mașinile implicate în asamblarea ribozomilor mitocondriale”, adaugă el. Moritz Niemann a fost nedumerit în special de efortul enorm pe care celula îl depune în acest sens: Până la un sfert din toate proteinele din mitocondrie sunt componente ale mitoribozomilor sau sunt necesare pentru a le construi.

O mai bună înțelegere duce la noi terapii

Deoarece mai multe dintre proteinele de asamblare au aspect similar în alte organisme, cercetătorii consideră că datele obținute oferă informații generale pentru o mai bună înțelegere a maturizării ribozomale în toate organismele. Și pentru că toate aceste proteine ​​sunt esențiale pentru funcționarea celulei, aceste descoperiri ar putea fi utile pentru dezvoltarea terapiilor împotriva T. brucei și a paraziților asociați care cauzează multe boli devastatoare la oameni și animale.


Câte proteine ​​sunt în proteomul Pământului? - Biologie

Figura 1: Galerie de proteine. Exemple reprezentative de mărime a proteinelor sunt prezentate cu exemple desenate pentru a ilustra unele dintre rolurile funcționale cheie pe care le iau. Toate proteinele din figură sunt prezentate pe aceeași scară pentru a da o impresie a dimensiunilor lor relative. Micile obiecte roșii prezentate pe unele dintre molecule sunt substraturile proteinei de interes. De exemplu, în hexokinază, substratul este glucoza. Se știe că mânerul din ATP sintază există, dar structura exactă nu a fost disponibilă și, astfel, a fost desenată doar schematic. Numele dintre paranteze sunt ID-urile intrărilor structurii bazei de date PDB. (Figura oferită de David Goodsell).

Proteinele sunt adesea denumite cai de lucru ale celulei. O impresie a dimensiunilor relative ale acestor diferite mașini moleculare poate fi obținută din galeria prezentată în Figura 1. Un exemplu preferat este oferit de proteina Rubisco prezentată în figura care este responsabilă pentru fixarea carbonului atmosferic, construind literalmente biosfera din subțire. aer. Această moleculă, una dintre cele mai abundente proteine ​​de pe Pământ, este responsabilă pentru extragerea a aproximativ o sută de gigatoni de carbon din atmosferă în fiecare an. Aceasta este de aproximativ 10 ori mai mult decât toate emisiile de dioxid de carbon produse de omenire de la țevile de eșapament ale mașinilor, motoarele cu reacție, centralele electrice și toate celelalte tehnologii ale noastre cu combustibili fosili. Cu toate acestea, nivelurile de carbon continuă să crească la nivel global la rate alarmante, deoarece acest carbon fix este reemis ulterior în procese precum respirația, etc. Această fixare chimică este realizată de aceste molecule Rubisco cu o masă monomerică de 55 kDa care fixează CO2 pe rând, cu fiecare CO2 cu o masă de 0,044 kDa (doar un alt mod de scriere 44 Da care clarifică raportul de masă 1000: 1). Pentru un alt jucător dominant din biosfera noastră, luați în considerare ATP sintaza (MW≈500-600 kDa, BNID 106276), prezentată și în Figura 1, care decorează membranele noastre mitocondriale și este responsabilă pentru sintetizarea moleculelor ATP (MW = 507 Da) care alimentează o mare parte din chimia celulei. Aceste fabrici moleculare produc atât de multe molecule de ATP încât toate ATP-urile produse de mitocondrii într-un corp uman într-o zi ar avea aproape la fel de multă masă ca și corpul în sine. După cum discutăm în vinietă despre „Care este timpul de rotație al metaboliților?” cifra de afaceri rapidă face acest lucru mai puțin probabil decât pare.

Figura 2: O galerie de homooligomeri care arată frumoasa simetrie a acestor complexe proteice comune. Evidențiate în roz sunt subunitățile monomerice care alcătuiesc fiecare oligomer. Figura de David Goodsell.

Mărimea proteinelor precum Rubisco și ATP sintaza și multe altele pot fi măsurate atât din punct de vedere geometric, în ceea ce privește cât spațiu ocupă, cât și din punct de vedere al dimensiunii secvenței lor, determinată de numărul de aminoacizi care sunt strânși împreună pentru a face proteina. . Având în vedere că aminoacidul mediu are o masă moleculară de 100 Da, putem converti cu ușurință între masă și lungimea secvenței. De exemplu, monomerul Rubisco de 55 kDa are aproximativ 500 de aminoacizi care alcătuiesc lanțul său polipeptidic. Extinderea spațială a proteinelor solubile și dimensiunea secvenței lor prezintă adesea o proprietate de scalare aproximativă în care volumul se scalează liniar cu dimensiunea secvenței și, astfel, razele sau diametrele tind să se scaleze ca dimensiunea secvenței la puterea 1/3. O regulă simplă pentru gândirea la proteinele solubile tipice, cum ar fi monomerul Rubisco, este că acestea au un diametru de 3-6 nm, așa cum este ilustrat în Figura 1, care arată nu numai Rubisco, ci și multe alte proteine ​​importante care fac ca celulele să funcționeze. În aproximativ jumătate din cazuri, rezultă că proteinele funcționează atunci când mai multe copii identice sunt legate simetric între ele, așa cum se arată în Figura 2. Acestea sunt numite homo-oligomeri pentru a le diferenția de cazurile în care diferite subunități proteice sunt legate împreună formând astfel numiți hetero-oligomeri. Cele mai frecvente stări sunt dimerul și tetramerul (și monomerii neoligomerici). Homo-oligomerii sunt de aproximativ două ori mai frecvenți decât hetero-oligomerii (BNID 109185).

Există o diferență de dimensiuni adesea surprinzătoare între o enzimă și substraturile pe care lucrează. De exemplu, în căile metabolice, substraturile sunt metaboliți care au de obicei o masă mai mică de 500 Da, în timp ce enzimele corespunzătoare sunt de obicei de aproximativ 100 de ori mai grele. În calea glicolizei, moleculele mici de zahăr sunt procesate pentru a extrage atât energie, cât și blocuri de construcție pentru biosinteză ulterioară. Această cale este caracterizată de o serie de mașini de proteine, toate fiind mult mai mari decât substraturile lor de zahăr, cu exemple prezentate în colțul din dreapta jos al figurii 1, unde vedem dimensiunea relativă a substraturilor indicate în roșu atunci când interacționează cu enzimele lor. .

Figura 3: Distribuția lungimilor proteinelor în E. coli, drojdie în devenire și celule HeLa umane. (A) Lungimea proteinei este calculată în aminoacizi (AA), pe baza secvențelor de codare din genom. (B) Distribuțiile sunt trasate după ponderarea fiecărei gene cu numărul de copii proteice deduse din studiile proteomice din spectrometrie de masă (M. Heinemann în presă, M9 + glucoză LMF de Godoy și colab. Nature 455: 1251, 2008, mediu definit T. Geiger și 2008 al., Mol. Cell Proteomics 11: M111.014050, 2012). Liniile continue sunt estimări ale densității miezului Gauss pentru distribuțiile care servesc drept ghid pentru ochi.

Tabelul 1: Lungimea medie a secvențelor de codificare a proteinelor pe baza genomului diferitelor specii. Intrările din acest tabel se bazează pe o analiză bioinformatică realizată de L. Brocchieri și S. Karlin, Nuc. Acizi. Res., 33: 3390, 2005, BNID 106444. Așa cum s-a discutat în text, propunem o metrică alternativă care ponderează proteinele prin abundența lor, așa cum a fost dezvăluit în recensămintele recente ale specificațiilor de masă la nivel proteomic. Rezultatele nu sunt foarte diferite de intrările din acest tabel, eucariotele fiind în medie de aproximativ 400 aa lungime și bacteriile de aproximativ 300 aa lungime.

Valorile concrete pentru lungimea mediană a genei pot fi calculate din secvențe de genom ca exercițiu bioinformatic. Tabelul 1 raportează aceste valori pentru diferite organisme care arată o tendință către secvențe mai lungi de codificare a proteinelor atunci când se trece de la organisme unicelulare la organisme multicelulare. În Figura 3 mergem dincolo de dimensiunile medii ale proteinelor pentru a caracteriza distribuția completă a lungimilor secvenței de codificare pe genom, raportând valori pentru trei organisme model. Dacă scopul nostru a fost să aflăm despre spectrul dimensiunilor proteinelor, această definiție bazată pe lungimea genomică ar putea fi suficientă. Dar când vrem să înțelegem investiția în resurse celulare care intră în sinteza proteinelor sau să prezicem lungimea medie a unei proteine ​​aleasă aleatoriu din celulă, pledăm pentru o definiție alternativă, care a devenit posibilă datorită recensămintelor recente la nivel proteomic. Pentru aceste tipuri de întrebări, proteinelor cele mai abundente ar trebui să li se acorde o greutate statistică mai mare în calcularea lungimii preconizate a proteinelor. Astfel, calculăm distribuția ponderată a lungimilor proteinelor prezentate în Figura 3, oferind fiecărei proteine ​​o greutate proporțională cu numărul său de copii. Această distribuție reprezintă lungimea așteptată a unei proteine ​​pescuite aleatoriu din celulă, mai degrabă decât pescuită aleatoriu din genom. Distribuțiile care apar din această abordare centrată pe proteom depind de condițiile specifice de creștere ale celulei. În această carte, am ales să folosim, ca regulă simplă, lungimea proteinei „tipice” în procariote ≈300 aa și în eucariote ≈400 aa. Distribuțiile din Figura 3 arată că aceasta este o estimare rezonabilă, deși ar putea fi o supraestimare în unele cazuri.

Unul dintre farmecele biologiei este că evoluția necesită elemente funcționale foarte diverse, creând valori aberante în aproape orice proprietate (care este, de asemenea, motivul pentru care am discutat medianele și nu mediile de mai sus). Când vine vorba de mărimea proteinelor, titina este o excepție. Titina este o proteină multifuncțională care se comportă ca un izvor neliniar în mușchii umani, cu numeroasele sale domenii care se desfășoară și se îndoiesc în prezența forțelor și conferă mușchilor elasticitatea lor. Titina este de aproximativ 100 de ori mai lungă decât proteina medie cu lanțul său polipeptidic de 33.423 aa (BNID 101653). Identificarea celor mai mici proteine ​​din genom este încă controversată, dar sunt frecvente proteinele ribozomale scurte de aproximativ 100 aa.

Este foarte obișnuit să utilizați etichetarea GFP a proteinelor pentru a studia totul, de la localizarea lor până la interacțiunile lor. Înarmați cu cunoașterea dimensiunii caracteristice a unei proteine, suntem acum pregătiți să revizuim actul aparent inofensiv de etichetare a unei proteine. GFP are o lungime de 238 de aa, compus dintr-un butoi beta în cadrul căruia aminoacizii cheie formează cromoforul fluorescent așa cum sa discutat în vinetă despre „Care este timpul de maturare pentru proteinele fluorescente?”. Ca rezultat, pentru multe proteine, actul de etichetare ar trebui să fie considerat cu adevărat crearea unui complex proteic care este acum de două ori mai mare decât proteina originală neperturbată.


Ce este o proteină? Un biolog explică

Doar 20 de aminoacizi pentru lanțuri în diverse combinații pentru a crea miile de soiuri de proteine ​​din corpul nostru. Credit: David Goodsell / ProteinDatabase, CC BY-SA

Nota editorului: Nathan Ahlgren este profesor de biologie la Universitatea Clark. În acest interviu, el explică exact ce sunt proteinele, cum sunt fabricate și marea varietate de funcții pe care le îndeplinesc în corpul uman.

O proteină este o structură de bază care se găsește în toată viața. Este o moleculă. Iar elementul cheie al unei proteine ​​este că este alcătuit din componente mai mici, numite aminoacizi. Îmi place să mă gândesc la ele ca la un șir de mărgele de diferite culori. Fiecare margelă ar reprezenta un aminoacid, care sunt molecule mai mici care conțin atomi de carbon, oxigen, hidrogen și uneori sulf. Deci, o proteină este în esență un șir care este format din acești aminoacizi individuali. Există 22 de aminoacizi diferiți pe care îi puteți combina în orice fel.

O proteină nu există de obicei ca un șir, dar de fapt se pliază într-o anumită formă, în funcție de ordinea și de modul în care acești aminoacizi interacționează împreună. Această formă influențează ceea ce face proteina în corpul nostru.

De unde vin aminoacizii?

Aminoacizii din corpul nostru provin din alimentele pe care le consumăm. Le facem și în corpul nostru. De exemplu, alte animale produc proteine ​​și noi le mâncăm. Corpurile noastre iau acel lanț și îl descompun în aminoacizi individuali. Apoi le poate reface în orice proteină de care avem nevoie.

Odată ce proteinele sunt descompuse în aminoacizi în sistemul digestiv, ele sunt duse la celulele noastre și plutesc în interiorul celulei, ca acele mici mărgele individuale în analogia noastră. Și apoi în interiorul celulei, corpul tău le leagă practic pentru a produce proteinele pe care corpul tău trebuie să le producă.

Putem produce singuri aproximativ jumătate din aminoacizii de care avem nevoie, dar trebuie să-i obținem pe ceilalți din mâncarea noastră.

Ce fac proteinele în corpul nostru?

Oamenii de știință nu sunt tocmai siguri, dar majoritatea sunt de acord că există în jur de 20.000 de proteine ​​diferite în corpul nostru. Unele studii sugerează că ar putea exista și mai multe. Acestea îndeplinesc o varietate de funcții, de la efectuarea unor conversii metabolice la menținerea celulelor împreună până la determinarea funcționării mușchilor.

Funcțiile lor se încadrează în câteva categorii largi. Unul este structural. Corpul dvs. este alcătuit din mai multe tipuri diferite de structuri - gândiți-vă la structuri asemănătoare șirurilor, globule, ancore etc. Acestea formează lucrurile care vă țin corpul împreună. Colagenul este o proteină care dă structură pielii, oaselor și chiar dinților. Integrina este o proteină care face legături flexibile între celulele dumneavoastră. Părul și unghiile dvs. sunt fabricate dintr-o proteină numită keratină.

Un alt rol important pe care îl iau este biochimia - modul în care corpul dumneavoastră exercită anumite reacții în celula dvs., cum ar fi descompunerea grăsimilor sau a aminoacizilor. Vă amintiți când am spus că corpul nostru descompune proteinele din alimentele pe care le consumăm? Chiar și această funcție este îndeplinită de proteine ​​precum pepsina. Un alt exemplu este hemoglobina - proteina care transportă oxigenul în sânge. Deci, ei efectuează aceste reacții chimice speciale în interiorul vostru.

Proteinele pot procesa, de asemenea, semnale și informații, cum ar fi proteinele de ceas circadian care păstrează timpul în celulele noastre, dar acestea sunt câteva categorii principale de funcții pe care proteinele le îndeplinesc în celulă.

De ce proteinele sunt adesea asociate cu mușchii și carnea?

Diferite tipuri de alimente au diferite tipuri de conținut de proteine. Există o mulțime de carbohidrați în plante precum grâul și orezul, dar sunt mai puțin bogate în conținut de proteine. Dar carnea în general are un conținut mai mare de proteine. Este necesară o mulțime de proteine ​​pentru a face mușchii din corpul tău. De aceea, proteinele sunt adesea asociate cu consumul de carne și creșterea mușchilor, dar proteinele sunt cu adevărat implicate în mult, mult mai mult decât atât.

Acest articol este republicat din Conversație sub o licență Creative Commons. Citiți articolul original.


Institutul pentru Cercetarea Creației

Evoluția înseamnă schimbare, dar când ne uităm la lumea vie, nu vedem nicio schimbare semnificativă (macroevoluție). Luați în considerare creaturile supărătoare pe care Darwin le-a etichetat „fosile vii.” Acestea sunt organisme care ar fi dispărut de-a lungul a multe milioane de ani, doar pentru a apărea în secolele XX și XXI în viață.

Australia este casa unui gândac descoperit în viață în 1998, dar presupus de darwiniști că ar fi dispărut de „200 de milioane de ani”. „Nu s-a schimbat deloc. Există fosile de libelule vechi de „300 de milioane de ani”, cu venerație aripilor practic identice cu aripile de libelule din zilele noastre. Nu există nicio schimbare. Se presupune că milipedele se târăsc în jur de „420 de milioane de ani”! Un exemplu fascinant de plante este „Wollemi Pine”, vechi de 150 de milioane de ani, descoperit în 1994 și 2000 la vest de Sydney, Australia. Trebuie să ne întrebăm: Este logic să presupunem că un arboret poate sta într-o singură locație fizică timp de peste 150 de milioane de ani și nu ajunge la orice deces? Acei norocoși cercetători care obțin permise pentru a vizita locația secretă a standurilor de pin Wollemi trebuie mai întâi să schimbe hainele pentru a evita posibila contaminare a copacilor cu bacterii străine, viruși sau spori. Dar de ce să vă faceți griji cu privire la contagiune? Pinul Wollemi ar trebui să fie incredibil de consistent după toate aceste milioane de ani. Curenții de aer aleatori și ploile de-a lungul mileniilor ar trebui să aducă toate tipurile de „cocoșe” care să infecteze acești copaci și strămoșii lor de o sută de mii de ori.

Un alt indicator al pământului tânăr implică degradarea compușilor organici (adică a proteinelor) într-un mediu geologic. Nu există nicio îndoială, chiar și printre unii naturaliști evoluționisti, că osul de dinozaur nemineralizat care conține încă proteine ​​osoase se află în multe locații din întreaga lume. 1 Acest lucru este uimitor și distruge mantra dinozaurilor care au dispărut acum 65 de milioane de ani. „Pur și simplu, osul care conține proteine ​​atât de bine conservate nu ar fi putut exista de mai bine de câteva mii de ani în cadrul geologic în care se găsesc.

În august 2004, BBC News a raportat Proiectul Coreei de Gheață din Nordul Groenlandei (NGrip) recuperând ceea ce pare a fi lame de iarbă sau ace de pin din nuclee aflate la două mile sub suprafață. În timp ce se presupune că are o vechime de câteva milioane de ani, posibila materie organică sugerează formarea stratului de gheață din Groenlanda repede. 2

Biologii creației văd vârsta pământului în termeni de numai mii de ani. Fosilele vii, materiile vechi, plantele și proteinele dinozaurilor nu sunt o problemă dacă pământul este tânăr. Evoluționiștii, pe de altă parte, trebuie să pozeze perioade imposibil de lungi, fără nicio schimbare evolutivă, atunci când o creatură & quotxtinct & quot apare în viață și apoi să ofere scuze de ce creatura nu s-a schimbat niciodată.


Secvențele de aminoacizi influențează proprietățile chimice ale unei proteine

Descoperirea lui Sanger cu insulina a dezvăluit nu doar modul în care proteinele au definit structuri chimice, ci și motivul pentru care diferite proteine ​​au funcții diferite. La fel cum literele diferite ale alfabetului au sunete diferite, diferitele lanțuri R conferă celor douăzeci de aminoacizi proprietăți chimice diferite. Astfel, înșirarea aminoacizilor împreună în diferite combinații duce la proteine ​​cu proprietăți și forme extrem de diverse.

Cercetarea lui Sanger asupra insulinei a acționat ca o trambulină pentru munca altor chimiști cu proteine ​​în anii 1950 și 60, implicând modul în care structura se leagă de funcționare. Prin trecerea razelor X prin diferite proteine, cercetătorii au obținut imagini cu structurile lor tridimensionale. Studiind imaginile și rezolvând probleme legate de fizica legăturilor chimice, biochimiștii de la mijlocul secolului al XX-lea au aflat că secvența de aminoacizi reprezintă structura proteinelor la un singur nivel. Au început să se refere la secvență drept structura primară, deoarece conduce lanțul proteic la răsucire și îndoire în moduri care conferă proteinei o formă mai complexă.

Anumiți aminoacizi permit un lanț polipeptidic să se îndoaie, de exemplu, în timp ce alți aminoacizi mențin lanțul mai rigid (Figura 9). Unele lanțuri R sunt foarte hidrofile, le place să fie în apă și astfel fac aminoacidul solubil în apă. Alte lanțuri R sunt hidrofobe și nu se amestecă cu apă. Adesea, având o zonă hidrofobă, sau „buzunar”, într-o proteină, poate ajuta proteina să-și îndeplinească treaba, de exemplu, apucând un substrat hidrofob pentru a-l modifica chimic.

Structura primară Structura secundară
Structura terțiară Structura cuaternară
Figura 9: Diferitele structuri proteice.

În funcție de lanțurile lor R, aminoacizii pot varia, de asemenea, în ceea ce privește aciditatea și alcalinitatea lor. Atunci când mediul este neutru (pH 7), aminoacizii aspartat și glutamat acționează ca acizi, în timp ce arginina și lizina acționează ca baze și acest lucru are implicații majore și pentru proprietățile unei proteine.


Un aminoacid de hârtie terminat.

Avem o activitate distractivă de pliere a hârtiei. Vă amintiți cum proteinele sunt formate din blocuri de construcție numite aminoacizi și au propria lor formă specială? Proteinele nu numai că arată diferit, ci au sarcini diferite de făcut în interiorul celulei pentru a vă menține corpul în bune condiții.

Proteina pe care am făcut-o este un canal care se află în suprafața celulară exterioară sau membrană și funcționează ca o ușă care lasă să treacă anumite molecule. Unele canale sunt deschise tot timpul, în timp ce altele pot fi închise în funcție de semnalele din celulă sau din mediu. Când canalul este deschis, alte molecule pot intra în celulă trecând prin gaura din mijloc.

După cum veți descoperi în timp ce vă construiți canalul origami, forma unei proteine ​​este foarte importantă. Dacă nu vă pliați corect aminoacizii origami, aceștia nu s-ar potrivi împreună pentru a crea un lanț proteic. Sau, dacă faceți o greșeală unind aminoacizii împreună, este posibil ca canalul finit să nu se poată deschide și închide corect.

În natură se poate întâmpla același lucru. Dacă o proteină are o formă greșită, aceasta nu va funcționa corect.

Materiale: Veți avea nevoie de 8 bucăți pătrate de hârtie de aceeași dimensiune.

sfaturi: Cel mai bun mod de a face falduri este să așezați hârtia pe o suprafață dură și plană, cum ar fi o masă. Este important să acordați atenție direcției hârtiei și să vă asigurați că nu schimbați orientarea atunci când urmați instrucțiunile.

Puteți afla mai multe despre modul în care proteinele se pliază în forme unice pentru a crea și a funcționa în interiorul corpului dvs. în secțiunea Știința proteinelor.

Puteți, de asemenea, să descărcați și să imprimați documentul nostru Origami Protein Handout (PDF) pentru instrucțiuni pas cu pas despre cum să vă creați canalul de proteine ​​sau puteți urmări acest videoclip pas cu pas.

1. Îndoiți o singură bucată de hârtie pe jumătate în diagonală
2. Îndoiți din nou hârtia pe jumătate în diagonală
3. Hârtia dvs. pliată ar trebui să arate astfel
4. Desfaceți hârtia

5. Îndoiți hârtia în jumătate
6. Îndoiți din nou hârtia în jumătate
7. Hârtia dvs. pliată ar trebui să arate astfel

8. Desfaceți stratul superior al pătratului pe jumătate
9. Deschideți stratul superior al pătratului și aplatizați-l într-un triunghi, folosind cutele existente.
10. Hârtia pliată ar trebui să arate astfel

11. Întoarceți-l
12. Desfaceți stratul superior la jumătate
13. Deschideți stratul superior și aplatizați-l într-un triunghi, folosind cute existente.
14. Hârtia dvs. pliată ar trebui să arate astfel

15. Îndoiți marginile stratului superior numai în linia centrală
16. Hârtia dvs. pliată ar trebui să arate astfel
17. Întoarceți-l
18. Îndoiți marginile stratului superior numai în linia centrală
19. Ați finalizat acum un aminoacid. Repetați acești pași cu o altă bucată de hârtie până când ați creat un total de opt aminoacizi.

Si asta e! Odată ce aveți aminoacizi, sunteți gata să treceți la partea 2 pentru a face canalul proteic.


3.4 Proteine

În această secțiune, veți investiga următoarele întrebări:

  • Care sunt funcțiile proteinelor din celule și țesuturi?
  • Care este relația dintre aminoacizi și proteine?
  • Care sunt cele patru niveluri de organizare a proteinelor?
  • Care este relația dintre forma și funcția proteinei?

Conexiune pentru cursuri AP ®

Proteinele sunt lanțuri lungi de secvențe diferite ale celor 20 de aminoacizi care conțin fiecare o grupare amino (-NH2), o grupare carboxil (-COOH) și o grupă variabilă. (Gândiți-vă câte „cuvinte” de proteine ​​pot fi făcute cu 20 de „litere” de aminoacizi). Fiecare aminoacid este legat de vecinul său printr-o legătură peptidică formată printr-o reacție de deshidratare. Un lanț lung de aminoacizi este cunoscut sub numele de polipeptidă. Proteinele îndeplinesc multe funcții în celule. Acestea acționează ca enzime care catalizează reacțiile chimice, oferă suport structural, reglează trecerea substanțelor prin membrana celulară, protejează împotriva bolilor și coordonează căile de semnalizare a celulelor. Structura proteinelor este organizată la patru niveluri: primar, secundar, terțiar și cuaternar. Structura primară este secvența unică de aminoacizi. O modificare a unui singur aminoacid poate modifica structura și funcția proteinelor. De exemplu, anemia falciformă rezultă dintr-o singură substituție de aminoacizi într-o moleculă de hemoglobină formată din 574 de aminoacizi. Structura secundară constă din plierea locală a polipeptidei prin formarea de legături de hidrogen care duce la conformațiile α helix și β plise. În structura terțiară, diferite interacțiuni, de exemplu, legături de hidrogen, legături ionice, legături disulfură și interacțiuni hidrofobe între grupările R, contribuie la plierea polipeptidei în diferite configurații tridimensionale. Majoritatea enzimelor sunt de configurație terțiară. Dacă o proteină este denaturată, își pierde forma tridimensională, este posibil să nu mai fie funcțională. Condițiile de mediu, cum ar fi temperatura și pH-ul, pot denatura proteinele. Unele proteine, cum ar fi hemoglobina, sunt formate din mai multe polipeptide, iar interacțiunile acestor subunități formează structura cuaternară a proteinelor.

Informațiile prezentate și exemplele evidențiate în secțiunea, concepte de sprijin și obiective de învățare prezentate în Big Idea 4 din AP® Biology Curriculum Framework. Obiectivele de învățare enumerate în cadrul curricular oferă o bază transparentă pentru cursul AP ® Biology, o experiență de laborator bazată pe anchetă, activități de instruire și întrebări de examen AP ®. Un obiectiv de învățare îmbină conținutul necesar cu una sau mai multe dintre cele șapte practici științifice.

Marea idee 4 Sistemele biologice interacționează, iar aceste sisteme și interacțiunile lor posedă proprietăți complexe.
Înțelegere durabilă 4.A Interacțiunile din cadrul sistemelor biologice duc la proprietăți complexe.
Cunoștințe esențiale 4.A.1 The subcomponents of biological molecules and their sequence determine the properties of that molecule.
Practica științifică 7.1 The student can connect phenomena and models across spatial and temporal scales.
Obiectiv de învățare 4.1 The student is able to explain the connection between the sequence and the subcomponents of a biological polymer and its properties.
Cunoștințe esențiale 4.A.1 The subcomponents of biological molecules and their sequence determine the properties of that molecule.
Practica științifică 1.3 The student can refine representations and models of natural or man-made phenomena and systems in the domain.
Obiectiv de învățare 4.2 The student is able to refine representations and models to explain how the subcomponents of a biological polymer and their sequence determine the properties of that polymer.
Cunoștințe esențiale 4.A.1 The subcomponents of biological molecules and their sequence determine the properties of that molecule.
Practica științifică 6.1 The student can justify claims with evidence.
Practica științifică 6.4 Elevul poate face afirmații și predicții despre fenomenele naturale pe baza teoriilor și modelelor științifice.
Obiectiv de învățare 4.3 The student is able to use models to predict and justify that changes in the subcomponents of a biological polymer affect the functionality of the molecules.

Teacher Support

Twenty amino acids can be formed into a nearly limitless number of different proteins. The sequence of the amino acids ultimately determines the final configuration of the protein chain, giving the molecule its specific function.

Teacher Support

Emphasize that proteins have a variety of functions in the body. Table 3.1 contains some examples of these functions. Note that not all enzymes work under the same conditions. Amylase only works in an alkaline medium, such as in saliva, while pepsin works in the acid environment of the stomach. Discuss other materials that can be carried by protein in body fluids in addition to the substances listed for transport in the text. Proteins also carry insoluble lipids in the body and transport charged ions, such as calcium, magnesium, and zinc. Discuss another important structural protein, collagen, as it is found throughout the body, including in most connective tissues. Emphasize that not all hormones are proteins and that steroid based hormones were discussed in the previous section.

The amino group of an amino acid loses an electron and becomes positively charged. The carboxyl group easily gains an electron, becoming negatively charged. This results in the amphipathic characteristic of amino acids and gives the compounds solubility in water. The presence of both functional groups also allows dehydration synthesis to join the individual amino acids into a peptide chain.

Protein structure is explained as though it occurs in three to four discrete steps. In reality, the structural changes that result in a functional protein occur on a continuum. As the primary structure is formed off the ribosomes, the polypeptide chain goes through changes until the final configuration is achieved. Have the students imagine a strand of spaghetti as it cooks in a clear pot. Initially, the strand is straight (ignore the stiffness for this example). While it cooks, the strand will bend and twist and (again, for this example), fold itself into a loose ball made up of the strand of pasta. The resulting strand has a particular shape. Ask the students what types of chemical bonds or forces might affect protein structure. These shapes are dictated by the position of amino acids along the strand. Other forces will complete the folding and maintain the structure.

Întrebările cu privire la provocarea științifică conțin întrebări suplimentare de testare pentru această secțiune care vă vor ajuta să vă pregătiți pentru examenul AP. Aceste întrebări se referă la următoarele standarde:
[APLO 1.14] [APLO 2.12] [APLO 4.1] [APLO 4.3][APLO 4.15][APLO 4.22]

Types and Functions of Proteins

Proteins are one of the most abundant organic molecules in living systems and have the most diverse range of functions of all macromolecules. Proteins may be structural, regulatory, contractile, or protective they may serve in transport, storage, or membranes or they may be toxins or enzymes. Each cell in a living system may contain thousands of proteins, each with a unique function. Their structures, like their functions, vary greatly. They are all, however, polymers of amino acids, arranged in a linear sequence.

Enzymes , which are produced by living cells, are catalysts in biochemical reactions (like digestion) and are usually complex or conjugated proteins. Each enzyme is specific for the substrate (a reactant that binds to an enzyme) it acts on. The enzyme may help in breakdown, rearrangement, or synthesis reactions. Enzymes that break down their substrates are called catabolic enzymes, enzymes that build more complex molecules from their substrates are called anabolic enzymes, and enzymes that affect the rate of reaction are called catalytic enzymes. It should be noted that all enzymes increase the rate of reaction and, therefore, are considered to be organic catalysts. An example of an enzyme is salivary amylase, which hydrolyzes its substrate amylose, a component of starch.

Hormones are chemical-signaling molecules, usually small proteins or steroids, secreted by endocrine cells that act to control or regulate specific physiological processes, including growth, development, metabolism, and reproduction. For example, insulin is a protein hormone that helps to regulate the blood glucose level. The primary types and functions of proteins are listed in Table 3.1.

TipExempleFuncții
Digestive EnzymesAmylase, lipase, pepsin, trypsinHelp in digestion of food by catabolizing nutrients into monomeric units
TransportHemoglobin, albuminCarry substances in the blood or lymph throughout the body
StructuralActin, tubulin, keratinConstruct different structures, like the cytoskeleton
HormoniInsulin, thyroxineCoordinate the activity of different body systems
DefenseImmunoglobulinsProtect the body from foreign pathogens
ContractileActin, myosinEffect muscle contraction
DepozitareLegume storage proteins, egg white (albumin)Provide nourishment in early development of the embryo and the seedling

Proteins have different shapes and molecular weights some proteins are globular in shape whereas others are fibrous in nature. For example, hemoglobin is a globular protein, but collagen, found in our skin, is a fibrous protein. Protein shape is critical to its function, and this shape is maintained by many different types of chemical bonds. Changes in temperature, pH, and exposure to chemicals may lead to permanent changes in the shape of the protein, leading to loss of function, known as denaturation . All proteins are made up of different arrangements of the most common 20 types of amino acids.

Aminoacizi

Aminoacizii sunt monomerii care alcătuiesc proteinele. Each amino acid has the same fundamental structure, which consists of a central carbon atom, also known as the alpha (α) carbon, bonded to an amino group (NH2), a carboxyl group (COOH), and to a hydrogen atom. Every amino acid also has another atom or group of atoms bonded to the central atom known as the R group (Figure 3.24).

The name "amino acid" is derived from the fact that they contain both amino group and carboxyl-acid-group in their basic structure. As mentioned, there are 20 common amino acids present in proteins. Nine of these are considered essential amino acids in humans because the human body cannot produce them and they are obtained from the diet. For each amino acid, the R group (or side chain) is different (Figure 3.25).

Visual Connection

  1. Polar and charged amino acids will be found on the surface. Non-polar amino acids will be found in the interior.
  2. Polar and charged amino acids will be found in the interior. Non-polar amino acids will be found on the surface.
  3. Non-polar and uncharged proteins will be found on the surface as well as in the interior.

The chemical nature of the side chain determines the nature of the amino acid (that is, whether it is acidic, basic, polar, or nonpolar). For example, the amino acid glycine has a hydrogen atom as the R group. Amino acids such as valine, methionine, and alanine are nonpolar or hydrophobic in nature, while amino acids such as serine, threonine, and cysteine are polar and have hydrophilic side chains. The side chains of lysine and arginine are positively charged, and therefore these amino acids are also known as basic amino acids. Proline has an R group that is linked to the amino group, forming a ring-like structure. Proline is an exception to the standard structure of an animo acid since its amino group is not separate from the side chain (Figure 3.25).

Amino acids are represented by a single upper case letter or a three-letter abbreviation. For example, valine is known by the letter V or the three-letter symbol val. Just as some fatty acids are essential to a diet, some amino acids are necessary as well. They are known as essential amino acids, and in humans they include isoleucine, leucine, and cysteine. Essential amino acids refer to those necessary for construction of proteins in the body, although not produced by the body which amino acids are essential varies from organism to organism.

Secvența și numărul de aminoacizi determină în cele din urmă forma, dimensiunea și funcția proteinei. Each amino acid is attached to another amino acid by a covalent bond, known as a peptide bond , which is formed by a dehydration reaction. The carboxyl group of one amino acid and the amino group of the incoming amino acid combine, releasing a molecule of water. The resulting bond is the peptide bond (Figure 3.26).

The products formed by such linkages are called peptides. As more amino acids join to this growing chain, the resulting chain is known as a polypeptide. Each polypeptide has a free amino group at one end. This end is called the N terminal, or the amino terminal, and the other end has a free carboxyl group, also known as the C or carboxyl terminal. While the terms polypeptide and protein are sometimes used interchangeably, a polypeptide is technically a polymer of amino acids, whereas the term protein is used for a polypeptide or polypeptides that have combined together, often have bound non-peptide prosthetic groups, have a distinct shape, and have a unique function. After protein synthesis (translation), most proteins are modified. These are known as post-translational modifications. They may undergo cleavage or phosphorylation, or may require the addition of other chemical groups. Only after these modifications is the protein completely functional.

Link către învățare

Click through the steps of protein synthesis in this interactive tutorial.


6 Questions About Hydrolyzed Protein, Answered

You’ve probably seen it listed on labels. But what exactly is it—and what are the benefits?

Hydrolyzed protein: It’s a complicated name for a complicated process. But its benefits can’t be overstated for people who have trouble digesting whole and conventional food sources of protein.

Protein is a necessary macronutrient in the human diet—one that supports everything from cell function to muscle maintenance and generation. It’s composed of long chains of amino acids, many of which are individually necessary for human health.

But for people with compromised digestive function, separating and absorbing those complex chains of amino acids can be difficult, or even impossible, says Vanessa Carr, M.S., R.D.N., L.D.N., clinical nutrition manager for Kate Farms. That’s where hydrolyzed protein comes in.

What the heck does “hydrolyzed” mean?

“Basically, it’s the unchaining of long protein strands into smaller chains or single amino acids,” says Carr. This process involves breaking down the peptide bonds that hold amino acids together, and it’s accomplished using enzymes like the ones produced in the human pancreas or other digestive organs.

Protein molecules can be “partially” hydrolyzed, meaning their amino acid chains are cut down into smaller segments, or they can be fully hydrolyzed, meaning every amino acid has been isolated, Carr explains.

Why is this necessary?

Digestion involves breaking down food molecules so the body can put them to good use. But again, for some, that breakdown capability is impaired. Because hydrolyzed proteins are already broken down—basically, pre-digested—the body can absorb them with little to no effort, Carr says.

Who benefits most from hydrolyzed proteins?

They’re especially important for people who are missing parts of their intestine, along with those who have pancreatic disease or other conditions that make protein digestion a struggle.

“People with malabsorption disorders,” Carr says, “and people with food allergies or sensitivities can usually tolerate a hydrolyzed protein formula better than the others.” It’s used in hypoallergenic infant formulas, for example.

Hydrolyzed proteins may also cause less of an upset stomach for those with gut conditions like irritable bowel syndrome. They have also been shown to benefit those with slow stomach digestion.

Historically, all hydrolyzed proteins were dairy-based. That’s since changed, and Kate Farms has been at the forefront—more on this later.

How many amino acids are found in protein?

Twenty different amino acids can combine to make protein, says Carr, though a single protein molecule can include a sequence of 200 or more single amino acids in various combinations.

Think of a protein molecule is a train. A big train can have 200 cars, made up of 20 types of cars.

Are all of them essential?

Nu. Only nine of them are essential, which means the human body cannot produce them on its own.

Ever hear that some foods are “complete” proteins? That means the food contains all nine essential amino acids in the right proportion. While it’s true that animal sources of protein are complete, Carr says, it isn’t necessary to eat only animal products to get all the essential amino acids.

What makes Kate Farms’ hydrolyzed protein different from everyone else’s?

Kate Farms Peptide Formulas contain hydrolyzed pea protein, supplemented with other plant-based amino acids. “We’re the first company to hydrolyze a complete plant-based protein,” Carr says. “Every other hydrolyzed formula—every single one—uses whey, which is from dairy.”

Carr says some people with dairy allergies (or intolerances) can benefit from a hydrolyzed whey protein, but they may experience symptoms when exposed to whey-sourced amino acids. “All Kate Farms products are vegan,” she says, “so there’s no animal sourcing whatsoever.”

In addition, pea protein is not one of the top 8 food allergens. Kate Farms shakes are free of corn as well, unlike the single amino acid formulas on the market.

If you are under a doctor’s care and need a peptide formula, check out our Peptide Formulas to learn about products, free samples, insurance coverage, and talking to your doctor about how peptides may be used in your treatment plan.

If you are not a medical patient and have come to our site just looking for great health knowledge, be sure to try nutritious and delicious Kate Farms Nutrition Shakes, featuring organic pea protein, powerful phytonutrients, and more.


Machine-learning model helps determine protein structures

Imaginile pentru descărcare pe site-ul web al biroului de știri MIT sunt puse la dispoziția entităților necomerciale, a presei și a publicului larg sub o licență Creative Commons Attribution Non-Commercial No Derivatives. Nu puteți modifica imaginile furnizate, altele decât să le decupați la dimensiune. La reproducerea imaginilor trebuie utilizată o linie de credit dacă nu este furnizată una mai jos, creditați imaginile la „MIT”.

Imaginea anterioară Imaginea următoare

Cryo-electron microscopy (cryo-EM) allows scientists to produce high-resolution, three-dimensional images of tiny molecules such as proteins. This technique works best for imaging proteins that exist in only one conformation, but MIT researchers have now developed a machine-learning algorithm that helps them identify multiple possible structures that a protein can take.

Unlike AI techniques that aim to predict protein structure from sequence data alone, protein structure can also be experimentally determined using cryo-EM, which produces hundreds of thousands, or even millions, of two-dimensional images of protein samples frozen in a thin layer of ice. Computer algorithms then piece together these images, taken from different angles, into a three-dimensional representation of the protein in a process termed reconstruction.

Într-o Metode ale naturii paper, the MIT researchers report a new AI-based software for reconstructing multiple structures and motions of the imaged protein — a major goal in the protein science community. Instead of using the traditional representation of protein structure as electron-scattering intensities on a 3D lattice, which is impractical for modeling multiple structures, the researchers introduced a new neural network architecture that can efficiently generate the full ensemble of structures in a single model.

“With the broad representation power of neural networks, we can extract structural information from noisy images and visualize detailed movements of macromolecular machines,” says Ellen Zhong, an MIT graduate student and the lead author of the paper.

With their software, they discovered protein motions from imaging datasets where only a single static 3D structure was originally identified. They also visualized large-scale flexible motions of the spliceosome — a protein complex that coordinates the splicing of the protein coding sequences of transcribed RNA.

“Our idea was to try to use machine-learning techniques to better capture the underlying structural heterogeneity, and to allow us to inspect the variety of structural states that are present in a sample,” says Joseph Davis, the Whitehead Career Development Assistant Professor in MIT’s Department of Biology.

Davis and Bonnie Berger, the Simons Professor of Mathematics at MIT and head of the Computation and Biology group at the Computer Science and Artificial Intelligence Laboratory, are the senior authors of the study, which appears today in Metode ale naturii. MIT postdoc Tristan Bepler is also an author of the paper.

Visualizing a multistep process

The researchers demonstrated the utility of their new approach by analyzing structures that form during the process of assembling ribosomes — the cell organelles responsible for reading messenger RNA and translating it into proteins. Davis began studying the structure of ribosomes while a postdoc at the Scripps Research Institute. Ribosomes have two major subunits, each of which contains many individual proteins that are assembled in a multistep process.

To study the steps of ribosome assembly in detail, Davis stalled the process at different points and then took electron microscope images of the resulting structures. At some points, blocking assembly resulted in accumulation of just a single structure, suggesting that there is only one way for that step to occur. However, blocking other points resulted in many different structures, suggesting that the assembly could occur in a variety of ways.

Because some of these experiments generated so many different protein structures, traditional cryo-EM reconstruction tools did not work well to determine what those structures were.

“In general, it’s an extremely challenging problem to try to figure out how many states you have when you have a mixture of particles,” Davis says.

After starting his lab at MIT in 2017, he teamed up with Berger to use machine learning to develop a model that can use the two-dimensional images produced by cryo-EM to generate all of the three-dimensional structures found in the original sample.

In the new Metode ale naturii study, the researchers demonstrated the power of the technique by using it to identify a new ribosomal state that hadn’t been seen before. Previous studies had suggested that as a ribosome is assembled, large structural elements, which are akin to the foundation for a building, form first. Only after this foundation is formed are the “active sites” of the ribosome, which read messenger RNA and synthesize proteins, added to the structure.

In the new study, however, the researchers found that in a very small subset of ribosomes, about 1 percent, a structure that is normally added at the end actually appears before assembly of the foundation. To account for that, Davis hypothesizes that it might be too energetically expensive for cells to ensure that every single ribosome is assembled in the correct order.

“The cells are likely evolved to find a balance between what they can tolerate, which is maybe a small percentage of these types of potentially deleterious structures, and what it would cost to completely remove them from the assembly pathway,” he says.

Viral proteins

The researchers are now using this technique to study the coronavirus spike protein, which is the viral protein that binds to receptors on human cells and allows them to enter cells. The receptor binding domain (RBD) of the spike protein has three subunits, each of which can point either up or down.

“For me, watching the pandemic unfold over the past year has emphasized how important front-line antiviral drugs will be in battling similar viruses, which are likely to emerge in the future. As we start to think about how one might develop small molecule compounds to force all of the RBDs into the ‘down’ state so that they can’t interact with human cells, understanding exactly what the ‘up’ state looks like and how much conformational flexibility there is will be informative for drug design. We hope our new technique can reveal these sorts of structural details,” Davis says.

The research was funded by the National Science Foundation Graduate Research Fellowship Program, the National Institutes of Health, and the MIT Jameel Clinic for Machine Learning and Health. This work was supported by MIT Satori computation cluster hosted at the MGHPCC.


Priveste filmarea: 1. Proteomics: The proteome (Ianuarie 2022).