Rivelare l'evoluzione delle proteine attraverso struttura e sequenza
Uno studio mostra come le strutture e le sequenze delle proteine evolvono nel tempo.
― 6 leggere min
Indice
- Sequenza e Struttura delle Proteine
- Importanza delle Strutture Proteiche
- Modelli Statistici nell'Evoluzione delle Proteine
- Analisi della Divergenza delle Proteine
- Metodologia
- Risultati dello Studio
- Predizione della Struttura Secondaria
- Implicazioni per la Ricerca Futura
- Conclusione
- Fonte originale
- Link di riferimento
Lo studio delle proteine è fondamentale perché giocano ruoli essenziali nei nostri corpi. Capire come le proteine evolvono nel tempo aiuta i ricercatori a conoscere le loro funzioni e come si relazionano a diverse specie. Un modo efficace per studiare l'evoluzione delle proteine è esaminare le loro strutture piuttosto che solo le sequenze di blocchi costitutivi, conosciuti come aminoacidi.
Sia le sequenze che le strutture delle proteine cambiano man mano che le specie evolvono. Tuttavia, le strutture delle proteine sono generalmente più stabili perché sono plasmate dalle funzioni che quelle proteine devono svolgere. Questo significa che, anche se la sequenza di una proteina cambia molto, la sua struttura potrebbe rimanere relativamente simile, offrendo preziose informazioni sulla storia evolutiva delle proteine.
Sequenza e Struttura delle Proteine
Le proteine sono composte da catene di aminoacidi. L'ordine di questi aminoacidi determina la sequenza della proteina. Questa sequenza si ripiega in una forma specifica, conosciuta come struttura della proteina. La struttura è fondamentale perché determina come funziona la proteina.
Quando gli scienziati studiano come le proteine sono correlate, spesso guardano alle loro sequenze. Confrontando le sequenze di diverse proteine, possono stimare quanto tempo fa si sono separate da un antenato comune. Tuttavia, questo metodo può essere impegnativo, specialmente quando le sequenze sono molto diverse, rendendo difficile trovare informazioni affidabili sulle loro relazioni.
Strutture Proteiche
Importanza delleLe strutture delle proteine sono generalmente più conservate rispetto alle sequenze. Questo significa che la forma della proteina cambia meno nel tempo rispetto alla sequenza di aminoacidi. Per questo motivo, studiare le strutture delle proteine può fornire stime più accurate su quanto tempo fa due proteine si siano separate dal loro antenato comune.
Concentrandosi sulle strutture, i ricercatori possono ottenere informazioni che non sono sempre visibili quando si guarda solo alle sequenze. Per combinare le informazioni provenienti sia dalle strutture che dalle sequenze, gli scienziati usano modelli statistici. Questi modelli aiutano a comprendere la relazione tra i due tipi di dati e stimare i tempi di Divergenza.
Modelli Statistici nell'Evoluzione delle Proteine
Per analizzare come le proteine evolvono, i ricercatori creano modelli statistici che tengono conto dei cambiamenti nel tempo. Questi modelli possono aiutare a inferire come le strutture e le sequenze delle proteine divergono. L'obiettivo è sviluppare una migliore comprensione di come le proteine siano correlate attraverso la loro storia evolutiva.
Un approccio è creare una "Matrice di Markov", che è un tipo di strumento matematico che descrive le probabilità di transizione tra diversi stati. Per le proteine, questi stati potrebbero rappresentare diverse forme strutturali. Applicando questi modelli a grandi database di strutture proteiche, gli scienziati possono analizzare milioni di coppie di proteine per derivare schemi e relazioni significative.
Analisi della Divergenza delle Proteine
Nella loro ricerca, gli scienziati hanno esaminato un gran numero di coppie di strutture proteiche per comprendere il legame tra la divergenza strutturale e quella della sequenza. Quello che hanno scoperto è che i cambiamenti nelle sequenze delle proteine spesso superano i cambiamenti nelle loro strutture, specialmente nelle prime fasi di divergenza.
Questo significa che quando le proteine iniziano a evolvere, tendono a cambiare significativamente le loro sequenze di aminoacidi mentre le loro strutture complessive rimangono relativamente stabili. Man mano che l'evoluzione continua, la divergenza nelle sequenze porta spesso a cambiamenti maggiori nelle strutture.
Metodologia
Per investigare la divergenza delle strutture e delle sequenze proteiche, i ricercatori hanno utilizzato un dataset significativo contenente allineamenti di strutture proteiche. Il focus principale era su coppie di proteine omologhe, che sono proteine che condividono un antenato comune ma che si sono evolute in modo diverso.
I ricercatori hanno impiegato tecniche statistiche avanzate per inferire i tempi di divergenza basati sulle strutture delle proteine. L'approccio ha comportato l'uso di una matrice di Markov, che ha permesso loro di comprendere come sono avvenuti i cambiamenti strutturali nel tempo. Combinando informazioni provenienti da più fonti, hanno cercato di stabilire una chiara relazione tra i tempi di divergenza per sequenze e strutture.
Risultati dello Studio
Lo studio ha prodotto risultati affascinanti che hanno evidenziato l'interazione tra la divergenza della sequenza e quella della struttura delle proteine. I risultati hanno indicato che i cambiamenti strutturali tendono a seguire i cambiamenti di sequenza. Per esempio, quando si analizzavano la divergenza di un milione di coppie di strutture omologhe, i ricercatori hanno dimostrato che la divergenza della sequenza avveniva più rapidamente rispetto alla divergenza strutturale.
La ricerca ha anche sottolineato che nelle prime fasi evolutive, le proteine possono cambiare considerevolmente nelle loro sequenze senza alterazioni significative nelle loro strutture. Questa intuizione è particolarmente preziosa perché aiuta gli scienziati a comprendere meglio come le funzioni proteiche possano rimanere stabili anche di fronte a cambiamenti drastici a livello di sequenza.
Predizione della Struttura Secondaria
Una delle applicazioni pratiche di questa ricerca è stata nel campo della predizione della struttura secondaria. La struttura secondaria si riferisce a forme specifiche all'interno della proteina, come le alfa-eliche e i beta-fogli, formati attraverso schemi di piegatura locali. Previsioni accurate di queste strutture sono incredibilmente importanti per comprendere la funzione delle proteine.
Utilizzando le relazioni stabilite tra i tempi di divergenza delle sequenze e delle strutture, i ricercatori hanno sviluppato un modello che può prevedere le strutture secondarie con un alto grado di precisione. Questo modello è stato confrontato con metodi popolari basati su reti neurali utilizzati per la predizione delle strutture. I risultati hanno mostrato che il modello basato sul nuovo framework statistico era competitivo, dimostrando la sua efficacia senza richiedere calcoli complessi o grandi dataset.
Implicazioni per la Ricerca Futura
I risultati di questa ricerca aprono nuove strade per comprendere l'evoluzione delle proteine. Comprendendo meglio la relazione tra sequenza e struttura, i ricercatori possono ottenere intuizioni su come le proteine siano transitate attraverso il tempo evolutivo.
I modelli stabiliti possono anche essere applicati in altri settori, come la costruzione di alberi evolutivi, che rappresentano visualmente le relazioni tra diverse proteine e specie. Il lavoro futuro potrebbe approfondire ulteriormente come questi modelli funzionano con proteine che hanno meno parentela comune o sono più distanti.
Conclusione
In conclusione, lo studio dell'evoluzione delle proteine attraverso strutture e sequenze è un'area di ricerca complessa ma gratificante. Concentrandosi sulle strutture più stabili, gli scienziati possono sviluppare intuizioni più solide su come le proteine cambiano nel tempo. I modelli statistici stabiliti non solo aiutano nella comprensione delle relazioni proteiche, ma hanno anche applicazioni pratiche nella previsione delle strutture proteiche.
Questa ricerca esemplifica come metodi statistici avanzati possano essere utilizzati per svelare i schemi intricati dietro l'evoluzione delle proteine, aprendo la strada a studi futuri che potrebbero migliorare la nostra comprensione della biologia sia a livello fondamentale che pratico. L'esplorazione continua di queste relazioni promette ulteriori rivelazioni nella comprensione dei mattoni della vita.
Titolo: The divergence time of protein structures modelled by Markov matrices and its relation to the divergence of sequences
Estratto: A complete time-parameterized statistical model quantifying the divergent evolution of protein structures in terms of the patterns of conservation of their secondary structures is inferred from a large collection of protein 3D structure alignments. This provides a better alternative to time-parameterized sequence-based models of protein relatedness, that have clear limitations dealing with twilight and midnight zones of sequence relationships. Since protein structures are far more conserved due to the selection pressure directly placed on their function, divergence time estimates can be more accurate when inferred from structures. We use the Bayesian and information-theoretic framework of Minimum Message Length to infer a time-parameterized stochastic matrix (accounting for perturbed structural states of related residues) and associated Dirichlet models (accounting for insertions and deletions during the evolution of protein domains). These are used in concert to estimate the Markov time of divergence of tertiary structures, a task previously only possible using proxies (like RMSD). By analyzing one million pairs of homologous structures, we yield a relationship between the Markov divergence time of structures and of sequences. Using these inferred models and the relationship between the divergence of sequences and structures, we demonstrate a competitive performance in secondary structure prediction against neural network architectures commonly employed for this task. The source code and supplementary information are downloadable from \url{http://lcb.infotech.monash.edu.au/sstsum}.
Autori: Sandun Rajapaksa, Lloyd Allison, Peter J. Stuckey, Maria Garcia de la Banda, Arun S. Konagurthu
Ultimo aggiornamento: 2023-08-10 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2308.06292
Fonte PDF: https://arxiv.org/pdf/2308.06292
Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.