Die Enthüllung der Protein-Evolution durch Struktur und Sequenz
Studie zeigt, wie sich Proteinstrukturen und -sequenzen im Laufe der Zeit entwickeln.
― 6 min Lesedauer
Inhaltsverzeichnis
Die Studie über Proteine ist super wichtig, weil sie essentielle Rollen in unserem Körper spielen. Zu verstehen, wie sich Proteine im Laufe der Zeit entwickeln, hilft den Forschern, ihre Funktionen und die Beziehungen zwischen verschiedenen Arten zu lernen. Eine effektive Methode, um die Evolution von Proteinen zu studieren, ist die Untersuchung ihrer Strukturen, anstatt nur ihre Reihenfolgen von Bausteinen, die Aminosäuren genannt werden.
Sowohl die Sequenzen als auch die Strukturen von Proteinen ändern sich, während sich Arten entwickeln. Allerdings sind Proteinstrukturen im Allgemeinen stabiler, weil sie durch die Funktionen geformt werden, die diese Proteine erfüllen müssen. Das bedeutet, dass selbst wenn sich die Sequenz eines Proteins stark ändert, seine Struktur relativ ähnlich bleiben könnte, was wertvolle Einblicke in die Evolutionsgeschichte der Proteine bietet.
Proteinsequenz und -struktur
Proteine bestehen aus Ketten von Aminosäuren. Die Reihenfolge dieser Aminosäuren bestimmt die Sequenz des Proteins. Diese Sequenz faltet sich in eine spezifische Form, die als Struktur des Proteins bekannt ist. Die Struktur ist entscheidend, weil sie bestimmt, wie das Protein funktioniert.
Wenn Wissenschaftler untersuchen, wie Proteine verwandt sind, schauen sie oft auf ihre Sequenzen. Indem sie die Sequenzen verschiedener Proteine vergleichen, können sie abschätzen, wie lange es her ist, dass sie sich von einem gemeinsamen Vorfahren getrennt haben. Diese Methode kann jedoch schwierig sein, besonders wenn die Sequenzen stark unterschiedlich sind, was es schwer macht, zuverlässige Informationen über ihre Beziehungen zu finden.
Bedeutung der Proteinstrukturen
Proteinstrukturen sind im Allgemeinen konservierter als Sequenzen. Das bedeutet, dass die Form des Proteins sich über die Zeit weniger verändert als die Sequenz der Aminosäuren. Deshalb kann das Studieren von Proteinstrukturen genauere Schätzungen darüber liefern, wie lange es her ist, dass zwei Proteine sich von ihrem gemeinsamen Vorfahren getrennt haben.
Indem sie sich auf Strukturen konzentrieren, können Forscher Einblicke gewinnen, die nicht immer sichtbar sind, wenn man nur die Sequenzen betrachtet. Um Informationen aus beiden, Strukturen und Sequenzen, zu kombinieren, verwenden Wissenschaftler statistische Modelle. Diese Modelle helfen ihnen, die Beziehung zwischen den beiden Datentypen zu verstehen und Abweichungszeiten abzuschätzen.
Statistische Modelle in der Proteinevolution
Um zu analysieren, wie sich Proteine entwickeln, erstellen die Forscher statistische Modelle, die Veränderungen im Laufe der Zeit berücksichtigen. Diese Modelle können helfen, abzuleiten, wie sich Proteinstrukturen und -sequenzen unterscheiden. Das Ziel ist, ein besseres Verständnis darüber zu entwickeln, wie Proteine durch ihre Evolutionsgeschichte verwandt sind.
Ein Ansatz ist die Erstellung einer „Markov-Matrix“, einem mathematischen Werkzeug, das die Wahrscheinlichkeiten beschreibt, zwischen verschiedenen Zuständen zu wechseln. Bei Proteinen könnten diese Zustände unterschiedliche strukturelle Formen darstellen. Indem sie diese Modelle auf grosse Datenbanken von Proteinstrukturen anwenden, können Wissenschaftler Millionen von Paaren von Proteinen analysieren, um bedeutungsvolle Muster und Beziehungen abzuleiten.
Divergenz
Analyse der Protein-In ihrer Forschung untersuchten Wissenschaftler eine grosse Anzahl von Proteinstruktur-Paaren, um die Verbindung zwischen struktureller Divergenz und Sequenz-Divergenz zu verstehen. Was sie fanden, war, dass sich die Änderungen in den Proteinsequenzen oft schneller vollzogen als die Änderungen in ihren Strukturen, besonders in den frühen Phasen der Divergenz.
Das bedeutet, dass wenn Proteine sich anfangen zu entwickeln, sie dazu neigen, ihre Aminosäuresequenzen erheblich zu verändern, während ihre Gesamtstrukturen relativ stabil bleiben. Mit dem Fortschreiten der Evolution führt die Divergenz in Sequenzen oft zu grösseren Änderungen in den Strukturen.
Methodologie
Um die Divergenz von Proteinstrukturen und -sequenzen zu untersuchen, nutzten die Forscher einen umfangreichen Datensatz, der Proteinstruktur-Ausrichtungen enthielt. Der Hauptfokus lag auf Paaren homologer Proteine, also Proteinen, die einen gemeinsamen Vorfahren teilen, sich aber unterschiedlich entwickelt haben.
Die Forscher verwendeten fortschrittliche statistische Techniken, um Divergenzzeiten basierend auf Proteinstrukturen abzuleiten. Der Ansatz beinhaltete die Verwendung einer Markov-Matrix, die es ihnen ermöglichte, zu verstehen, wie strukturelle Veränderungen im Laufe der Zeit auftraten. Durch das Kombinieren von Informationen aus mehreren Quellen wollten sie eine klare Beziehung zwischen den Divergenzzeiten für Sequenzen und Strukturen herstellen.
Ergebnisse der Studie
Die Studie ergab faszinierende Ergebnisse, die das Zusammenspiel zwischen Divergenz von Proteinsequenz und -struktur hervorhoben. Die Ergebnisse zeigten, dass strukturelle Veränderungen typischerweise hinter den Sequenzänderungen zurückbleiben. Beispielsweise konnten die Forscher bei der Analyse der Divergenz von einer Million Paaren homologer Strukturen zeigen, dass die Divergenz der Sequenzen schneller stattfand als die Divergenz der Strukturen.
Die Forschung unterstrich auch, dass in frühen evolutionären Phasen Proteine erheblich in ihren Sequenzen verändern können, ohne dass signifikante Veränderungen in ihren Strukturen auftreten. Dieser Einblick ist besonders wertvoll, weil er den Wissenschaftlern hilft, besser zu verstehen, wie die Funktionen von Proteinen stabil bleiben können, selbst wenn es drastische Änderungen auf der Sequenzebene gibt.
Sekundärstruktur
Vorhersage derEine der praktischen Anwendungen dieser Forschung war im Bereich der Vorhersage von Sekundärstrukturen. Die Sekundärstruktur bezieht sich auf spezifische Formen innerhalb des Proteins, wie Alpha-Helices und Beta-Faltblätter, die durch lokale Faltmuster entstehen. Genaue Vorhersagen dieser Strukturen sind unglaublich wichtig für das Verständnis der Proteinfunktion.
Indem sie die Beziehungen zwischen Divergenzzeiten von Sequenzen und Strukturen nutzten, entwickelten die Forscher ein Modell, das Sekundärstrukturen mit hoher Genauigkeit vorhersagen kann. Dieses Modell wurde mit gängigen Methoden auf Basis neuronaler Netze zur Strukturvorhersage verglichen. Die Ergebnisse zeigten, dass das Modell basierend auf dem neuen statistischen Rahmen wettbewerbsfähig war und seine Effektivität zeigte, ohne umfangreiche Berechnungen oder grosse Datensätze zu benötigen.
Implikationen für zukünftige Forschung
Die Ergebnisse dieser Forschung eröffnen neue Wege, um die Protein-Evolution zu verstehen. Indem sie die Beziehung zwischen Sequenz und Struktur besser begreifen, können Forscher Einblicke gewinnen, wie Proteine im Laufe der evolutionären Zeit übergegangen sind.
Die etablierten Modelle können auch in anderen Bereichen angewendet werden, wie beim Bau von evolutionären Bäumen, die die Beziehungen zwischen verschiedenen Proteinen und Arten visuell darstellen. Zukünftige Arbeiten könnten tiefer auf die Leistung dieser Modelle bei Proteinen eingehen, die weniger gemeinsamen Vorfahren haben oder weiter entfernt verwandt sind.
Fazit
Zusammenfassend lässt sich sagen, dass die Studie über die Protein-Evolution durch Strukturen und Sequenzen ein komplexes, aber lohnendes Forschungsfeld ist. Indem sie sich auf die stabileren Strukturen konzentrieren, können Wissenschaftler stärkere Einblicke in die Veränderungen von Proteinen im Laufe der Zeit entwickeln. Die etablierten statistischen Modelle helfen nicht nur, die Beziehungen zwischen Proteinen zu verstehen, sondern haben auch praktische Anwendungen bei der Vorhersage von Proteinstrukturen.
Diese Forschung zeigt, wie fortschrittliche statistische Methoden eingesetzt werden können, um die komplexen Muster hinter der Protein-Evolution zu entschlüsseln und den Weg für zukünftige Studien zu ebnen, die unser Verständnis der Biologie auf grundlegenden und praktischen Ebenen verbessern könnten. Die fortlaufende Erforschung dieser Beziehungen verspricht weitere Enthüllungen im Verständnis der Bausteine des Lebens.
Titel: The divergence time of protein structures modelled by Markov matrices and its relation to the divergence of sequences
Zusammenfassung: A complete time-parameterized statistical model quantifying the divergent evolution of protein structures in terms of the patterns of conservation of their secondary structures is inferred from a large collection of protein 3D structure alignments. This provides a better alternative to time-parameterized sequence-based models of protein relatedness, that have clear limitations dealing with twilight and midnight zones of sequence relationships. Since protein structures are far more conserved due to the selection pressure directly placed on their function, divergence time estimates can be more accurate when inferred from structures. We use the Bayesian and information-theoretic framework of Minimum Message Length to infer a time-parameterized stochastic matrix (accounting for perturbed structural states of related residues) and associated Dirichlet models (accounting for insertions and deletions during the evolution of protein domains). These are used in concert to estimate the Markov time of divergence of tertiary structures, a task previously only possible using proxies (like RMSD). By analyzing one million pairs of homologous structures, we yield a relationship between the Markov divergence time of structures and of sequences. Using these inferred models and the relationship between the divergence of sequences and structures, we demonstrate a competitive performance in secondary structure prediction against neural network architectures commonly employed for this task. The source code and supplementary information are downloadable from \url{http://lcb.infotech.monash.edu.au/sstsum}.
Autoren: Sandun Rajapaksa, Lloyd Allison, Peter J. Stuckey, Maria Garcia de la Banda, Arun S. Konagurthu
Letzte Aktualisierung: 2023-08-10 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2308.06292
Quell-PDF: https://arxiv.org/pdf/2308.06292
Lizenz: https://creativecommons.org/licenses/by-nc-sa/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.