Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Biologie# Genomik

Verstehen von Proteinvarianten durch RNA-Analyse

Eine Studie darüber, wie RNA-Variationen zu verschiedenen Protein-Funktionen führen.

― 7 min Lesedauer


Proteinvarianten ausProteinvarianten ausRNA-AnalyseFunktionen von Proteinen beeinflussen.Untersuchen, wie RNA-Variationen die
Inhaltsverzeichnis

In unseren Körpern spielen Gene eine grosse Rolle bei der Herstellung von Proteinen, die für verschiedene Funktionen wichtig sind. Jedes Gen kann aufgrund von Prozessen wie alternativer Transkription, Spleissen und Polyadenylierung mehrere Versionen eines Proteins hervorbringen. Das bedeutet, dass wir aus etwa 20.000 Genen mehr als 180.000 verschiedene Proteinvarianten haben können. Dieses komplexe System kann jedoch manchmal schiefgehen, was zu Problemen wie Krebs oder Herzkrankheiten führt. Wissenschaftler suchen nach Möglichkeiten, diese Variationen zu untersuchen und zu verstehen, wie sie die Gesundheit beeinflussen.

RNA und Proteine analysieren

Um die Komplexität der Genexpression zu begreifen, können Wissenschaftler RNA analysieren, die eine entscheidende Rolle im Prozess der Proteinherstellung spielt. Fortschritte in der Technologie ermöglichen eine tiefgehende Analyse der RNA-Diversität in Proben. Long-Read-RNA-Sequenzierung ist eine Technik, die den Wissenschaftlern hilft, die gesamte Struktur von RNA-Molekülen zu sehen. Sie bietet detailliertere Einblicke im Vergleich zu traditionellen Methoden und zeigt komplexe Muster, wie RNA gebildet und modifiziert wird.

Mit Long-Read-Sequenzierung können verschiedene Abschnitte der RNA, bekannt als Exons, miteinander verknüpft werden, und komplexe Spleissereignisse identifiziert werden. Spleissen ermöglicht das Mischen und Anpassen verschiedener RNA-Segmente, was zur Erstellung verschiedener Proteinformen führt. Das kann beeinflussen, wie Proteine in unseren Körpern funktionieren und interagieren.

Die zentrale Frage ist jetzt: Wie wirken sich diese RNA-Variationen auf die letztendlich produzierten Proteine aus? Um dies zu beantworten, ist es wichtig zu definieren, was die vollständigen Proteinversionen sein könnten.

Vorhersage von Proteinvarianten

Forscher haben Methoden entwickelt, um die gesamte Palette von Proteinvarianten vorherzusagen, die aus RNA-Sequenzierung entstehen können. Dabei wird die detaillierte Sequenz verwendet, die aus der Long-Read-RNA-Analyse gewonnen wurde, um potenzielle Proteinstrukturen vorherzusagen. Durch die Kartierung dieser vorhergesagten Proteinvarianten können Wissenschaftler ein breiteres Verständnis der Vielfalt gewinnen, die unter verschiedenen biologischen Bedingungen vorhanden ist.

Einblick in Spleissvariationen

Spleissen ist eine bedeutende Quelle für Proteindiversität und kann an mehreren Stellen in der RNA erfolgen. Es kann die Art und Weise verändern, wie Proteine konstruiert werden, selbst wenn die anfänglichen Veränderungen in der RNA-Sequenz klein sind. Manchmal können kleine Änderungen grössere Auswirkungen auf die Proteinstruktur haben, wie Änderungen an den Enden oder anderen wichtigen Regionen.

Zu verstehen, wie diese Variationen auftreten und welche Auswirkungen sie auf Proteine haben, ist entscheidend, um die Komplexität zu entschlüsseln, wie unsere Gene in funktionale Einheiten übersetzt werden. Es geht nicht nur um die Anwesenheit oder Abwesenheit bestimmter Segmente in der RNA; es geht darum, wie diese Teile verbunden sind und interagieren, um das endgültige Proteinprodukt zu bilden.

Werkzeuge zur Analyse

Um Proteinvariationen, die durch Spleissen verursacht werden, zu untersuchen, wurden verschiedene Werkzeuge und Datenbanken entwickelt. Sie helfen dabei, zu annotieren und zu analysieren, wie verschiedene Proteinformen funktionieren könnten. Einige Werkzeuge konzentrieren sich darauf, Unterschiede in der Nutzung der einzelnen Proteinvarianten zu quantifizieren. Andere helfen dabei, Merkmale von Proteinen zu kartieren, um zu verstehen, wie Spleissereignisse ihre Struktur und Funktion modifizieren.

Trotz dieser Fortschritte besteht weiterhin ein Bedarf an umfassenden Werkzeugen, die alle möglichen Auswirkungen von Variationen in Proteinsequenzen basierend auf den zugrunde liegenden RNA-Änderungen erfassen können.

Einführung von Biosurfer

Biosurfer ist ein neues Werkzeug, das entwickelt wurde, um Proteinisoformen zu analysieren, indem es Änderungen auf drei Ebenen verfolgt: RNA, offene Leserahmen (das sind die Segmente, die bestimmen, wie die RNA in Proteine übersetzt wird) und die Proteine selbst. Es bietet einen detaillierten Vergleich verschiedener Proteinformen und verknüpft Änderungen mit ihren RNA-Ursprüngen.

Durch die Eingabe von Daten aus RNA-Sequenzen organisiert das Biosurfer-Tool diese Informationen in ein leicht verständliches Format. Es hilft zu analysieren, wie verschiedene Änderungen in der RNA das produzierte Protein beeinflussen, und offenbart Einsichten, die möglicherweise nicht sofort offensichtlich sind, wenn man sich nur die genetischen Daten ansieht.

Analyse von Proteinvarianten aus menschlichen Daten

Biosurfer wurde angewendet, um eine grosse Menge an Proteinisoformen zu analysieren, die aus bekannten menschlichen Gen-Datenbanken stammen. Durch die Betrachtung dieser Proteine identifizierten Forscher zahlreiche veränderte Bereiche, die zu unterschiedlichen Proteinfunktionen führen könnten. Sie fanden heraus, dass viele Proteine mehrere Varianten hatten, was darauf hindeutet, dass selbst kleine RNA-Änderungen unterschiedliche Ergebnisse in der Proteinfunktion erzeugen können.

Diese Analyse umfasste die Untersuchung von Unterschieden am Anfang, in der Mitte und am Ende der Proteinsequenzen. Die Ergebnisse zeigten, dass viele dieser Unterschiede entweder aus direkten Änderungen in der RNA oder aus komplexeren Mechanismen stammen, wie Frameshifts, die das resultierende Protein drastisch verändern können.

N-terminal Variationen

Ein bedeutender Änderungsbereich findet am Anfang des Proteins statt, bekannt als N-Terminus. Änderungen hier können aufgrund unterschiedlicher Ausgangspunkte in der RNA auftreten. Einige Proteine könnten mit einer Sequenz in einer Variante und einer anderen in einer anderen beginnen. Indem sie die Gründe hinter diesen Variationen verfolgen, fanden die Forscher heraus, dass viele von ihnen von alternativen Startpunkten in der RNA stammten.

Andere entstanden aus gemeinsamen Ausgangspunkten. Solche Muster zeigen, wie Variationen in der RNA bestimmen können, welche Proteinversionen produziert werden und wie sie möglicherweise unterschiedlich funktionieren.

Interne Änderungen in Proteinen

Proteine haben oft Bereiche in der Mitte, die sich aufgrund von Veränderungen in der RNA verändern können. Eine grosse Anzahl dieser internen Proteinvariationen ist mit spezifischen Spleissereignissen verbunden. Zum Beispiel kann das Überspringen eines Exons zu einem fehlenden Stück im endgültigen Proteinprodukt führen.

Einige Variationen ergeben sich aus Kombinationen von Spleissereignissen, die zu umfangreicheren Veränderungen innerhalb der Proteinstruktur führen. Diese Änderungen zu identifizieren ist wichtig, um zu verstehen, wie Proteine sich voneinander unterscheiden können, selbst wenn sie aus demselben Gen stammen.

C-terminal Variationen

Änderungen treten auch am Ende der Proteine auf, bekannt als C-Terminus. Diese können entweder aus direkten Änderungen in der RNA resultieren, die unterschiedliche Stopp-Codons einführen, oder aus Frameshifts, die beeinflussen, wie das Ribosom die RNA liest. Das Verständnis dieser Variationen kann Einblicke darüber geben, wie Proteine gebildet werden und welche potenzielle Funktionalität sie in biologischen Prozessen haben.

Charakterisierung von Proteinvarianten in verschiedenen Kontexten

Um diese Proteinänderungen weiter zu untersuchen, analysierten die Forscher, wie Variationen in verschiedenen biologischen Situationen unterschiedlich sind. Dazu gehörte die Untersuchung von Proteinvarianten aus einer spezifischen menschlichen Stammzelllinie, was einen Vergleich zwischen vorhergesagten Varianten und denen aus bestehenden Gen-Datenbanken ermöglichte.

Die Ergebnisse zeigten, dass viele Muster konsistent waren, die vorhergesagten Isoformen jedoch oft neue Dimensionen der Proteindiversität enthüllten, insbesondere bei C-terminalen Änderungen, wo viele Proteine Varianten aufwiesen, die in früheren Annotationen nicht gesehen wurden.

Verknüpfung von Änderungen mit Funktionalität

Letztendlich verbessert die Möglichkeit, Veränderungen in Proteinen mit spezifischen RNA-Sequenzen zu verknüpfen, unser Verständnis davon, wie genetische Variationen Gesundheit und Krankheit beeinflussen können. Durch die Verbesserung der Werkzeuge und Techniken, die wir zur Analyse dieser Prozesse verwenden, können wir ein klareres Bild der komplexen Beziehungen zwischen unseren Genen, den produzierten Proteinen und deren Funktion im Körper gewinnen.

Fazit

Die Untersuchung der Proteindiversität und der Mechanismen, die sie antreiben, ist entscheidend für das Verständnis der Komplexität der menschlichen Biologie. Werkzeuge wie Biosurfer spielen eine wichtige Rolle dabei, diese Komplexität aufzubrechen und es den Forschern zu ermöglichen, tiefere Verbindungen zwischen RNA-Variationen, Proteindiversität und möglichen Auswirkungen auf die Gesundheit zu ziehen. Mit den fortlaufenden Fortschritten in Technologie und Bioinformatik sieht die Zukunft vielversprechend aus, um dieses Wissen zu nutzen, um unser Verständnis von Biologie und Medizin zu verbessern.

Originalquelle

Titel: Biosurfer for systematic tracking of regulatory mechanisms leading to protein isoform diversity

Zusammenfassung: Long-read RNA sequencing has shed light on transcriptomic complexity, but questions remain about the functionality of downstream protein products. We introduce Biosurfer, a computational approach for comparing protein isoforms, while systematically tracking the transcriptional, splicing, and translational variations that underlie differences in the sequences of the protein products. Using Biosurfer, we analyzed the differences in 32,799 pairs of GENCODE annotated protein isoforms, finding a majority (70%) of variable N-termini are due to the alternative transcription start sites, while only 9% arise from 5 UTR alternative splicing. Biosurfers detailed tracking of nucleotide-to-residue relationships helped reveal an uncommonly tracked source of single amino acid residue changes arising from the codon splits at junctions. For 17% of internal sequence changes, such split codon patterns lead to single residue differences, termed "ragged codons". Of variable C-termini, 72% involve splice- or intron retention-induced reading frameshifts. We found an unusual pattern of reading frame changes, in which the first frameshift is closely followed by a distinct second frameshift that restores the original frame, which we term a "snapback" frameshift. We analyzed long read RNA-seq-predicted proteome of a human cell line and found similar trends as compared to our GENCODE analysis, with the exception of a higher proportion of isoforms predicted to undergo nonsense-mediated decay. Biosurfers comprehensive characterization of long-read RNA-seq datasets should accelerate insights of the functional role of protein isoforms, providing mechanistic explanation of the origins of the proteomic diversity driven by the alternative splicing. Biosurfer is available as a Python package at https://github.com/sheynkman-lab/biosurfer.

Autoren: Gloria Sheynkman, M. Murali, J. Saquing, S. Lu, Z. Gao, B. Jordan, Z. Wakefield, A. Fiszbein, D. Cooper, P. Castaldi, D. Korkin

Letzte Aktualisierung: 2024-03-18 00:00:00

Sprache: English

Quell-URL: https://www.biorxiv.org/content/10.1101/2024.03.15.585320

Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.03.15.585320.full.pdf

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel