Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Biologie# Genomik

RNA-Sequenzierung: Einblicke und Herausforderungen in genetischen Studien

Die Erforschung der Vorteile und Einschränkungen von RNA-Sequenzierung in der genetischen Forschung.

― 7 min Lesedauer


RNA-seq Einblicke undRNA-seq Einblicke undEinschränkungender Analyse genetischer Varianten.Untersuchung der Rolle von RNA-seq bei
Inhaltsverzeichnis

RNA-Sequenzierung, oder RNA-seq, ist eine moderne Technik, um zu messen, wie viel von einem bestimmten Gen in Zellen ausgedrückt wird. Es hilft Wissenschaftlern, genetische Informationen von lebenden Organismen zu analysieren. Diese Methode ist für verschiedene Anwendungen populär geworden, zum Beispiel um die Genexpression zu studieren, zu verstehen, wie Gene RNA bilden, und um Veränderungen in der DNA zu finden, die die Genexpression beeinflussen könnten.

Warum RNA-seq verwenden?

RNA-seq bietet eine Möglichkeit, Informationen zur Genaktivität zu sammeln. Es erlaubt Forschern zu sehen, welche Gene in verschiedenen Geweben aktiviert oder deaktiviert sind. Es gibt jedoch Herausforderungen, wenn man sich ausschliesslich auf RNA-seq für genetische Studien verlässt. Es zielt normalerweise auf weniger genetische Fragmente als die DNA-Sequenzierung. Ausserdem konzentriert sich RNA-seq auf messenger RNA (mRNA), die nur einen kleinen Teil des gesamten genetischen Materials eines Organismus darstellt. Das kann dazu führen, dass viele genetische Variationen übersehen werden, wenn man nur RNA-seq verwendet.

Unterschiede zwischen RNA-seq und DNA-Sequenzierung

Wenn Wissenschaftler eine DNA-Sequenzierung durchführen, sammeln sie eine umfassende Sicht auf das gesamte Genom, das alle kodierenden und nicht-kodierenden Bereiche der DNA umfasst. Im Gegensatz dazu ist RNA-seq auf die Bereiche beschränkt, die RNA produzieren, hauptsächlich die, die an der Proteinproduktion beteiligt sind. Das führt dazu, dass bei der Verwendung von RNA-seq weniger genetische Variationen entdeckt werden.

Zum Beispiel analysieren typische DNA-Studien Hunderte von Millionen von Reads für eine gründliche Abdeckung, während RNA-Studien im Allgemeinen weniger Reads analysieren, was die Zuverlässigkeit der Ergebnisse beeinflusst. Generell zielt RNA-seq darauf ab, die Genexpression mit etwa 30 Millionen Reads zu messen, während detailliertere Studien etwa 100 Millionen Reads erfordern könnten.

Die Herausforderung der Variantenerkennung

In der genetischen Forschung ist die Identifizierung von Variationen in der DNA, die als Variantenerkennung bezeichnet wird, entscheidend. Diese Variationen können uns helfen, Unterschiede in Merkmalen zwischen Individuen zu verstehen. Da RNA-seq jedoch weniger Variationen erfasst als die DNA-Sequenzierung, kann sich das Verlassen auf RNA-Daten als unvollständig herausstellen.

Studien, die RNA-seq verwenden, haben gezeigt, dass weniger genetische Varianten identifiziert werden als bei der DNA-Sequenzierung. Frühe Forschungen mit RNA-seq bei Rindern ergaben zum Beispiel eine begrenzte Anzahl von genetischen Variationen im Vergleich zu ähnlichen DNA-Studien. Dieses Missverhältnis wirft Fragen zur Zuverlässigkeit der Variantenerkennung auf, wenn man nur RNA-seq-Daten verwendet.

Verbesserung der Variantenerkennung mit fortgeschrittenen Techniken

Die Variantenerkennung aus RNA-seq-Daten ist weniger verbreitet als bei der DNA-Sequenzierung. Fortschritte haben jedoch zu besseren Werkzeugen für die Variantenerkennung aus RNA-Daten geführt. Eines dieser Werkzeuge heisst DeepVariant, das kürzlich für RNA-seq angepasst wurde. Dieses Upgrade hat zu einer genaueren Variantenerkennung geführt und macht RNA-seq zu einer zuverlässigeren Option für genetische Studien als früher.

Mit diesen Fortschritten können Forscher auch RNA-Bearbeitungsereignisse identifizieren, bei denen das RNA-Molekül Veränderungen durchläuft, die die Genfunktion beeinflussen können. Diese Veränderungen zu erkennen ist wichtig, da sie eine wesentliche Rolle dabei spielen könnten, wie Gene Merkmale ausdrücken.

Untersuchung von Ausdrucks- und Spleiss-Quantitativen Merkmal-Genloci (e/sQTL)

Forscher konzentrieren sich auch darauf, wie bestimmte genetische Regionen Merkmale durch Ausdrucks- und Spleiss-Quantitative Merkmale-Genloci (e/sQTL) beeinflussen. Dabei suchen sie nach Verbindungen zwischen genetischen Variationen und den Levels der Genexpression oder des Spleissens. Durch die Analyse von e/sQTL können Wissenschaftler bestimmen, wie genetische Variationen innerhalb von Populationen mit wichtigen Merkmalen bei Nutztieren, wie Fruchtbarkeit oder Milchproduktion, zusammenhängen.

Unsere Forschung

In unserer Forschung haben wir ein fortschrittliches Werkzeug namens DeepVariant angewendet, um genetische Varianten aus RNA-Sequenzierungsdaten zu analysieren, die aus Rindergeweben gesammelt wurden. Wir haben festgestellt, dass die RNA-seq-Variantenerkennungen für wichtige genetische Marker angereichert sind und stark mit Varianten korrelieren, die aus der DNA-Sequenzierung identifiziert wurden.

Durch unsere Analyse haben wir eine beträchtliche Anzahl von einzelner Nukleotidunterschieden zwischen DNA- und RNA-Sequenzen beobachtet. Wir haben auch bemerkt, dass die Qualität der Variantenerkennung abnahm, als die Sequenzierungsausdehnung sank. Das zeigt, dass genug Reads entscheidend für zuverlässige Ergebnisse sind.

Ausrichtung von DNA- und RNA-Daten

In unserer Studie haben wir öffentlich verfügbare DNA- und RNA-Sequenzierungsdaten von Rindergeweben genutzt. Mit Ausrichtungstools haben wir DNA- und RNA-Reads auf ein Referenzgenom abgebildet. Durch die Analyse der Abdeckung des Referenzgenoms haben wir entdeckt, dass die DNA-Sequenzierung eine konsistentere Abdeckung in verschiedenen Regionen im Vergleich zur RNA-Sequenzierung bot.

Die RNA-seq-Abdeckung war bemerkenswert angereichert in Regionen, die Proteine produzieren, was zu erwarten war. Es gab jedoch auch Beobachtungen von RNA-Abdeckung in Regionen, die normalerweise keine Proteine produzieren, was darauf hindeutet, dass die RNA-Daten mehr enthalten könnten als nur die kodierenden Sequenzen.

Varianten aus ausgerichteten Daten erkennen

Wir haben DeepVariant verwendet, um Varianten aus unseren DNA- und RNA-Daten zu erkennen. Unsere Ergebnisse zeigten, dass während die DNA-Sequenzierung insgesamt mehr Varianten erkannte, die RNA-Sequenzierung dennoch eine signifikante Anzahl von Varianten erfasste, insbesondere in Regionen, in denen Gene stark exprimiert wurden.

Die Ergebnisse zeigten auch, dass die meisten der aus RNA-Daten erkannten Varianten tatsächlich in Regionen lagen, die mit exprimierten Genen korrespondierten, und ein grosser Teil der Varianten überlappte zwischen DNA- und RNA-Datensätzen.

Analyse der Genauigkeit von RNA-Varianten

In unserer Analyse haben wir bewertet, wie genau die RNA-seq-Varianten die genetischen Varianten darstellten, die durch DNA-Sequenzierung gefunden wurden. Wir fanden heraus, dass der Grad der Genexpression die Genauigkeit der Variantenerkennung erheblich beeinflusste. Bei hoch exprimierten Genen zeigten unsere Ergebnisse eine hohe Genauigkeit bei der Identifizierung von Varianten. Bei weniger exprimierten Genen fiel die Genauigkeit jedoch erheblich ab.

Wir haben auch Probleme im Zusammenhang mit allelspezifischer Expression (ASE) identifiziert, bei denen bestimmte Allele bevorzugt über andere exprimiert werden können, was den Prozess der Variantenerkennung kompliziert. Dieser Effekt beeinträchtigte unsere Fähigkeit, genetische Unterschiede in einigen Fällen zuverlässig zu bestimmen.

Bedeutung der Genexpressionslevels

Wir haben herausgefunden, dass RNA-seq-Daten, insbesondere wenn sie bei tieferer Abdeckung analysiert werden, wertvolle Einblicke in genetische Variationen geben können, die Merkmale beeinflussen. Die Genauigkeit der Analyse ist jedoch stark davon abhängig, wie gut Gene in den untersuchten Geweben exprimiert werden.

Unsere Ergebnisse zeigten, dass RNA-seq in der Lage ist, Tausende von Varianten zu erkennen, aber die Breite der Ergebnisse nicht so umfangreich ist wie bei DNA-seq. Es ist wichtig, die Expressionslevels in die Analyse einzubeziehen, um kritische Variationen nicht zu übersehen.

Untersuchung von Ausdrucks-QTL

Wir haben untersucht, ob RNA-seq-Daten allein für das Mapping von Ausdrucks-QTL (EQTL) genutzt werden könnten, indem wir RNA-seq-Varianten verwendeten, um sie mit Genexpressionslevels zu verknüpfen. Unsere Ergebnisse zeigten, dass ein hoher Prozentsatz von eQTL mit RNA-seq-Daten allein identifiziert werden konnte, was darauf hindeutet, dass RNA-seq eine wertvolle Alternative bieten kann, wenn DNA-Daten nicht verfügbar sind.

Wir haben jedoch auch festgestellt, dass, während RNA-seq viele eQTL identifizierte, es immer noch signifikante Diskrepanzen mit denen gab, die mit DNA-seq identifiziert wurden. Die auf der Grundlage von RNA-seq gewählten Regionen stimmten nicht immer mit denen aus den DNA-Daten überein, was darauf hinweist, dass man vorsichtig sein sollte, wenn man Ergebnisse nur aus RNA interpretiert.

Verständnis der RNA-DNA-Unterschiede

Im Laufe unserer Forschung haben wir zahlreiche Fälle gefunden, in denen RNA-seq Varianten identifizierte, die in der DNA-Sequenzierung nicht vorhanden waren. Diese Unterschiede werfen Fragen über ihre wahren Ursprünge auf. Einige könnten RNA-Bearbeitungsereignisse widerspiegeln, während andere durch technische Einschränkungen bei der Sequenzierung bedingt sein könnten.

Trotz der Unsicherheiten zeigen unsere Ergebnisse, dass RNA-seq eine vielfältige Menge von Varianten erfasst, die durch DNA-Sequenzierung allein nicht nachweisbar sind. Das unterstreicht die Notwendigkeit, diese RNA-DNA-Unterschiede gründlich zu untersuchen, um ein vollständiges Verständnis der genetischen Variation zu erlangen.

Fazit

RNA-Sequenzierung ist ein wichtiges Werkzeug für das Studium der Genexpression, hat aber Einschränkungen bei der Variantenerkennung. Obwohl RNA-seq wertvolle genetische Informationen aufdecken kann, kann die alleinige Abhängigkeit von Genexpressionslevels zu Inkonsistenzen im Vergleich zur DNA-Sequenzierung führen.

Unsere Ergebnisse legen nahe, dass RNA-seq zwar eine bedeutende Anzahl von genetischen Varianten im Zusammenhang mit Merkmalen identifizieren kann, es sollte jedoch die DNA-Sequenzierungsmethoden nicht vollständig ersetzen. Jede Technik hat ihre Stärken und Schwächen, und ihre gleichzeitige Anwendung könnte ein umfassenderes Verständnis der genetischen Variation und ihrer Auswirkungen auf Merkmale bei Nutztieren und anderen Organismen ermöglichen.

Zukünftige Forschungen sollten weiterhin RNA-Sequenzierungsmethoden verfeinern, die Herausforderungen der Variantenerkennung angehen und die Ursprünge und Auswirkungen der beobachteten Unterschiede zwischen RNA- und DNA-Daten erkunden.

Originalquelle

Titel: RNA sequencing variants are enriched for eQTL in cattle tissues

Zusammenfassung: Association testing between molecular phenotypes and genomic variants can help to understand how genotype affects phenotype. RNA sequencing provides access to molecular phenotypes such as gene expression and alternative splicing while DNA sequencing or microarray genotyping are the prevailing options to obtain genomic variants. Here we genotype variants for 74 male Braunvieh cattle from both DNA and deep total RNA sequencing from three tissues. We show that RNA sequencing calls approximately 40% of variants (7-10 million) called from DNA sequencing, with over 80% precision, rising to over 92% of variants called with nearly 98% precision in highly expressed coding regions. Allele-specific expression and putative post-transcriptional modifications negatively impact variant genotyping accuracy from RNA sequencing and contribute to RNA-DNA differences. Variants called from RNA sequencing detect roughly 75% of eGenes identified using variants called from DNA sequencing, demonstrating a nearly 2-fold enrichment of eQTL variants. We observe a moderate-to-strong correlation in nominal association p-values (Spearman {rho}2[~]0.6), although only 9% of eGenes have the same top associated variant. We also find several highly significant RNA variant-only eQTL, demonstrating that caution must be exercised beyond filtering for variant quality or imputation accuracy when analysing or imputing variants called from RNA sequencing.

Autoren: Alexander S Leonard, X. M. Mapel, H. Pausch

Letzte Aktualisierung: 2024-05-02 00:00:00

Sprache: English

Quell-URL: https://www.biorxiv.org/content/10.1101/2024.04.29.591607

Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.04.29.591607.full.pdf

Lizenz: https://creativecommons.org/licenses/by-nc/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel