Die Auswirkungen der Genverdopplung auf die Evolution der Hunde
Ein Blick darauf, wie Gen-Duplikation die Genome und Evolution von Hunden formt.
― 8 min Lesedauer
Inhaltsverzeichnis
- Was ist Gen-Duplikation?
- Wie passiert Gen-Duplikation?
- Arten von Gen-Duplikationen
- Copy Number Variants (CNVs)
- Retrotransposition und Retrokopien
- Fortschritte in der Sequenzierungstechnologie
- Herausforderungen bei der Assemblierung duplizierter Regionen
- Genom von Hunden und Gen-Duplikationen
- Neueste Hundegenom-Assemblierungen
- Ergebnisse aus dem Mischka-Genom
- Analyse der Lesetiefe in Mischkas Assemblierung
- Analyse anderer Hundegenom-Assemblierungen
- Die Rolle der Retrokopien in Hundeganomen
- Schätzung der Insertionsraten von Retrokopien
- Fazit
- Originalquelle
Gen-Duplikation ist ein wichtiger Prozess in der Evolution. Sie passiert, wenn ein DNA-Abschnitt kopiert wird, was zu mehreren Kopien eines Gens führt. Dieser Prozess kann dazu führen, dass sich Organismen anders entwickeln und auf ihre Umwelt reagieren. Das Verständnis von Gen-Duplikation hilft Forschern, Einblicke in die Komplexität von Genomen zu bekommen und wie neue Funktionen entstehen können.
Was ist Gen-Duplikation?
Gen-Duplikation ist eine Art struktureller Veränderung in der DNA. Strukturvariationen beinhalten Modifikationen im Chromosom, die ziemlich gross sein können. Diese Variationen können Einfügungen, Löschungen und andere Änderungen in der Anzahl der Genkopien umfassen. Wenn Gene dupliziert werden, können sie neue Funktionen entwickeln. Duplizierte Gene sind mit wichtigen biologischen Prozessen verbunden, darunter Wachstum und Reaktion auf Umweltveränderungen.
Wie passiert Gen-Duplikation?
Gen-Duplikationen können auf zwei Hauptarten erfolgen. Die erste Methode ist die Rücktranskription von RNA. In diesem Fall wird RNA zurück in DNA kopiert und in das Genom integriert. Die zweite Methode beinhaltet die direkte Duplikation von DNA-Abschnitten.
DNA-Duplikationen können die Duplikation des gesamten Genoms umfassen, was in der evolutionären Geschichte mehrere Male passiert ist. Diese vollständige genomische Duplikation fügt der DNA von Organismen, insbesondere von Wirbeltieren, Ebenen der Komplexität hinzu. Alternativ können kleinere Duplikationen auftreten und nur bestimmte Teile eines Genoms betreffen, was zu zusätzlichen Genkopien und dem Wachstum verwandter Genfamilien führt.
Arten von Gen-Duplikationen
Segmentale Duplikationen sind eine spezifische Form der Gen-Duplikation, die definiert ist als länger als 1.000 Basenpaare und in mehr als einer Kopie in einem haploiden Genom existiert. Diese Duplikationen unterscheiden sich von gängigen Wiederholungen in der DNA, die durch andere Prozesse entstehen.
Segmentale Duplikationen werden in drei Typen je nach ihren Standorten unterteilt:
- Tandem-Duplikationen treten auf, wenn duplizierte Gene nebeneinander liegen.
- Intra-chromosomale verteilte Duplikationen passieren im selben Chromosom, aber mit dazwischen liegenden Sequenzen.
- Inter-chromosomale verteilte Duplikationen beinhalten Kopien, die sich auf separaten Chromosomen befinden.
Die Sequenzen zwischen diesen Duplikaten können auch Gene enthalten, wodurch sie anfällig für weitere Duplikationen oder Löschungen werden. Gen-Duplikationen beginnen oft mit Fehlern, die während der DNA-Replikation auftreten.
CNVs)
Copy Number Variants (Wenn es Unterschiede in der Anzahl der Genkopien unter Individuen oder Populationen gibt, nennt man sie Copy Number Variants (CNVs). Diese Varianten können erhebliche Auswirkungen auf die genetische Vielfalt innerhalb von Arten haben.
Retrotransposition und Retrokopien
Gen-Duplikationen können auch durch einen Prozess namens Retrotransposition entstehen. Bei diesem Mechanismus werden RNA-Transkripte zurück in DNA umgewandelt und an neuen Stellen in das Genom eingefügt. Diese resultierenden Duplikate, bekannt als Retrokopien, enthalten typischerweise keine Introns und haben charakteristische Merkmale, einschliesslich eines poly(A)-Schwanzes und flankierender Zielstelle-Duplikationen. Während Retrokopien sich auf jede Kopie beziehen können, die aus einem RNA-Transkript gemacht wurde, wird "Retrogen" speziell verwendet, um diejenigen zu bezeichnen, die eine Funktion beibehalten.
Retrokopien können manchmal ihre Funktionsfähigkeit durch ansammelnde Mutationen verlieren und sich in Pseudogene ohne Funktion verwandeln. Manche Retrokopien bleiben jedoch funktional und sind entscheidend für wichtige biologische Prozesse, die Merkmale wie Immunreaktionen, Stoffwechsel und sogar Krankheiten bei Menschen und Hunden beeinflussen.
Fortschritte in der Sequenzierungstechnologie
Neueste Entwicklungen in der Sequenzierungstechnologie haben es Forschern ermöglicht, grosse Mengen an Proben effizient zu analysieren. Dennoch bleibt die Identifizierung und Analyse von Duplikationen in Genomen eine schwierige Aufgabe. Eine gängige Methode besteht darin, die höhere Lesetiefe in Daten der gesamten Genomsequenzierung im Vergleich zu einem Referenzgenom zu überprüfen. Ein anderer Ansatz besteht darin, ein Genom mit sich selbst auszurichten und nach wiederholten Sequenzen zu suchen. Es ist wichtig, gängige Wiederholungen während dieses Prozesses herauszufiltern, da sie die Genauigkeit der Ergebnisse beeinflussen können.
Herausforderungen bei der Assemblierung duplizierter Regionen
Bei der Assemblierung duplizierter Regionen treten verschiedene Herausforderungen auf. Fehler in der Assemblierung können zu zusammengefallenen Duplikationen führen, bei denen duplizierte Sequenzen möglicherweise nur einmal in der endgültigen Assemblierung erscheinen. Dies wird oft an den Enden der zusammengesetzten Segmente gesehen. Fehlassemblierungen können auch falsche Duplikationen oder chimäre Segmente erzeugen, bei denen nicht benachbarte Sequenzen falsch zusammengefügt sind.
Die Komplexität wächst weiter, da die meisten analysierten Genome diploid sind, was bedeutet, dass sie zwei Versionen jedes Chromosoms tragen. Daher kann der in einer Genome-Assemblierung dargestellte Duplikationsinhalt nicht genau den tatsächlichen Inhalt der Duplikationen im untersuchten Genom widerspiegeln.
Genom von Hunden und Gen-Duplikationen
Hunde sind ein faszinierendes Fallbeispiel für Genetik und Genomik. Sie haben sich zusammen mit Menschen entwickelt und wurden erheblich künstlich selektiert. Das erste Referenzgenom für Hunde wurde 2005 veröffentlicht, mit anschliessenden Aktualisierungen zur Verfeinerung dieser genomischen Daten.
Studien zu Hundegenen haben gezeigt, dass etwa 4,21% des Referenzgenoms des Hundes aus aktuellen segmentalen Duplikationen bestehen. Dazu gehören viele Gene, die für Variabilität in der Anzahl der Kopien bekannt sind. Darüber hinaus wurden Unterschiede in CNVs mit bestimmten Gesundheitszuständen bei Hunden und bestimmten physischen Merkmalen in Verbindung gebracht.
Neueste Hundegenom-Assemblierungen
Mehrere Genom-Assemblierungen von Haushunden und Wölfen wurden mithilfe von Langlese-Sequenzierungstechnologien erzeugt. Diese neuen Assemblierungen tragen zu unserem Verständnis der biologischen Genomik von Hunden bei und enthüllen zuvor unbekannte Gene und regulatorische Elemente.
Allerdings haben sich viele dieser Studien nicht intensiv mit dem Duplikationsinhalt innerhalb dieser Assemblierungen beschäftigt. Um diese Lücke zu schliessen, haben Forschungsgruppen versucht, Duplikationen in mehreren kürzlich veröffentlichten Hundegenom-Assemblierungen zu charakterisieren. Sie wenden computergestützte Analysen an, einschliesslich selbst-Ausrichtung des Genoms und Analyse der Lesetiefe, um Gen-Duplikationen zu identifizieren und zu bewerten.
Ergebnisse aus dem Mischka-Genom
Eine bemerkenswerte Genom-Assemblierung ist die von Mischka, einem Deutschen Schäferhund. Diese Assemblierung dient als Referenzgenom und wurde intensiv zur Analyse von Duplikationen verwendet. Durch die selbst-Ausrichtung des Genoms identifizierten die Forscher eine signifikante Anzahl von duplizierten Segmenten im Mischka-Genom.
Viele dieser Duplikate sind klein, und ein grosser Prozentsatz von ihnen kann in hochfrequenten Clustern existieren. Die identifizierten Duplikationen erstrecken sich über verschiedene Segmente und zeigen, dass Duplikationen nicht gleichmässig entlang der Autosomen verteilt sind.
Analyse der Lesetiefe in Mischkas Assemblierung
Um die Ergebnisse der selbst-Ausrichtung des Genoms zu ergänzen, wurde eine Analyse der Lesetiefe auf Mischkas Genom mit Illumina-Sequenzierungsdaten durchgeführt. Diese Methode identifizierte ebenfalls viele Duplikationen und bestätigte die Ergebnisse der Selbst-Ausrichtung. Die Analyse zeigte, dass diese Duplikationen ungleichmässig über die Chromosomen verteilt waren und in der Grösse variieren.
Während die Analyse der Lesetiefe und die selbst-Ausrichtung des Genoms unterschiedliche Ergebnisse lieferten, deuteten sie im Allgemeinen auf ähnliche Trends bezüglich der Duplikationshäufigkeit über die Chromosomen hin. Der gesamte Duplikationsinhalt, wie er durch beide Methoden ermittelt wurde, lieferte Einblicke in die komplexe Struktur des Hundegenoms.
Analyse anderer Hundegenom-Assemblierungen
Die Analysen wurden auf andere kürzlich veröffentlichte Hundegenom-Assemblierungen ausgeweitet. Dazu gehörte die Untersuchung des Duplikationsinhalts dieser Assemblierungen, von denen viele mit unterschiedlichen Sequenzierungstechnologien erstellt wurden. Jede Assemblierung zeigte unterschiedliche Niveaus des Duplikationsinhalts, wobei einige Assemblierungen nur 1,8% und andere bis zu 5,6% aufwiesen.
Die Forscher strebten an, die beobachteten Variationen im Duplikationsinhalt mit Faktoren wie Sequenzierungsqualität und Assemblierungsmethoden zu verbinden. Durch den Vergleich des Duplikationsinhalts über verschiedene Assemblierungen erhielten sie wertvolle Informationen über die dynamische Natur von Gen-Duplikationen in Hundeganomen.
Die Rolle der Retrokopien in Hundeganomen
Neben traditionellen Duplikationen haben die Forscher auch Retrokopien in den Hundegenom-Assemblierungen untersucht. Retrokopien zeigten eine starke Assoziation mit hochfrequenten Duplikationen in der Mischka-Assemblierung. Die Analyse bestätigte, dass viele Retrokopien die Merkmale der Retrotransposition aufwiesen und das Verständnis dafür vertieften, wie Duplikationen in Genomen auftreten können.
Umfragen zu Retrokopien in mehreren Hundegenom-Assemblierungen deuteten darauf hin, dass diese Retrokopien oft signifikante Sequenzähnlichkeiten zu ihren Elterngenen aufwiesen. Sie hebten auch die Anwesenheit funktionaler Retrokopien hervor, die Auswirkungen auf biologische Prozesse bei Hunden haben könnten.
Schätzung der Insertionsraten von Retrokopien
Um die Rate der Retrokopie-Insertationen bei Hunden zu bestimmen, verglichen die Forscher mehrere Hund-Assemblierungen mit einem Wolfgenom. Dieser Vergleich offenbarte eine hohe Frequenz von Retrokopie-Insertationen, die über Generationen hinweg auftreten. Die durchschnittliche Insertionsrate von Retrokopien wurde als höher bei Hunden als bei Menschen geschätzt, was auf eine dynamischere Evolution von Genen bei Hunden hindeutet.
Fazit
Gen-Duplikation spielt eine kritische Rolle in der Evolution und Entwicklung von Organismen und ermöglicht genetische Variation und das Entstehen neuer Funktionen. Durch das Studium des Duplikationsinhalts in Hundeganomen gewinnen Forscher Einblicke in die Komplexität der genetischen Vielfalt. Weiterführende Fortschritte in der Sequenzierungstechnologie und analytischen Methoden können die Feinheiten der Gen-Duplikationen und deren Beiträge zur Evolution weiter aufschlüsseln.
Insgesamt beleuchtet das Verständnis dieser Prozesse nicht nur die genetische Vielfalt bei Hunden, sondern kann auch breitere Implikationen für das Studium der Evolution bei anderen Arten haben.
Titel: Duplications and retrogenes are numerous and widespread in modern canine genomic assemblies
Zusammenfassung: Recent years have seen a dramatic increase in the number of canine genome assemblies available. Duplications are an important source of evolutionary novelty and are also prone to misassembly. We explored the duplication content of nine canine genome assemblies using both genome self-alignment and read-depth approaches. We find that 8.58% of the genome is duplicated in the canFam4 assembly, derived from the German Shepherd Dog Mischka, including 90.15% of unplaced contigs. Highlighting the continued difficulty in properly assembling duplications, less than half of read-depth and assembly alignment duplications overlap, but the mCanLor1.2 Greenland wolf assembly shows greater concordance. Further study shows the presence of multiple segments that have alignments to four or more duplicate copies. These high-recurrence duplications correspond to gene retrocopies. We identified 3,892 candidate retrocopies from 1,316 parental genes in the canFam4 assembly and find that approximately 8.82% of duplicated base pairs involve a retrocopy, confirming this mechanism as a major driver of gene duplication in canines. Similar patterns are found across eight other recent canine genome assemblies, with multiple metrics supporting the high-quality of the mCanLor1.2 wolf assembly constructed using PacBio HiFi reads. Comparison between the wolf and other canine assemblies found that approximately 92% of retrocopy insertions are shared between assemblies. By calculating the number of generations since genome divergence, we estimate that new retrocopy insertions appear, on average, in 1 out of 3,514 births. Together, our analyses illustrate the impact of retrogene formation on canine genomes and highlight the variable representation of duplicated sequences among recently completed canine assemblies. SignificanceDuplications are highly influential on evolution, but are commonly misassembled, especially in lagging genomic groups like canines. We assessed nine canine assemblies for duplication presence, and found enrichment for acrocentric regions, misattribution of duplications to unplaced contigs, and the presence of short, high-recurrence duplications. Investigating further, we find high numbers of retrocopies retaining hallmarks present in the canine assemblies, and determine a rate of novel retrocopy insertion at 1 in 3,514 births.
Autoren: Jeffrey M Kidd, A. K. Nguyen, M. S. Blacksmith
Letzte Aktualisierung: 2024-05-08 00:00:00
Sprache: English
Quell-URL: https://www.biorxiv.org/content/10.1101/2023.10.31.564742
Quell-PDF: https://www.biorxiv.org/content/10.1101/2023.10.31.564742.full.pdf
Lizenz: https://creativecommons.org/licenses/by-nc/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.