Einblicke in den Genfluss durch genealogische Asymmetrie
Forschung zeigt, wie Gene fliessen, indem sie die Länge von genealogischen Ästen analysieren.
― 8 min Lesedauer
Inhaltsverzeichnis
- Methoden zur Erkennung des Gene-Flusses
- Modellbasierte Methoden
- Untersuchung des Gene-Flusses durch genealogische Asymmetrie
- Schätzung der genealogischen Asymmetrie
- Die Herausforderung der Rekombination
- Bidirektionaler Gene-Fluss
- Anwendungen in der realen Welt: Die Heliconius-Schmetterlinge
- Analyse von Odocoileus-Rehen
- Fazit
- Originalquelle
Mischungen zwischen nah verwandten Arten können in der Natur vorkommen und Hybride schaffen. Diese Hybride gedeihen vielleicht nicht so gut wie ihre Elternarten, was beeinflusst, wie Gene zwischen ihnen fliessen. Studien zu vollständigen Genomsequenzen haben gezeigt, dass es wahrscheinlich schon historisch zu einer Gene-Mischung gekommen ist, selbst bei Arten, die seit Millionen von Jahren getrennt sind. In letzter Zeit ist die Menge an genomischen Daten aus natürlichen Populationen stark gestiegen, zusammen mit besseren Methoden, um diese Gene-Mischung zu identifizieren und zu verstehen. Das ermöglicht Wissenschaftlern, detaillierte Informationen über den Gene-Fluss in der Vergangenheit und die laufende Mischung zwischen Arten in der Natur zu sammeln.
Methoden zur Erkennung des Gene-Flusses
Wenn Wissenschaftler sich anschauen, wie der Gene-Fluss über die Zeit zustande kam, denken sie oft an die Familiengeschichte von Individuen aus mehreren Populationen. Eine gängige Methode, um dies zu verstehen, ist die Multi-Species-Coalescent-Theorie, die beschreibt, wie Arten sich abspalten und über die Zeit entwickeln. Allerdings bedeutet der zufällige Charakter dieses Abspaltungsprozesses, dass die Familiengeschichten nicht immer mit der Geschichte der Arten selbst übereinstimmen. Wenn Arten sich teilen, kann die Gene-Mischung dazu führen, dass bestimmte Familienstämme häufiger vorkommen als andere, was ein Ungleichgewicht in den durchschnittlichen Längen der Familienzweige erzeugt.
Eine bekannte Methode, um dieses Ungleichgewicht in Familie-Bäumen zu identifizieren, ist der ABBA-BABA-Test. Er wurde verwendet, um Mischungen zwischen Neandertalern und Vorfahren moderner Menschen zu erkennen und wurde auf zahlreiche Datensätze angewendet. Während er den vergangenen Gene-Fluss zwischen verschiedenen Populationen erkennen kann, liefert er keine klaren Details darüber, wie viel, in welche Richtung oder wann diese Mischung stattfand. Diese Einschränkung hat zur Entwicklung anderer Methoden geführt, die entweder die Genauigkeit dieser Messungen verbessern oder detailliertere Informationen liefern.
Zwei grosse Vorteile dieser auf Ungleichgewicht basierenden Methoden sind ihre Anpassungsfähigkeit und Einfachheit. Zum Beispiel können Forscher den Gene-Fluss über viele Populationen analysieren, indem sie den ABBA-BABA-Test auf verschiedene Gruppierungen von Proben anwenden. Sie können diese Methoden auch auf gesamte Genome anwenden, um Bereiche zu finden, in denen Mischungen stattgefunden haben. Die verwendeten Daten sind einfach: Sie basieren auf dem Ungleichgewicht in genetischen Variationen, das ausgewogen erscheinen sollte, wenn es keinen Gene-Fluss gäbe.
Trotz ihrer Vorteile sind Methoden wie der ABBA-BABA-Test etwas eingeschränkt, weil sie nur einen kleinen Teil der Informationen nutzen, die in Genom-Proben vorhanden sind. Daher haben es diese Methoden schwer, zwischen Gene-Fluss und bestimmten Szenarien zu unterscheiden, die mit der Struktur von Vorfahrenpopulationen oder Variationen in Mutationsraten unter den Populationen zu tun haben.
Modellbasierte Methoden
Eine andere Kategorie von Methoden beinhaltet das explizite Modellieren des Gene-Flusses im historischen Kontext einer Population. Diese Methoden ermöglichen es Forschern, Statistiken aus beobachteten Genomsequenzen mit theoretischen Modellen mit und ohne Gene-Fluss zu vergleichen. Sie können Migrations- oder Mischungsraten schätzen, zusammen mit anderen demografischen Parametern. Ein grosser Vorteil dieser modellbasierten Ansätze ist, dass sie ein „best-fitting“ Modell der evolutionären Geschichte bieten, das leichter zu interpretieren sein kann als einfach nur zu erkennen, ob Gene-Fluss vorhanden ist.
Zudem neigen modellbasierte Methoden dazu, die in genomischen Daten enthaltenen Informationen besser zu nutzen als ungleichgewichtbasierte Methoden, die sich nur auf einen engen Satz genetischer Variationen konzentrieren. Dies hat dazu geführt, dass modellbasierte Inferenz eine beliebte Wahl für Forscher im Bereich der Populationsgenomik geworden ist, mit zahlreichen verfügbaren Methoden zur Auswahl.
Allerdings bringen modellbasierte Ansätze ihre eigenen Herausforderungen mit sich. Zum einen kann es schwierig sein zu bestimmen, was in den Daten auf Gene-Fluss hindeutet und ob dieses Signal aufgrund technischer Fehler entstanden sein könnte. Die Ergebnisse, die von diesen Methoden produziert werden, hängen auch von einem begrenzten Satz vereinfachter Modelle ab, und wenn die wahren historischen Prozesse komplex sind, passen die Modelle möglicherweise nicht gut.
Neuere Studien haben gezeigt, dass bestimmte modellbasierte Methoden fälschlicherweise Gene-Fluss zwischen nah verwandten, genetisch isolierten Arten vorschlagen können, wenn die natürliche Selektion berücksichtigt wird. Die Ergebnisse solcher Analysen unterstreichen oft die Notwendigkeit für Ansätze, die weniger anfällig für Fehlinterpretationen sind und die Komplexitäten realer evolutionärer Prozesse bewältigen können.
Untersuchung des Gene-Flusses durch genealogische Asymmetrie
In dieser Arbeit liegt der Fokus darauf, wie die Asymmetrie in genealogischen Zweiglängen auf vergangenen Gene-Fluss zwischen zwei kürzlich divergierten Populationen hinweisen kann. Es wird das Isolation-Migration-Modell verwendet, um genealogische Eigenschaften mit einer kleinen Stichprobe von Genomen zu studieren. Das Ziel ist nicht, Asymmetrie zu nutzen, um spezifische Parameter des Modells zu schätzen, sondern zu zeigen, wie diese Asymmetrie auf Gene-Fluss hinweisen kann, der aus einer Divergenz zweier Populationen resultiert.
Eine wichtige Erkenntnis ist, dass wenn zwei unterschiedliche Populationen sich divergiert haben und es keinen Gene-Fluss gibt, die Längen der Äste in Genealogien, die beide Populationen betreffen, gleich sein sollten. Wenn es jedoch Gene-Fluss gibt, wird diese Symmetrie gestört. Durch das Verständnis der erwarteten Längen dieser Äste in Genealogien können Forscher Beweise für vergangenen Gene-Fluss sammeln.
Das Szenario wird durch Genealogien analysiert, die Linien aus zwei Populationen betreffen. Die Analyse zeigt, dass unter bestimmten Annahmen, einschliesslich keiner Divergenz oder gleicher Populationsgrössen, die Ästchenlängen tendenziell gleich sind. Doch in realistischen Situationen, die post-Divergenzmischungen betreffen, sollte es Abweichungen geben, was die Asymmetrie zu einem klaren Signal für Gene-Fluss macht.
Schätzung der genealogischen Asymmetrie
Der Effekt des Gene-Flusses kann quantifiziert werden, indem genetische Variationen aus beiden Populationen gesammelt werden. Forscher konzentrieren sich auf Genvariationen, die genealogische Inkongruenz anzeigen, wobei die Genealogie nicht mit dem erwarteten Artenbaum übereinstimmt. Sie können externe Ästchenlängen messen und die Unterschiede analysieren, um Gene-Fluss zu erkennen.
Diese Analyse erfolgt durch die Untersuchung polymorpher Stellen innerhalb von Genomsequenzen, um Variationen zu finden, die mit genealogischer Inkongruenz assoziiert sind. Indem sie sich auf spezifische Arten genetischer Variationen konzentrieren, können Forscher Schätzungen der genealogischen Asymmetrie ableiten und Einblicke in vergangene Gene-Fluss-Niveaus zwischen den zwei Populationen bieten.
Die Herausforderung der Rekombination
Während die Asymmetrie in genealogischen Ästen auf Gene-Fluss hinweist, fügt die Präsenz von Rekombination Komplexität zur Analyse hinzu. In der Realität können genetische Sequenzen Rekombination erfahren, was dazu führt, dass Genregionen mehrere Genealogien widerspiegeln. Dies kann zu verzerrten Ergebnissen führen, wenn die Beziehungen der externen Äste von kongruenten Genealogien aufgrund verborgener Rekombinationsevents beeinflusst werden.
Um die Auswirkungen der Rekombination auf Schätzungen der genealogischen Asymmetrie zu bewerten, führen Forscher Simulationen durch. Diese Simulationen untersuchen, wie Schätzungen der Asymmetrie sich mit variierenden Blockgrössen genetischer Sequenzen und unterschiedlichen Rekombinationsraten ändern. Sie finden heraus, dass kleine Blockgrössen die Genauigkeit bei der Schätzung der Asymmetrie aufrechterhalten, während grössere Blöcke die Ergebnisse verzerren können, indem sie kongruente Genealogien einbeziehen.
Bidirektionaler Gene-Fluss
Die meisten Analysen gehen davon aus, dass Gene-Fluss in eine Richtung erfolgt. Aber zu verstehen, wie bidirektionaler Gene-Fluss die genealogische Asymmetrie beeinflusst, ist auch wertvoll. Forscher verwenden Simulationen, um zu erkunden, wie externe Ästchenlängen mit variierenden Raten des Gene-Flusses in beide Richtungen zusammenhängen. Sie entdecken, dass unterschiedliche Raten des Gene-Flusses spezifische Erwartungen an die Asymmetrie hervorrufen können, und die gesamte Menge des Gene-Flusses tendiert dazu, das Ausmass der Asymmetrie zu beeinflussen.
Anwendungen in der realen Welt: Die Heliconius-Schmetterlinge
Um das Potenzial der genealogischen Asymmetrie zur Erkennung von Gene-Fluss zu veranschaulichen, analysieren Forscher erneut genomische Sequenzen von nah verwandten Schmetterlingsarten, Heliconius melpomene und H. cydno. Trotz einer Geschichte starker Paarungsvorlieben und begrenzter Hybridisierung haben frühere Analysen Beweise für Gene-Fluss von einer Art zur anderen gezeigt.
Über verschiedene Blockgrössen genetischer Sequenzen hinweg liefern Schätzungen der genealogischen Asymmetrie bei kleineren Grössen positive Werte, die schliesslich bei grösseren Blöcken zu negativen Werten führen. Dieses Muster entspricht früheren Erkenntnissen und unterstützt die Idee des post-Divergenz-Gene-Flusses zwischen den beiden Arten.
Analyse von Odocoileus-Rehen
Ein anderer Fall betrifft Weisswedelhirsch (Odocoileus virginianus) und Maultierhirsch (O. hemionus). Studien legen nahe, dass diese Arten sich mit begrenztem Gene-Fluss divergiert haben, aber neuere Analysen haben Beweise identifiziert, die auf potenziellen sekundären Kontakt hinweisen. Ähnlich wie im Beispiel mit den Schmetterlingen berechnen Forscher Schätzungen der genealogischen Asymmetrie über verschiedene Blockgrössen hinweg.
Für die Rehe ergeben sich positive Schätzungen bei kleineren Blockgrössen, was auf Gene-Fluss hindeuten könnte. Doch mit zunehmenden Blockgrössen wird es schwierig, zwischen potenziellem Gene-Fluss und Unterschieden in effektiven Populationsgrössen zu unterscheiden. Simulationen basierend auf abgeleiteten demografischen Geschichten helfen, diese Ergebnisse zu analysieren und deuten auf subtile Beweise für historischen Gene-Fluss hin.
Fazit
Zu verstehen, wie vergangener Gene-Fluss die genetische Zusammensetzung von Populationen beeinflusst, ist ein bedeutendes Ziel in der evolutionären Genetik. Diese Arbeit betont, dass Gene-Fluss zu beobachtbarer Asymmetrie in genealogischen Ästchenlängen führt und eine Methode zur Erkennung solcher Signale bietet. Indem sie sich auf spezifische Signale in genomischen Daten konzentrieren, können Forscher einzigartige Einblicke in die Geschichte von Arten und ihre evolutionären Entwicklungen bieten.
Der hier dargestellte Ansatz soll keine bestehenden Methoden zur Untersuchung der Populationgeschichte ersetzen. Vielmehr soll er bestehende Methoden ergänzen, indem er ein spezifisches Signal des Gene-Flusses erkundet, das möglicherweise übersehen oder mit anderen Informationen in komplexeren Analysen vermischt wird. Die Forscher hoffen, dass die Ergebnisse weitere Untersuchungen anstossen werden, wie Gene-Fluss die genetische Vielfalt über Arten hinweg prägt.
Titel: Genealogical asymmetry under the IM model and a two-taxon test for gene flow
Zusammenfassung: Methods for detecting gene flow between populations often rely on asymmetry in the average length of particular genealogical branches, with the ABBA-BABA test being a well known example. Currently, asymmetry-based methods cannot be applied to a pair of populations and such analyses are instead performed using model-based methods. Here we investigate genealogical asymmetry under a two-population isolation-migration model. We focus on genealogies where the first coalescence event is between lineages sampled from different populations, as the external branches of these genealogies have equal expected length as long as there is no post-divergence gene flow. We show that unidirectional gene flow breaks this symmetry and results in the recipient population having longer external branches. We derive expectations for the probability of this genealogical asymmetry under the isolation-migration model and propose a simple statistic (Am) to detect it from genome sequence data. Am provides a two-taxon test for gene flow that only requires a single unphased diploid genome from each population, with no outgroup information. We use analytic expectations and coalescent simulations to explore how recombination, unequal effective population sizes and bidirectional gene flow influence Am and find that the statistic provides unambiguous evidence for gene flow under a continent-island history. We estimate Am for genome sequence data from Heliconius butterflies and Odocoileus deer, generating results consistent with previous model-based analyses. Our work highlights a signal of gene flow overlooked to date and provides a method that complements existing approaches for investigating the demographic history of recently diverged populations.
Autoren: Alexander Mackintosh, D. Setter
Letzte Aktualisierung: 2024-05-30 00:00:00
Sprache: English
Quell-URL: https://www.biorxiv.org/content/10.1101/2024.05.24.595831
Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.05.24.595831.full.pdf
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.