Fortschritte in der Analyse von antiker DNA mit READv2
Das READv2-Tool verbessert das Studium der Beziehungen von altem DNA.
― 6 min Lesedauer
Inhaltsverzeichnis
Das Studium, wie lebende Dinge miteinander verwandt sind, ist ein wichtiger Teil der Forschung zu antiker DNA geworden. Das ist wichtig, um zu verstehen, wie prähistorische Gruppen gelebt und interagiert haben. Zum Beispiel haben Forscher die sozialen Strukturen von Neandertalern und anderen alten Menschen untersucht. Ein grosser Vorteil dieser Forschung ist, dass sie hilft, die Daten sauber zu halten, indem doppelte Proben oder nahe Verwandte erkannt werden. So können Wissenschaftler die Bevölkerungsdaten genau analysieren.
In den letzten Jahren haben Studien es Forschern ermöglicht, bis zu 100 Individuen von einer einzigen archäologischen Stätte zu analysieren, was zeigt, dass es einen grossen Bedarf an besseren Werkzeugen und Methoden in diesem Bereich gibt. Die Analyse antiker DNA hat enorme Fortschritte gemacht, mit Verbesserungen in Laborverfahren und Computersystemen, die speziell für antike DNA entwickelt wurden, die sich von moderner DNA unterscheidet.
Das READ-Tool
2018 wurde ein Tool namens READ eingeführt, um Forschern zu helfen, herauszufinden, wie Individuen basierend auf antiken DNA-Daten miteinander verwandt sind. Es funktioniert, indem es kleine Stücke genetischer Informationen nimmt und berechnet, wie unterschiedlich sie sind. Das hilft, Beziehungen wie Eltern-Kind, Geschwister oder nicht verwandte Individuen zu klassifizieren.
Ursprünglich arbeitete READ mit einer bestimmten Art von Eingabedaten und teilte das Genom in kleine Abschnitte zur Analyse auf. Durch den Vergleich dieser Abschnitte konnte es Beziehungen effektiv klassifizieren, selbst mit sehr begrenzten Daten. Im Laufe der Zeit wurden weitere Methoden entwickelt, die mit weniger Daten umgehen können und feinere Unterscheidungen zwischen Beziehungstypen bieten. READ bleibt jedoch bei vielen Forschern beliebt, weil es einfach zu bedienen ist und keine komplexe Datenaufbereitung oder Berechnungen erfordert.
Neueste Verbesserungen
Wegen der Beliebtheit von READ wurde eine neue Version namens READv2 entwickelt, die besser und schneller funktioniert. Die neue Version ist in Python 3 programmiert, während das Original in Python 2 und R war. Die Verwendung einer Programmiersprache vereinfacht den Prozess und vermeidet Probleme, die durch die Verwendung mehrerer Sprachen entstehen.
READv2 ändert das Eingabedateiformat, um es kleiner und schneller analysierbar zu machen. Es verarbeitet auch alle Daten innerhalb eines einzigen Skripts, was die Notwendigkeit für temporäre Dateien reduziert und Fehler minimiert, die beim Einsatz mehrerer Skripte auftreten können. Diese Verbesserungen haben zu einer signifikanten Reduzierung der Verarbeitungszeit geführt. Zum Beispiel kann die Analyse eines Datensatzes mit 94 Individuen, die mit READv1 fast fünf Stunden dauerte, jetzt in nur etwa acht Minuten mit READv2 durchgeführt werden.
Obwohl READv2 mehr Speicherplatz verwendet, ist die benötigte Menge auf den meisten modernen Personalcomputern handhabbar. Es kann sogar sehr grosse Datensätze verarbeiten, was es für Forscher, die mit umfangreichen Sammlungen antiker DNA-Daten arbeiten, nützlicher macht.
Fenstergrösse und Analyse
In der ersten Version verwendete READ eine Standardfenstergrösse von einer Million Basenpaaren zur Analyse des Genoms. Diese Grösse wurde jedoch nie gegen andere Grössen getestet. Forscher fanden heraus, dass kleinere Fenster zu besseren Ergebnissen führten, aber das beste Ergebnis kam von der gleichzeitigen Analyse des gesamten Genoms.
Beim Betrachten verschiedener Beziehungstypen zeigte die neue Version einige vielversprechende Ergebnisse. Sie funktionierte gut, selbst mit sehr niedrigen Sequenzdaten. Eine grosse Herausforderung war die Klassifizierung ferneren Verwandten, wie zum Beispiel Drittgradverwandten. READv2 konnte diese Beziehungen klassifizieren, benötigte dafür jedoch mehr Daten, um dies genau zu tun.
Für Erstgradbeziehungen kann READv2 jetzt identifizieren, ob Individuen Geschwister oder Eltern-Kind sind, was im ursprünglichen Tool nicht enthalten war. Dies wurde erreicht, indem man schaute, wie ähnlich ihre Genomabschnitte waren, und spezifische Schwellenwerte verwendete, um zwischen beiden zu unterscheiden.
Testen und Leistung
Um zu bewerten, wie gut READv2 funktioniert, testeten Forscher es an bekannten Beziehungen mit simulierten Daten, die alle Komplexitäten realer genetischer Datensätze enthielten. Sie erstellten verschiedene genetische Szenarien, um zu sehen, wie gut das Tool Beziehungen klassifizieren konnte.
In diesen Tests schnitt READv2 aussergewöhnlich gut ab und identifizierte in vielen Fällen korrekt die richtigen Beziehungen. Es wurde jedoch klar, dass mit abnehmenden Daten einige Klassifikationen weniger genau wurden. Sorgfältige Schwellenwerte wurden festgelegt, um sicherzustellen, dass niedrige Datenmengen nicht zu falschen Klassifikationen führen.
Ein wichtiger Teil der Verwendung von READv2 ist das Konzept der "effektiv überlappenden SNPS". Dies ist ein Mass für die nützlichen genetischen Informationen, die für die Klassifikation verfügbar sind. Eine höhere Anzahl von effektiv überlappenden SNPs führt zu genaueren Klassifikationen für alle Arten von Beziehungen.
Anwendung auf reale Daten
Die eigentliche Stärke von READv2 kommt zum Tragen, wenn es auf echte Datensätze angewendet wird. Ein Beispiel war eine bedeutende Studie von Individuen von einer neolithischen Stätte in Frankreich. Die Forscher verwendeten zunächst READ, um Beziehungen abzuschätzen, und verliessen sich dann auf andere Software, um zwischen Eltern-Kind und Geschwistern zu unterscheiden.
Mit den Verbesserungen in READv2 war es möglich, denselben Datensatz schneller zu analysieren und ohne zwischen verschiedenen Tools wechseln zu müssen. Dies machte den Prozess effizienter und reibungsloser, sodass die Ergebnisse in einem Zug erzielt werden konnten.
Die Ergebnisse von READv2 waren vergleichbar mit denen, die aus der Kombination von READ und der zusätzlichen Software in der ursprünglichen Studie gewonnen wurden. Viele Paare von Individuen wurden genau klassifiziert, was die Ergebnisse der Forschung bestätigte.
Insgesamt schnitt READv2 gut bei der Identifizierung von Beziehungen ab und lieferte beträchtliche Einblicke, ohne die zusätzliche Komplexität der Verwendung mehrerer Tools.
Fazit
Die Entwicklung von READv2 ist ein bedeutender Fortschritt bei der Analyse antiker DNA zur Verständnisses biologischer Beziehungen. Es bietet verbesserte Geschwindigkeit und Effizienz, was es Forschern erleichtert, grosse Datensätze zu analysieren. Dieses Tool wird voraussichtlich ein entscheidendes Element bei Studien zur Rekonstruktion antiker Familienstämme und zum Verständnis sozialer Dynamiken in prähistorischen Gemeinschaften.
Indem es die Klassifikation verschiedener Beziehungstypen ermöglicht und komplexe Daten effektiv verarbeitet, hebt sich READv2 unter den verfügbaren Methoden hervor, um Einblicke aus antiker DNA zu gewinnen. Es bietet einen benutzerfreundlichen Ansatz und liefert dennoch kraftvolle Ergebnisse, was es für Forscher im Bereich Archäogenomik wertvoll macht.
Da die Studien weiterhin in Grösse und Komplexität zunehmen, wird die Fähigkeit, grosse Mengen antiker DNA-Daten schnell und genau zu analysieren, entscheidend sein. Die Verbesserungen in READv2 positionieren es gut für zukünftige Forschungsanstrengungen und werden wahrscheinlich zu vielen neuen Entdeckungen in diesem Bereich beitragen.
Zukünftige Einblicke
In Zukunft wird der Fokus auf der Verfeinerung der verfügbaren Werkzeuge zur Untersuchung antiker DNA und der Verbesserung der Klassifikation entfernter Beziehungen liegen. Während sich die Technologie weiterentwickelt und die Datensätze wachsen, müssen die Methoden in diesem Bereich Schritt halten.
Die Einführung sinnvoller Metriken wie "effektiv überlappende SNPs" wird zu zuverlässigeren Vergleichen über Studien hinweg beitragen. Dies wird Verallgemeinerungen erleichtern und das Verständnis genetischer Beziehungen zwischen verschiedenen Populationen verbessern.
Insgesamt sieht die Zukunft für das Studium antiker DNA vielversprechend aus, mit READv2, das den Weg für eine effiziente und genaue Analyse weist. Während Forscher weiterhin mit grösseren und komplexeren Datensätzen arbeiten, werden solche Werkzeuge entscheidend dafür sein, die Geschichten zu entschlüsseln, die in unserer antiken Vergangenheit verborgen sind.
Titel: READv2: Advanced and user-friendly detection of biological relatedness in archaeogenomics
Zusammenfassung: The possibility to obtain genome-wide ancient DNA data from multiple individuals has facilitated an unprecedented perspective into prehistoric societies. Studying biological relatedness in these groups requires tailored approaches for analyzing ancient DNA due to its low coverage, post-mortem damage, and potential ascertainment bias. Here we present READv2 (Relatedness Estimation from Ancient DNA version 2), an improved Python 3 re-implementation of the most widely used tool for this purpose. While providing increased portability and making the software future-proof, we are also able to show that READv2 (a) is orders of magnitude faster than its predecessor; (b) has increased power to detect pairs of relatives using optimized default parameters; and, when the number of overlapping SNPs is sufficient, (c) can differentiate between full-siblings and parent-offspring, and (d) can classify pairs of third-degree relatedness. We further use READv2 to analyze a large empirical dataset that has previously needed two separate tools to reconstruct complex pedigrees. We show that READv2 yields results and precision similar to the combined approach but is faster and simpler to run. READv2 will become a valuable part of the archaeogenomic toolkit in providing an efficient and user-friendly classification of biological relatedness from pseudohaploid ancient DNA data.
Autoren: Torsten Günther, E. Alacamlı, T. Naidoo, S. Aktürk, M. N. Güler, I. Mapelli, K. B. Vural, M. Somel, H. Malmström, T. Günther
Letzte Aktualisierung: 2024-01-23 00:00:00
Sprache: English
Quell-URL: https://www.biorxiv.org/content/10.1101/2024.01.23.576660
Quell-PDF: https://www.biorxiv.org/content/10.1101/2024.01.23.576660.full.pdf
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an biorxiv für die Nutzung seiner Open-Access-Interoperabilität.