Simple Science

Scienza all'avanguardia spiegata semplicemente

# La biologia# Bioinformatica

Avanzamenti nell'analisi del DNA antico con READv2

Lo strumento READv2 migliora lo studio delle relazioni tra DNA antichi.

― 6 leggere min


READv2 RivoluzionaREADv2 Rivoluzional'Analisi del DNADNA antico.la classificazione delle relazioni delNuovo strumento migliora notevolmente
Indice

Studiare come gli esseri viventi siano legati tra loro è diventato un aspetto chiave delle ricerche sul DNA antico. Questo è importante per capire come vivevano e interagivano i gruppi preistorici. Ad esempio, i ricercatori hanno esaminato le strutture sociali dei Neandertaliani e di altri antichi umani. Un grande vantaggio di questa ricerca è che aiuta a mantenere i dati puliti, individuando campioni duplicati o parenti stretti. Questo permette agli scienziati di analizzare i dati della popolazione in modo accurato.

Negli ultimi anni, gli studi hanno permesso agli ricercatori di analizzare fino a 100 individui da un unico sito archeologico, il che dimostra una forte necessità di strumenti e metodi migliori in questo campo. L'analisi del DNA antico ha fatto molti progressi, con miglioramenti nelle procedure di laboratorio e nei metodi informatici specificamente progettati per il DNA antico, che è diverso dal DNA moderno.

Lo Strumento READ

Nel 2018, è stato introdotto uno strumento chiamato READ per aiutare i ricercatori a capire come gli individui siano relazionati basandosi sui dati del DNA antico. Funziona prendendo piccoli pezzi di informazioni genetiche e calcolando quanto differiscono l'uno dall'altro. Questo aiuta a classificare Relazioni come genitore-figlio, fratelli o individui non correlati.

Inizialmente, READ funzionava con un certo tipo di dati in input e divideva il genoma in piccole sezioni per l'analisi. Confrontando queste sezioni, era in grado di classificare efficacemente le relazioni, anche con dati molto limitati. Col tempo, sono stati sviluppati metodi che possono gestire meno dati e fornire distinzioni più fini tra i tipi di relazioni. Tuttavia, READ rimane popolare tra molti ricercatori perché è facile da usare e non richiede preparazioni complesse dei dati o calcoli.

Miglioramenti Recenti

Grazie alla popolarità di READ, è stata sviluppata una nuova versione chiamata READv2, che funziona meglio e più velocemente. La nuova versione è costruita in Python 3, mentre l'originale era in Python 2 e R. Usare un solo linguaggio di programmazione semplifica il processo ed evita problemi derivanti dall'uso di più linguaggi.

READv2 cambia il formato del file di input per renderlo più piccolo e più veloce da analizzare. Inoltre, elabora i dati tutto all'interno di uno script unico, riducendo la necessità di file temporanei e minimizzando gli errori che possono nascere dall'uso di più script. I miglioramenti hanno portato a una significativa riduzione del tempo di elaborazione. Ad esempio, analizzare un dataset di 94 individui che richiedeva quasi cinque ore con READv1 ora può essere fatto in circa otto e mezzo minuti con READv2.

Anche se READv2 utilizza più memoria, la quantità necessaria è gestibile sulla maggior parte dei computer personali moderni. Può persino gestire dataset molto grandi, rendendolo più utile per i ricercatori che lavorano con collezioni vaste di dati di DNA antico.

Dimensione della Finestra e Analisi

Nella prima versione, READ utilizzava una dimensione della finestra predefinita di un milione di paia di basi per analizzare il genoma. Tuttavia, questa dimensione non era mai stata testata contro altre dimensioni. I ricercatori hanno trovato che finestre più piccole portavano a risultati migliori, ma il miglior risultato è venuto dall'analizzare l'intero genoma tutto insieme.

Nel guardare diversi tipi di relazioni, la nuova versione ha mostrato risultati promettenti. Ha funzionato bene anche con quantità molto basse di dati di sequenza. Una sfida significativa è stata affrontata nel cercare di classificare relazioni più lontane, come i parenti di terzo grado. READv2 è riuscita a classificare queste relazioni, ma aveva bisogno di più dati per farlo in modo accurato.

Per le relazioni di primo grado, READv2 ora può identificare se gli individui sono fratelli o genitore-figlio, cosa che non era presente nello strumento originale. Questo è stato raggiunto esaminando quanto fossero simili le loro sezioni del genoma e utilizzando soglie specifiche per distinguere tra le due.

Test e Prestazioni

Per valutare quanto bene funziona READv2, i ricercatori l'hanno testato contro relazioni note usando dati simulati che includevano tutte le complessità dei veri dataset genetici. Hanno creato una varietà di scenari genetici per vedere quanto bene lo strumento potesse classificare le relazioni.

In questi test, READv2 ha performato eccezionalmente bene, identificando correttamente le giuste relazioni in molti casi. Tuttavia, è diventato chiaro che man mano che i dati diminuivano, alcune classificazioni diventavano meno accurate. Sono state stabilite soglie attente per garantire che quantità basse di dati non portassero a classificazioni errate.

Una parte importante dell'uso di READv2 è il concetto di “SNPS sovrapposti in modo efficace.” Questa è una misura delle informazioni genetiche utili disponibili per la classificazione. Avere un numero maggiore di SNPs sovrapposti in modo efficace porta a classificazioni più accurate per tutti i tipi di relazioni.

Applicazione a Dati Reali

La vera forza di READv2 si manifesta quando viene applicata a dataset reali. Un esempio ha coinvolto uno studio significativo di individui da un sito neolitico in Francia. I ricercatori hanno prima usato READ per stimare le relazioni e poi si sono affidati ad altri software per differenziare tra genitore-figlio e fratelli.

Con i miglioramenti in READv2, è stato possibile analizzare lo stesso dataset più rapidamente e senza dover passare tra strumenti diversi. Questo ha reso il processo più efficiente e snello, consentendo di ottenere risultati in un colpo solo.

I risultati di READv2 erano comparabili a quelli ottenuti dalla combinazione di READ e del software aggiuntivo nello studio originale. Molti coppie di individui sono state classificate con precisione, confermando le scoperte della ricerca.

In generale, READv2 ha performato bene nell'identificare le relazioni e ha fornito preziose intuizioni senza la complessità aggiunta di usare più strumenti.

Conclusione

Lo sviluppo di READv2 segna un passo avanti significativo nell'analisi del DNA antico per comprendere le relazioni biologiche. Offre maggiore velocità ed efficienza, rendendo più facile per i ricercatori analizzare grandi dataset. Questo strumento è destinato a diventare un elemento cruciale negli studi mirati a ricostruire alberi genealogici antichi e comprendere le dinamiche sociali nelle comunità preistoriche.

Permettendo la classificazione di vari tipi di relazioni e gestendo dati complessi in modo efficace, READv2 si distingue tra i metodi disponibili per ottenere intuizioni dal DNA antico. Offre un approccio user-friendly pur fornendo risultati potenti, rendendolo prezioso per i ricercatori nel campo dell'archeogenomica.

Man mano che gli studi continuano a crescere in dimensioni e complessità, la capacità di analizzare enormi quantità di dati di DNA antico in modo rapido e accurato sarà cruciale. I miglioramenti in READv2 lo posizionano bene per le future ricerche e contribuiranno probabilmente a molte nuove scoperte nel campo.

Prospettive Future

Andando avanti, l'attenzione si concentrerà sul perfezionamento degli strumenti disponibili per studiare il DNA antico e migliorare la classificazione delle relazioni lontane. Man mano che la tecnologia evolve e i dataset si espandono, i metodi usati in questo campo dovranno tenere il passo.

L'introduzione di metriche significative come “SNPs sovrapposti in modo efficace” contribuirà a confronti più affidabili tra gli studi. Questo faciliterà le generalizzazioni e migliorerà la comprensione delle relazioni genetiche tra diverse popolazioni.

In generale, il futuro sembra promettente per lo studio del DNA antico, con READv2 che guida la strada fornendo analisi efficienti e accurate. Man mano che i ricercatori continuano a lavorare con dataset più grandi e complessi, tali strumenti saranno fondamentali per svelare le storie nascoste nel nostro passato antico.

Fonte originale

Titolo: READv2: Advanced and user-friendly detection of biological relatedness in archaeogenomics

Estratto: The possibility to obtain genome-wide ancient DNA data from multiple individuals has facilitated an unprecedented perspective into prehistoric societies. Studying biological relatedness in these groups requires tailored approaches for analyzing ancient DNA due to its low coverage, post-mortem damage, and potential ascertainment bias. Here we present READv2 (Relatedness Estimation from Ancient DNA version 2), an improved Python 3 re-implementation of the most widely used tool for this purpose. While providing increased portability and making the software future-proof, we are also able to show that READv2 (a) is orders of magnitude faster than its predecessor; (b) has increased power to detect pairs of relatives using optimized default parameters; and, when the number of overlapping SNPs is sufficient, (c) can differentiate between full-siblings and parent-offspring, and (d) can classify pairs of third-degree relatedness. We further use READv2 to analyze a large empirical dataset that has previously needed two separate tools to reconstruct complex pedigrees. We show that READv2 yields results and precision similar to the combined approach but is faster and simpler to run. READv2 will become a valuable part of the archaeogenomic toolkit in providing an efficient and user-friendly classification of biological relatedness from pseudohaploid ancient DNA data.

Autori: Torsten Günther, E. Alacamlı, T. Naidoo, S. Aktürk, M. N. Güler, I. Mapelli, K. B. Vural, M. Somel, H. Malmström, T. Günther

Ultimo aggiornamento: 2024-01-23 00:00:00

Lingua: English

URL di origine: https://www.biorxiv.org/content/10.1101/2024.01.23.576660

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.01.23.576660.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili