Simple Science

La science de pointe expliquée simplement

# Biologie# Génomique

Une nouvelle méthode pour analyser l'ascendance génétique

ASAP propose une nouvelle façon d’étudier l’ascendance mixte dans les populations anciennes.

― 7 min lire


Révolutionner l'analyseRévolutionner l'analysede l'ascendancel'ascendance génétique.ASAP transforme notre façon d'analyser
Table des matières

Les Populations humaines ont toujours mélangé et interagi entre elles, ce qui a façonné notre diversité génétique au fil du temps. Ce mélange peut se faire par la migration, où des groupes se déplacent d'une zone à une autre, ou par le mélange, où des gens de différents horizons ont des enfants ensemble. Ces événements créent de nouveaux groupes avec un mix de traits issus de leurs ancêtres. À cause de l'importance de ces changements pour comprendre notre histoire et notre santé, les scientifiques ont développé des outils pour étudier la composition génétique de ces populations mélangées.

Cependant, l'étude de l'ADN ancien, ou aDNA, pose quelques défis. Beaucoup de méthodes existantes ont du mal avec des données génétiques de mauvaise qualité, ce qui est souvent le cas avec les restes anciens. Pour résoudre ces problèmes, les chercheurs ont créé des algorithmes qui utilisent diverses techniques pour estimer plus précisément les tendances génétiques dans des groupes avec une Ascendance mixte.

Un outil populaire dans ce domaine est qpAdm, qui peut analyser les données génétiques anciennes en regardant les relations entre différentes populations. Cet outil aide les chercheurs à comprendre les origines de populations spécifiques en comparant leurs données génétiques avec celles d'autres.

Malgré son utilité, qpAdm a ses limites, surtout quand il s'agit d'échantillons anciens qui n'ont pas beaucoup de matériel génétique disponible. Les chercheurs ont remarqué que qpAdm peut parfois produire des résultats incorrects, ce qui complique l'interprétation de ces études génétiques.

Le besoin de nouvelles approches

Face aux défis liés aux méthodes existantes, il y a besoin de nouveaux outils capables de fournir des évaluations plus précises de l'ascendance dans les populations mixées. Les nouvelles méthodes devraient pouvoir gérer les imperfections de certaines données génétiques, y compris les cas avec beaucoup d'informations manquantes.

Une approche prometteuse repose sur l'analyse en composantes principales (PCA) combinée à une autre méthode statistique appelée moindres carrés non négatifs (NNLS). Cette méthode combinée vise à estimer de manière précise les proportions d'ascendance de manière plus simple et efficace.

Aperçu de la nouvelle méthode

Cette nouvelle approche s'appelle ASAP (ASsessing Ancestry proportions through Principal Component analysis). L'objectif de ASAP est de tirer parti de la méthode PCA pour analyser les données génétiques et comprendre les origines ancestrales des individus et des groupes de manière efficace, même lorsqu'il manque certaines données.

Pour voir comment ASAP fonctionne, les chercheurs ont réalisé des tests avec des données qui simulaient divers scénarios réalistes, y compris des cas avec beaucoup d'informations génétiques manquantes. Cette évaluation permet de vérifier si ASAP peut estimer de manière fiable les proportions d'ascendance dans différentes conditions.

Tester la méthode

Populations simulées

Pour tester ASAP, les scientifiques ont créé des populations simulées composées de groupes mixtes et non mixtes. Ils ont conçu des scénarios où des individus de différentes populations portaient divers niveaux de contributions génétiques provenant de sources distinctes. De cette façon, ils pouvaient évaluer à quel point ASAP estimait efficacement l'ascendance de ces groupes.

Les tests ont porté sur la capacité d'ASAP à identifier la bonne ascendance pour des groupes ayant subi des événements d'admixtion. Les chercheurs ont simulé des situations où deux populations ou plus fusionnaient, chacune contribuant des proportions spécifiques à la nouvelle population. Ils ont également créé des paires de populations génétiquement similaires, pour voir à quel point ASAP pouvait détecter de légères différences.

Résultats des données simulées

Dans les tests sur des populations sans données génétiques manquantes, ASAP a très bien performé. Il a identifié avec précision les contributions génétiques des vraies sources impliquées dans l'admixtion, avec des taux d'erreur minimaux. Même lorsque de plus petites contributions d'autres groupes étaient présentes, les taux d'erreur restaient faibles, indiquant une solide performance dans ces scénarios.

Pour des populations ayant subi des événements d'admixtion plus complexes, ASAP a réussi à reconnaître les principales sources avec précision. Cependant, identifier des contributions mineures est devenu plus délicat, surtout dans les cas où les sources étaient étroitement liées. L'outil a également maintenu une bonne précision malgré différents niveaux d'affinité génétique entre les populations.

Performance avec des données génétiques manquantes

ASAP a également été testé avec des ensembles de données incluant des échantillons pseudo-haploïdes, simulant les défis souvent rencontrés dans les études d'ADN ancien, où les données peuvent être incomplètes. L'outil a montré qu'il pouvait encore identifier les bonnes sources ancestrales même face à des informations manquantes.

Les résultats ont montré qu'ASAP pouvait modéliser efficacement les proportions d'ascendance d'individus mixtes, même dans des situations où les données d'entrée contenaient jusqu'à 50 % de manquantes. Cette performance démontre sa robustesse et sa capacité à fournir des informations significatives à partir de conditions de données moins qu'idéales.

Application aux données réelles

Après avoir réussi à tester dans des scénarios simulés, les chercheurs ont appliqué ASAP à des ensembles de données du monde réel. Ils ont examiné des populations anciennes eurasiennes, comparant les estimations d'ascendance produites par ASAP avec des résultats publiés précédemment. Les résultats indiquaient que les estimations d'ascendance d'ASAP s'alignaient étroitement avec la recherche existante, renforçant sa fiabilité pour analyser de vraies données génétiques.

En particulier, les résultats ont révélé des motifs de migration et de mélange parmi les populations anciennes, illustrant comment différents groupes ont interagi au fil du temps. Par exemple, l'analyse a suivi les changements dans les proportions d'ascendance dans des zones géographiques et des périodes spécifiques, fournissant des informations sur les flux historiques de personnes et leurs influences génétiques.

Avantages d'ASAP

ASAP présente de nombreux avantages par rapport à d'autres outils utilisés pour estimer l'ascendance. L'un des principaux bénéfices est sa capacité à traiter les données génétiques de manière efficace, nécessitant moins de temps de calcul par rapport à d'autres méthodes comme qpAdm. Les résultats obtenus d'ASAP sont non seulement rapides mais aussi très précis, ce qui en fait un outil souhaitable pour les chercheurs dans le domaine.

Un autre avantage significatif d'ASAP est sa flexibilité à travailler avec divers types d'ensembles de données. Il peut gérer les cas où seules des sources proxy sont disponibles, permettant aux chercheurs de tirer des conclusions sur l'ascendance même lorsque les sources directes sont difficiles d'accès. Cette capacité est particulièrement utile dans les études d'ADN ancien, où la qualité des données peut varier considérablement.

ASAP permet également des analyses parallèles de différents groupes cibles simultanément, ce qui peut améliorer l'efficacité globale des études impliquant de grands ensembles de données avec plusieurs populations.

Conclusion

Dans l'ensemble, ASAP représente un nouvel outil prometteur pour l'estimation de l'ascendance dans les études génétiques. Sa combinaison de PCA et NNLS offre une approche innovante pour comprendre les histoires complexes des populations humaines, surtout celles qui ont connu des événements d'admixtion. En traitant efficacement les données manquantes et en fournissant des proportions d'ascendance précises, ASAP ouvre de nouvelles possibilités pour la recherche en génétique, anthropologie et disciplines connexes.

La méthode a démontré sa fiabilité dans des contextes simulés et réels, fournissant aux chercheurs une ressource puissante pour explorer l'histoire génétique des populations au fil du temps. À mesure que davantage d'études intègrent ASAP dans leurs analyses, cela a le potentiel de redéfinir notre compréhension de la diversité génétique humaine et des interactions historiques qui ont façonné notre monde.

Source originale

Titre: Fast and reliable ancestral reconstruction on ancient genotype data with non-negative Least square and Principal Component Analysis

Résumé: The history of human populations has been strongly shaped by admixture events, contributing to the patterns of observed genetic diversity across populations. Given its significance for evolutionary and medical studies, many algorithms focusing on the inference of the genetic composition of admixed populations have been developed. In particular, the recent development of new ancestry estimation methods that consider the fragmentary nature of ancient genotype data, such as the f-statistics family and its derivations, have radically changed our understanding of the past. F-statistics capture similar genetic similarity information as Principal Component Analysis (PCA), which is widely used in population genetics to quantify genetic affinity between populations or individuals. In this study, we introduce ASAP (ASsessing ancestry proportions through Principal component Analysis) method that leverages PCA and Non-Negative Least Square (NNLS) to assess the ancestral compositions of admixed individuals given a large set of populations. We tested ASAP on different simulated models, incorporating high levels of missingness. Our results show its ability to reliably estimate ancestry across numerous scenarios, even those with a significant proportion of missing genotypes, in a fraction of the time required when using other tools. When harnessed on Eurasias genotype data, ASAP helped replicate and extend findings from previous studies proving to be a fast, efficient, and straightforward new ancestry estimation tool.

Auteurs: Luciana de Gennaro, L. Molinaro, A. Raveane, F. Santonastaso, S. S. Saponetti, M. C. Massi, L. Pagani, M. Metspalu, G. Hellenthal, T. Kivisild, M. Ventura, F. Montinaro

Dernière mise à jour: 2024-05-07 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2024.05.06.592724

Source PDF: https://www.biorxiv.org/content/10.1101/2024.05.06.592724.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires