Révolutionner la recherche sur la biodiversité avec l'eADN
Une nouvelle base de données améliore les études sur la biodiversité en analysant l'ADN environnemental.
Rubén González-Miguéns, Alex Gàlvez-Morante, Margarita Skamnelou, Meritxell Antó, Elena Casacuberta, Daniel J. Richter, Daniel Vaulot, Javier del Campo, Iñaki Ruiz-Trillo
― 10 min lire
Table des matières
- Pourquoi l'eDNA est important ?
- Les gènes ribosomiques et leur rôle
- La recherche de meilleurs marqueurs
- Le besoin d'une nouvelle base de données
- Nettoyer les données
- Ajouter plus d'ingrédients
- Créer une base de données conviviale
- Tester la base de données
- Qu'ont-ils trouvé ?
- Les avantages de l'eKOI
- Applications futures
- Pensées finales
- Source originale
- Liens de référence
Le metabarcoding, c'est une méthode moderne utilisée pour étudier la biodiversité, surtout la variété de vie dans différents habitats. Au cours des vingt dernières années, ça a été l’outil préféré des chercheurs parce que ça leur permet de récolter des données sans les biais que les méthodes traditionnelles peuvent introduire. Les échantillons traditionnels impliquent souvent de collecter physiquement des échantillons, ce qui peut faire rater plein d’organismes, surtout les tout petits. Le metabarcoding permet aux scientifiques de collecter et d’analyser l’ADN environnemental (eDNA), ce qui signifie qu’ils peuvent détecter des organismes juste en échantillonnant l'environnement au lieu de devoir les attraper d’abord.
Cette innovation, c’est un peu comme pouvoir découvrir ce qu'il y a dans une boîte sans l'ouvrir. Tu regardes juste la poussière au-dessus pour deviner ce qu'il y avait dedans. Dans ce cas, au lieu de poussière, les scientifiques regardent le matériel génétique qui flotte dans le sol ou l'eau.
Pourquoi l'eDNA est important ?
L'ADN environnemental, c'est le matériel génétique que les organismes laissent derrière eux dans leur environnement. Ça peut être des cellules de peau, des poils, des excréments ou juste des bouts d’ADN relâchés dans l'environnement. Les chercheurs peuvent collecter des échantillons dans des endroits comme des rivières, des lacs ou le sol des forêts, puis analyser cet ADN pour déterminer quelles espèces sont présentes. Cette méthode est super pratique pour les créatures difficiles à trouver comme les insectes ou les microbes, qui pourraient passer à travers les mailles des méthodes traditionnelles.
Imagine essayer de compter tous les poissons dans un grand lac en les pêchant un par un. Ça prendrait une éternité, et tu raterais sûrement plein de poissons qui s'enfuient. Mais si tu pouvais juste prendre une cuillère d'eau et chercher l'ADN des poissons, tu aurais une image beaucoup plus claire de ce qui vit là.
Les gènes ribosomiques et leur rôle
Une méthode populaire pour analyser l'eDNA est de regarder les gènes ribosomiques comme le gène 18S rRNA. Ces gènes se trouvent chez tous les êtres vivants et sont essentiels au fonctionnement des cellules. Le gène 18S est particulièrement utile parce qu'il a des régions très similaires entre espèces, ainsi que des régions plus variées, aidant les scientifiques à identifier les relations entre différents types d'organismes.
Cependant, le gène 18S a aussi quelques inconvénients. Il peut être un peu trop "sûr" quand il s'agit d'identifier des espèces étroitement liées. Pense à essayer de différencier deux jumeaux identiques—parfois, tu ne peux tout simplement pas le faire. Pour contourner cela, les scientifiques se sont tournés vers d'autres régions des gènes ribosomiques ou même d'autres types de gènes qui pourraient offrir des distinctions plus claires entre les espèces.
La recherche de meilleurs marqueurs
Une alternative au gène 18S est la région de l'espace transcrit interne (ITS) des gènes ribosomiques ou des gènes comme le cytochrome oxydase sous-unité I (COI). Le Gène COI est devenu assez populaire comme "code-barres" pour identifier les animaux, surtout ceux qui se déplacent beaucoup, comme les poissons ou les insectes.
Il y a plein de bases de données qui compilent ces "codes-barres" génétiques pour aider les chercheurs. Cependant, beaucoup de ces bases de données se concentrent surtout sur certains groupes, comme les animaux, et peuvent passer à côté d'autres groupes importants, comme les champignons ou les petites créatures marines.
Imagine entrer dans une bibliothèque où la plupart des livres parlent de chats, et toi, tu cherches un livre sur l'histoire des grenouilles. Tu serais mal barré ! La même chose arrive quand les chercheurs essaient de trouver des données génétiques pour certains groupes d'organismes—c'est compliqué quand les bases de données ne sont pas complètes.
Le besoin d'une nouvelle base de données
Reconnaissant les lacunes dans les bases de données existantes, les chercheurs se sont mis à créer une nouvelle, axée sur le gène COI, qui couvre une large gamme d'organismes. Cette nouvelle base de données visait à inclure une plus grande variété de formes de vie, surtout celles qui n’avaient pas été assez étudiées dans les recherches précédentes.
Ils ont retroussé leurs manches et rassemblé toutes les données COI disponibles provenant de diverses sources. Ces données venaient de bases de données en accès libre et impliquaient un processus de nettoyage minutieux pour s'assurer que tout était exact. Le résultat était une collection bien organisée d'informations qui permettrait aux scientifiques d'identifier un plus grand nombre d'espèces grâce au metabarcoding.
Nettoyer les données
Construire une base de données n'est pas aussi simple que de balancer toutes tes données dans un grand pot et de mélanger. Il faut un soin méticuleux pour obtenir un bon résultat. En compilant les données, les chercheurs devaient enlever les doublons, éliminer les séquences trop courtes ou trop longues, et s'assurer que l'information était aussi propre et précise que possible.
C'était comme faire un smoothie bien mélangé; si tu balances par accident une vieille pelure de banane ou des morceaux de glace qui ne se mélangent jamais, tu ne voudrais pas servir ça à tes invités, n'est-ce pas ? Le même principe s'applique à une base de données scientifique. Chaque séquence a été contrôlée et recalibrée pour s'assurer qu'elle serait utile pour des études taxonomiques.
Ajouter plus d'ingrédients
Après avoir organisé les séquences de gènes COI, les chercheurs les ont combinées avec des données génétiques provenant de génomes mitochondriaux complets. Les génomes mitochondriaux sont en gros les centrales électriques des cellules et hébergent un ADN vital qui informe de nombreux aspects de la biologie d'un organisme. Les chercheurs ont veillé à ce que tout soit correctement étiqueté. Ce n’était pas chose facile, surtout que certaines séquences avaient des parties mal étiquetées ou même des contaminations d'autres organismes.
Pour vérifier l'intégrité de leurs séquences collectées, ils ont réalisé des expériences en utilisant la réaction en chaîne par polymérase (PCR). C'est une méthode qui permet aux scientifiques d'amplifier de petites quantités d'ADN, ce qui facilite le travail. Un peu comme prendre un écho d'un son pour l'écouter plus clairement, la PCR aide à rendre des fragments d'ADN petits et difficiles à détecter beaucoup plus visibles.
Créer une base de données conviviale
Une fois les données nettoyées et organisées, la prochaine étape était de les présenter de manière conviviale. Ils ont développé une nouvelle base de données taxonomique qui permettrait aux chercheurs de trouver, d'accéder et d'utiliser facilement les informations. Cela a été fait en créant des catégories standardisées pour aider à garantir que chaque élément de donnée s’insère bien à sa place, un peu comme un garde-manger bien rangé.
Créer une taxonomie standardisée est essentiel parce que ça permet aux chercheurs de communiquer efficacement sur leurs découvertes. Par exemple, si une personne dit "pomme rouge" et qu'une autre dit "pomme qui est rouge", elles parlent toutes les deux de la même chose, mais la formulation pourrait semer la confusion dans les discussions. Avoir un standard en place permet de s'assurer que tout le monde est sur la même longueur d'onde.
Tester la base de données
Une fois tout mis en place, il était temps de tester l’efficacité de la base de données. Les chercheurs ont passé en revue 15 études différentes qui utilisaient le metabarcoding COI, analysant à quel point la nouvelle base de données pouvait identifier des organismes à partir des échantillons d'eDNA.
Comprendre cette énorme quantité de données n'était pas une tâche simple. Pour visualiser les résultats, ils ont créé des arbres phylogénétiques pour illustrer les relations entre différentes espèces identifiées grâce à leur travail. C'était une façon de voir comment l'ADN se traduisait en quels organismes étaient présents dans chaque étude, un peu comme un arbre généalogique.
Qu'ont-ils trouvé ?
Quand les chercheurs ont plongé dans leurs données et appliqué la nouvelle base de données, ils ont été récompensés par une série de découvertes passionnantes. En utilisant la base de données eKOI mise à jour, ils ont réussi à identifier de nombreux organismes, y compris certains qui avaient été manqués auparavant.
Parmi les découvertes, il y avait des groupes auparavant sous-représentés comme les choanoflagellés et les Picozoa. Pour faire simple, ce sont des petits protistes qui avaient échappé aux précédentes études. Avoir une base de données plus large a aidé les chercheurs à mettre en lumière ces organismes négligés, peignant une image plus claire de la diversité écologique qu'il y a dans le monde.
Les avantages de l'eKOI
La base de données eKOI se démarque parce qu'elle améliore la recherche sur les organismes eucaryotes. Avec des séquences mieux organisées, les chercheurs peuvent faire de meilleures attributions taxonomiques, surtout pour des groupes qui avaient été difficiles à identifier correctement.
Pour ajouter un peu d'humour : si cette base de données était un restaurant, on pourrait dire qu'elle propose un menu buffet plutôt que juste des burgers. Tu peux goûter une plus grande variété de plats au lieu de te contenter d'une ou deux options !
En comblant les lacunes dans les bases de données existantes et en fournissant une approche plus inclusive de la recherche sur l'eDNA, l'eKOI permet à plus de scientifiques d'étudier la vaste gamme de formes de vie—surtout les petites, souvent ignorées.
Applications futures
Et maintenant, qu'est-ce qui se passe ? Eh bien, la base de données eKOI ouvre de nombreuses possibilités pour de futures recherches. Elle peut aider à développer des amorces spécifiques ciblant différents taxa, similaire à ce qui a été fait avec les gènes ribosomiques. Cela signifie que les chercheurs peuvent concevoir de nouveaux outils pour cibler des organismes spécifiques et plonger encore plus dans leur compréhension.
Pense à ça comme si tu mettais en place un piège à appât spécial pour certains poissons plutôt que de simplement lancer un filet et d’espérer le meilleur. Cibler spécifiquement permet des études plus précises qui peuvent fournir des aperçus précieux sur l'écosystème, y compris comment les populations interagissent, évoluent et réagissent aux changements environnementaux.
Pensées finales
La base de données eKOI contribue de manière significative au domaine de la recherche sur la biodiversité. En fournissant une ressource robuste et complète pour les attributions taxonomiques utilisant le gène COI, les chercheurs peuvent faire un travail plus approfondi pour comprendre la diversité de la vie qui existe dans notre monde.
En résumé, pense à la base de données eKOI comme un guide fiable dans une immense forêt de biodiversité, aidant les scientifiques à naviguer à travers des sentiers inconnus et à découvrir les trésors cachés de la vie eucaryote. Cet nouvel outil peut repousser les limites de la façon dont nous étudions et comprenons la vie sur Terre, ouvrant la voie à la découverte des mystères juste sous nos yeux— enfin, sous les lacs, dans le sol et dans les profondeurs de nos océans !
Titre: A Novel Taxonomic Database for eukaryotic Mitochondrial Cytochrome Oxidase subunit I Gene (eKOI): Enhancing taxonomic resolution at community-level in metabarcoding analyses
Résumé: Metabarcoding has emerged as a robust method for understanding biodiversity patterns by retrieving environmental DNA (eDNA) directly from ecosystems. Its low cost and accessibility have extended its use across biological topics, from symbiosis to biogeography, and ecology. A successful metabarcoding application depends on accurate and comprehensive reference databases for proper taxonomic assignment. The 18S rRNA gene is the primary genetic marker used for general/broad eukaryotic metabarcoding due to its combination of conserved and hypervariable regions, and the availability of extensive taxonomically-informed reference databases like PR2 and SILVA. Despite its advantages, 18S rRNA has certain limitations at lower taxonomic levels, depending on the lineage. Alternative fast-evolving molecular markers, such as the mitochondrial cytochrome oxidase subunit I (COI) gene, have been adopted as widely used "barcoding genes" for eukaryotes due to their resolution to the species level. However, the COI gene lacks a curated taxonomically-informed database covering all eukaryotes, including protists, comparable to those available for 18S rRNA. To address this gap, we introduce eKOI, a curated COI gene database aimed at enhancing the taxonomic annotation and primer design for COI-based metabarcoding at the community level. This database integrates COI gene data from GenBank and mitochondrial genomes that are publicly available, followed by rigorous manual curation to eliminate redundancies and contaminants and to correct taxonomic annotations. We validate using the eKOI database for taxonomic annotation of protists by re-annotating several COI-based metabarcoding studies, revealing previously unidentified biodiversity. Phylogenetic analyses confirmed the accuracy of the taxonomic annotations, highlighting the potential of eKOI to uncover new biodiversity in various eukaryotic lineages.
Auteurs: Rubén González-Miguéns, Alex Gàlvez-Morante, Margarita Skamnelou, Meritxell Antó, Elena Casacuberta, Daniel J. Richter, Daniel Vaulot, Javier del Campo, Iñaki Ruiz-Trillo
Dernière mise à jour: 2024-12-09 00:00:00
Langue: English
Source URL: https://www.biorxiv.org/content/10.1101/2024.12.05.626972
Source PDF: https://www.biorxiv.org/content/10.1101/2024.12.05.626972.full.pdf
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.