Simple Science

La science de pointe expliquée simplement

# Biologie# Microbiologie

Comprendre le rôle des viromes intestinaux

Des avancées récentes montrent les complexités du virome intestinal et ses implications pour la santé.

― 7 min lire


Aperçus sur le ViromeAperçus sur le ViromeIntestinalvision de la santé intestinale.De nouvelles découvertes changent notre
Table des matières

Des études récentes montrent que le Virome intestinal, qui comprend tous les virus présents dans nos intestins, joue un rôle super important dans notre santé et nos maladies. Mais identifier ces virus parmi de grandes quantités de données reste un vrai casse-tête. La recherche révèle que 75 % à 99 % des séquences virales trouvées dans les viromes intestinaux ne correspondent à aucun génome viral connu. C'est en partie parce que la plupart des bases de données génomiques n'ont pas assez de séquences virales, et certains types de virus sont trop représentés.

Les défis du profilage du virome intestinal

Le profilage des viromes intestinaux en utilisant des bases de données de référence virales donne souvent une vue pauvre et incomplète de la vraie composition du virome intestinal. De nouveaux outils de bioinformatique sont en cours de développement, utilisant l'apprentissage automatique pour identifier des caractéristiques qui suggèrent une origine virale. Ces outils réussissent généralement à identifier plus de séquences virales auparavant inconnues par rapport aux méthodes traditionnelles basées sur des références. Des outils comme VirFinder, DeepVirFinder et Seeker classent les séquences comme virales ou non-virales en fonction de leur composition. D'autres outils évaluent des caractéristiques génomiques comme la densité génique et le nombre de gènes homologues pour faire des prédictions. Malgré leurs avantages, les outils actuels ne fonctionnent généralement qu'avec des séquences assemblées et donnent une classification simple oui ou non.

Efforts à grande échelle pour extraire des séquences virales

Ces dernières années, de nombreux grands projets ont été lancés pour collecter des séquences virales à partir de Données métagénomiques. La base de données IMG/vr collecte à la fois des séquences virales environnementales et associées aux humains. Diverses études se sont concentrées spécifiquement sur les viromes intestinaux humains, conduisant à la création de plusieurs bases de données. Par exemple, une étude a analysé près de 2 700 échantillons de l'intestin humain et a identifié plus de 33 000 unités virales de type espèce. Une autre étude a combiné presque 6 000 ensembles de données provenant de différentes parties du corps, y compris l'intestin, pour créer une grande base de données contenant plus de 45 000 unités virales.

D'autres efforts se sont concentrés sur les métagénomes intestinaux humains, y compris l'extraction de données précédemment non publiées. Par exemple, une étude a réussi à récupérer des milliers de génomes de phages complets à partir des métagénomes intestinaux. Il y a aussi eu des efforts pour comprendre le virome intestinal chez les nourrissons, menant à la découverte de milliers de nouvelles entités virales.

Qualité, diversité et comparaison des catalogues viraux

Malgré ces efforts significatifs, il n'y a pas de moyen cohérent pour comparer la qualité et la diversité de ces catalogues viraux. Un des défis majeurs est que différentes études utilisent différentes méthodes et critères de contrôle de qualité. De plus, un grand nombre des études dépendent d'outils d'identification virale qui varient énormément.

La qualité des séquences récupérées dans diverses études diffère énormément. Alors que certains catalogues contiennent une majorité de séquences de haute qualité, d'autres affichent plus de 75 % de séquences de mauvaise qualité. Certains projets ont même rencontré des problèmes de contamination par des plasmides, ce qui signifie que certaines séquences classées comme virales pourraient en réalité provenir de plasmides, un type d'ADN qui peut se répliquer de manière indépendante dans les cellules.

De plus, une grande partie des données collectées dans ces études est unique à chaque catalogue, ce qui met en évidence un besoin de ressource unifiée. Par exemple, même si de nombreux échantillons ont été utilisés dans plusieurs études, un incroyable 82 % des séquences ont été trouvées exclusivement dans un catalogue.

Screening des métagénomes intestinaux des nourrissons pour des séquences virales

Pour équilibrer les études axées sur les adultes, une autre étude à grande échelle s'est concentrée sur les nourrissons. Les chercheurs ont examiné plus de 7 800 échantillons fécaux de nourrissons collectés dans plusieurs pays. Ils ont identifié plus de 1,2 million de séquences virales potentielles, contribuant de manière significative à la compréhension globale du virome intestinal dans la petite enfance. Ce dépistage a révélé un degré élevé de diversité virale, car beaucoup des unités virales identifiées étaient uniques.

Construire une ressource unifiée : Le catalogue viral intestinal agrégé

Pour résoudre le problème des bases de données disparates, les chercheurs ont créé une base de données complète appelée le Catalogue Viral Intestinal Agrégé (AVrC). Cette ressource combine des séquences virales provenant des études précédentes, de la base de données IMG/vr, et des nouvelles séquences virales des nourrissons. Le AVrC contient plus d'un million de séquences uniques, offrant une vue plus complète du virome intestinal.

En créant le AVrC, les chercheurs se sont concentrés sur des séquences de haute qualité et ont inclus des annotations telles que la qualité des séquences, la contamination potentielle, la taxonomie virale et les prédictions d'hôte. La base de données comprend de nombreuses séquences représentatives de haute qualité. Notamment, la plupart des séquences sont uniques, indiquant que toute la diversité des virus dans l'intestin humain n'a pas encore été capturée.

Structure et fonctionnalité de l'AVrC

L'AVrC est conçu pour être facile à utiliser et modulaire, permettant des mises à jour et ajouts faciles à mesure que de nouvelles données et outils deviennent disponibles. Les chercheurs ont mis en place un système qui permet aux utilisateurs de rechercher des séquences selon divers critères, comme la qualité et la taxonomie. L'AVrC sert de ressource précieuse pour ceux qui cherchent à étudier des séquences virales et leur relation avec la santé humaine.

Par exemple, les utilisateurs peuvent facilement télécharger des sous-ensembles de données spécifiques, y compris uniquement des séquences de haute qualité ou des séquences provenant de familles virales spécifiques. Cette fonctionnalité aide les chercheurs à analyser le virome intestinal plus efficacement et efficacement.

L'avenir de la recherche sur le virome intestinal

À mesure que la compréhension du virome intestinal évolue, il y a un besoin croissant d'efforts continus pour unifier les ressources virales et améliorer les outils computationnels. Les chercheurs mettent régulièrement à jour l'AVrC pour inclure les dernières découvertes et méthodologies. De plus, des collaborations avec d'autres projets explorant les données du virome intestinal renforceront l'exhaustivité de ces ressources.

La disponibilité croissante des technologies de séquençage de pointe, comme le séquençage à long-reads, offre des promesses pour une exploration plus approfondie du virome intestinal. Ces avancées peuvent éclairer davantage les interactions complexes entre les virus et la santé humaine.

Conclusion

En résumé, le virome intestinal est un aspect crucial de la santé humaine qui nécessite d'être exploré davantage. Les efforts récents pour extraire des séquences virales des métagénomes intestinaux humains ont donné des informations précieuses mais soulignent aussi les défis liés à la qualité des données et à la représentation. La création du Catalogue Viral Intestinal Agrégé répond à certains de ces défis en fournissant une ressource unifiée pour les chercheurs. Les développements futurs en technologie et en collaboration continueront d'améliorer notre compréhension des virus présents dans nos intestins et leur impact global sur la santé.

Source originale

Titre: The Aggregated Gut Viral Catalogue (AVrC): A Unified Resource for Exploring the Viral Diversity of the Human Gut

Résumé: Despite the growing interest in the role of the gut virome in human health and disease, identifying viral sequences from human gut metagenomes remains computationally challenging due to underrepresentation of viral genomes in reference databases. Several recent large-scale efforts have mined human gut metagenomes to establish viral sequence catalogues, using varied computational tools and quality control criteria. However, there has been no consistent comparison of these catalogues quality, diversity, and completeness, nor unification into a comprehensive resource. Here, we systematically surveyed nine previously published human gut viral catalogues, assessing their quality and the overlap of the viral sequences retrieved. While these catalogues collectively screened >40,000 human fecal metagenomes, 82% of the recovered 345,613 viral sequences were unique to one catalogue, highlighting limited redundancy. We further expanded representation by mining 7,867 infant gut metagenomes, retrieving 1,205,739 additional putative viral sequences. From these datasets, we constructed the Aggregated Gut Viral Catalogue (AVrC), a unified modular resource containing 1,018,941 dereplicated viral sequences (449,859 species-level vOTUs). Detailed annotations were generated for sequence quality, taxonomy, predicted lifestyle, and putative host. The AVrC reveals the gut viromes substantial unexplored diversity, providing a pivotal resource for viral discovery. The AVrC is accessible as a relational database and through a web interface allowing customized querying and subset retrieval, enabling streamlined utilization by the research community and future expansions as novel data becomes available. Author summaryThe human gut is home to a vast array of viruses, collectively known as the gut virome, which play a crucial role in human health and disease. Recently, several research groups aiming at providing an overview of the Human gut viral diversity, have created catalogues of viral sequences found in the human gut by analyzing a large number of fecal samples from different individuals. In this study, we compared nine of these existing catalogues and found that there was surprisingly little overlap between them, with 82% of the viral sequences being unique to a single catalogue. To further expand the available data, we analyzed nearly 8,000 additional fecal samples from infants. By combining all this ressources, we created a unified resource called the Aggregated Gut Viral Catalogue (AVrC), which contains more than a million distinct viral sequences, representing nearly 450,000 different viral species. This catalogue, which is easily accessible to the scientific community through a user-friendly web interface, provides a valuable tool for exploring the vast diversity of the human gut virome and its potential implications for human health.

Auteurs: Alise Jany Ponsero, A. Galerina, G. Lugli, C. Milani, W. De Vos, M. Ventura, A. Salonen, B. Hurwitz

Dernière mise à jour: 2024-06-24 00:00:00

Langue: English

Source URL: https://www.biorxiv.org/content/10.1101/2024.06.24.600367

Source PDF: https://www.biorxiv.org/content/10.1101/2024.06.24.600367.full.pdf

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à biorxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires