Entendendo o Papel dos Viromas Intestinais
Avanços recentes mostram as complexidades do viroma intestinal e suas implicações para a saúde.
― 6 min ler
Índice
- Desafios na Perfilagem do Viroma Intestinal
- Esforços em Grande Escala para Extrair Sequências Virais
- Qualidade, Diversidade e Comparação dos Catálogos Virais
- Triagem de Metagenomas Intestinais de Bebês para Sequências Virais
- Construindo um Recurso Unificado: O Catálogo Viral Intestinal Agregado
- Estrutura e Funcionalidade do AVrC
- O Futuro da Pesquisa do Viroma Intestinal
- Conclusão
- Fonte original
- Ligações de referência
Estudos recentes mostram que o Viroma intestinal, que inclui todos os vírus presentes no nosso intestino, tem um papel significativo na nossa saúde e doenças. No entanto, identificar esses vírus a partir de grandes conjuntos de dados ainda é uma tarefa difícil. Pesquisas revelam que de 75% a 99% das sequências virais encontradas nos viromas intestinais não correspondem a nenhum genoma viral conhecido. Isso é, em parte, porque a maioria das bases de dados genômicas não tem sequências virais suficientes, e certos tipos de vírus estão super-representados.
Desafios na Perfilagem do Viroma Intestinal
Fazer a perfilagem dos viromas intestinais usando bancos de dados de referência viral geralmente resulta em uma visão ruim e incompleta da composição real do viroma intestinal. Novas ferramentas de bioinformática estão sendo desenvolvidas que usam aprendizado de máquina para identificar características que sugerem uma origem viral. Essas ferramentas tendem a identificar mais sequências virais desconhecidas em comparação com métodos tradicionais baseados em referência. Ferramentas como VirFinder, DeepVirFinder e Seeker classificam sequências como virais ou não virais com base na composição da sequência. Outras ferramentas avaliam características genômicas, como densidade de genes e número de genes homólogos para fazer previsões. Apesar das vantagens, as ferramentas atuais geralmente só funcionam com sequências montadas e oferecem uma classificação simples de sim ou não.
Esforços em Grande Escala para Extrair Sequências Virais
Nos últimos anos, muitos projetos grandes foram lançados para coletar sequências virais de Dados Metagenômicos. O banco de dados IMG/vr coleta sequências virais tanto ambientais quanto associadas a humanos. Vários estudos focaram especificamente nos viromas intestinais humanos, levando à criação de múltiplos bancos de dados. Por exemplo, um estudo analisou quase 2.700 amostras intestinais humanas e identificou mais de 33.000 unidades virais semelhantes a espécies. Outro estudo combinou quase 6.000 conjuntos de dados de diferentes partes do corpo, incluindo o intestino, para construir um grande banco de dados contendo mais de 45.000 unidades virais.
Outros esforços focaram nos metagenomas intestinais humanos, incluindo a extração de dados anteriormente não publicados. Por exemplo, um estudo conseguiu recuperar milhares de genomas completos de fagos a partir de metagenomas intestinais. Também houve esforços focados em entender o viroma intestinal em bebês, levando à descoberta de milhares de novas entidades virais.
Qualidade, Diversidade e Comparação dos Catálogos Virais
Apesar desses esforços significativos, não há uma maneira consistente de comparar a qualidade e diversidade desses catálogos virais. Um grande desafio é que diferentes estudos usam métodos e critérios de controle de qualidade diferentes. Além disso, muitos estudos dependem de ferramentas de identificação viral que variam bastante.
A qualidade das sequências recuperadas de vários estudos difere muito. Enquanto alguns catálogos contêm a maior parte de sequências de alta qualidade, outros têm mais de 75% de baixa qualidade. Alguns projetos até enfrentaram problemas com contaminação por plasmídeos, significando que algumas sequências classificadas como virais podem, na verdade, vir de plasmídeos, um tipo de DNA que pode se replicar independentemente dentro das células.
Além disso, muitos dos dados coletados nesses estudos são únicos para cada catálogo, destacando a necessidade de um recurso unificado. Por exemplo, enquanto muitas amostras foram usadas em vários estudos, impressionantes 82% das sequências foram encontradas exclusivamente em um catálogo.
Triagem de Metagenomas Intestinais de Bebês para Sequências Virais
Para equilibrar os estudos focados em adultos, outro estudo em grande escala se concentrou em bebês. Os pesquisadores analisaram mais de 7.800 amostras fecais de bebês coletadas de vários países. Eles identificaram mais de 1,2 milhões de sequências virais potenciais, contribuindo significativamente para a compreensão geral do viroma intestinal na primeira infância. Essa triagem revelou um alto grau de diversidade viral, já que muitas das unidades virais identificadas eram únicas.
Construindo um Recurso Unificado: O Catálogo Viral Intestinal Agregado
Para resolver o problema dos bancos de dados discrepantes, os pesquisadores criaram um banco de dados abrangente chamado Catálogo Viral Intestinal Agregado (AVrC). Esse recurso combina sequências virais de estudos anteriores, o banco de dados IMG/vr e as novas sequências virais de bebês coletadas. O AVrC contém mais de 1 milhão de sequências únicas, oferecendo uma visão mais completa do viroma intestinal.
Ao criar o AVrC, os pesquisadores se concentraram em sequências de alta qualidade e incluíram anotações como qualidade da sequência, possível contaminação, taxonomia viral e previsões de hospedeiros. O banco de dados compreende várias sequências representativas de alta qualidade. Notavelmente, a maioria das sequências é única, indicando que a diversidade total de vírus no intestino humano ainda não foi capturada.
Estrutura e Funcionalidade do AVrC
O AVrC é projetado para ser amigável ao usuário e modular, permitindo atualizações e adições fáceis à medida que novos dados e ferramentas se tornam disponíveis. Os pesquisadores implementaram um sistema que permite aos usuários buscar sequências com base em vários critérios, como qualidade e taxonomia. O AVrC serve como um recurso valioso para quem procura estudar sequências virais e sua relação com a saúde humana.
Por exemplo, os usuários podem baixar facilmente subconjuntos específicos de dados, incluindo apenas sequências de alta qualidade ou sequências de famílias virais específicas. Essa funcionalidade ajuda os pesquisadores a analisar o viroma intestinal de forma mais eficiente e eficaz.
O Futuro da Pesquisa do Viroma Intestinal
À medida que a compreensão do viroma intestinal evolui, cresce a necessidade de esforços contínuos para unificar recursos virais e melhorar ferramentas computacionais. Os pesquisadores estão constantemente atualizando o AVrC para incluir os últimos achados e metodologias. Além disso, colaborações com outros projetos que exploram dados do viroma intestinal aumentarão a abrangência desses recursos.
A crescente acessibilidade de tecnologias de sequenciamento de ponta, como o sequenciamento de leituras longas, promete uma exploração mais aprofundada do viroma intestinal. Esses avanços podem esclarecer mais as interações complexas entre vírus e a saúde humana.
Conclusão
Resumindo, o viroma intestinal é um aspecto crítico da saúde humana que precisa ser mais explorado. Esforços recentes para extrair sequências virais de metagenomas intestinais humanos geraram insights valiosos, mas também destacam desafios na qualidade e representação dos dados. A criação do Catálogo Viral Intestinal Agregado aborda alguns desses desafios ao fornecer um recurso unificado para pesquisadores. Desenvolvimentos futuros em tecnologia e colaboração continuarão a aprimorar nossa compreensão dos vírus presentes em nossos intestinos e seu impacto geral na saúde.
Título: The Aggregated Gut Viral Catalogue (AVrC): A Unified Resource for Exploring the Viral Diversity of the Human Gut
Resumo: Despite the growing interest in the role of the gut virome in human health and disease, identifying viral sequences from human gut metagenomes remains computationally challenging due to underrepresentation of viral genomes in reference databases. Several recent large-scale efforts have mined human gut metagenomes to establish viral sequence catalogues, using varied computational tools and quality control criteria. However, there has been no consistent comparison of these catalogues quality, diversity, and completeness, nor unification into a comprehensive resource. Here, we systematically surveyed nine previously published human gut viral catalogues, assessing their quality and the overlap of the viral sequences retrieved. While these catalogues collectively screened >40,000 human fecal metagenomes, 82% of the recovered 345,613 viral sequences were unique to one catalogue, highlighting limited redundancy. We further expanded representation by mining 7,867 infant gut metagenomes, retrieving 1,205,739 additional putative viral sequences. From these datasets, we constructed the Aggregated Gut Viral Catalogue (AVrC), a unified modular resource containing 1,018,941 dereplicated viral sequences (449,859 species-level vOTUs). Detailed annotations were generated for sequence quality, taxonomy, predicted lifestyle, and putative host. The AVrC reveals the gut viromes substantial unexplored diversity, providing a pivotal resource for viral discovery. The AVrC is accessible as a relational database and through a web interface allowing customized querying and subset retrieval, enabling streamlined utilization by the research community and future expansions as novel data becomes available. Author summaryThe human gut is home to a vast array of viruses, collectively known as the gut virome, which play a crucial role in human health and disease. Recently, several research groups aiming at providing an overview of the Human gut viral diversity, have created catalogues of viral sequences found in the human gut by analyzing a large number of fecal samples from different individuals. In this study, we compared nine of these existing catalogues and found that there was surprisingly little overlap between them, with 82% of the viral sequences being unique to a single catalogue. To further expand the available data, we analyzed nearly 8,000 additional fecal samples from infants. By combining all this ressources, we created a unified resource called the Aggregated Gut Viral Catalogue (AVrC), which contains more than a million distinct viral sequences, representing nearly 450,000 different viral species. This catalogue, which is easily accessible to the scientific community through a user-friendly web interface, provides a valuable tool for exploring the vast diversity of the human gut virome and its potential implications for human health.
Autores: Alise Jany Ponsero, A. Galerina, G. Lugli, C. Milani, W. De Vos, M. Ventura, A. Salonen, B. Hurwitz
Última atualização: 2024-06-24 00:00:00
Idioma: English
Fonte URL: https://www.biorxiv.org/content/10.1101/2024.06.24.600367
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.06.24.600367.full.pdf
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.