Simple Science

Ciência de ponta explicada de forma simples

# Biologia# Bioinformática

Apresentando o Peptonizer2000: Uma Nova Ferramenta para Identificação Microbiana

Peptonizer2000 simplifica a identificação taxonômica em amostras metaproteômicas.

― 8 min ler


Peptonizer2000:Peptonizer2000:Redefinindo a AnáliseMicrobianaprecisão.identificar microrganismos comUma nova ferramenta poderosa para
Índice

Comunidades microbianas, muitas vezes chamadas de microbiomas, existem em vários ambientes, como oceanos, plantas de biogás e nossos próprios intestinos. Avanços recentes na tecnologia ajudaram a gente a aprender mais sobre essas comunidades. Por exemplo, cientistas descobriram que alguns microbiomas podem usar monóxido de carbono, podem mudar com base nas nossas dietas e podem influenciar a saúde e doenças em humanos e animais.

O que é Metaproteômica?

Metaproteômica é um campo que analisa essas comunidades microbianas estudando suas proteínas. Isso ajuda os pesquisadores a entender como essas comunidades funcionam e quais organismos estão presentes. Métodos tradicionais de estudo de proteínas podem ser complicados, especialmente quando lidamos com amostras de microbioma diversas. Essa complexidade pode dificultar a identificação dos microrganismos específicos em uma amostra.

Desafios na Identificação Taxonômica

Um dos principais desafios é determinar quais microrganismos estão em uma amostra. As proteínas podem parecer muito semelhantes, dificultando saber de qual organismo elas vêm. Em amostras com muitos organismos diferentes, identificar espécies específicas pode ser complicado.

Os pesquisadores desenvolveram várias ferramentas de bioinformática para ajudar a identificar organismos e suas funções em amostras de microbioma. Ferramentas conhecidas incluem iMetaLab, Galaxy e Unipept. Essas ferramentas geralmente se baseiam em combinar certas sequências de Peptídeos com organismos conhecidos para fazer identificações. Uma prática comum é considerar um táxon identificado se dois ou três peptídeos únicos forem detectados.

Se um peptídeo não puder ser ligado a uma espécie específica, ele costuma ser rastreado de volta para um nível taxonômico mais amplo, o que pode tornar a análise menos precisa. Esse termo taxonômico mais amplo é conhecido como o ancestral comum mais baixo (LCA).

Com o aumento dos Bancos de dados públicos disponíveis, o número de táxon e proteínas conhecidos aumentou. No entanto, isso pode, na verdade, levar a menos precisão ao identificar táxons em níveis mais baixos. Portanto, métodos melhores de identificação taxonômica são necessários.

Ferramentas Avançadas de Identificação Taxonômica

Uma ferramenta avançada é o Mi-CiD, que é projetada para análise de metaproteoma e fornece cálculos robustos para identificação taxonômica. No entanto, ela precisa de seu próprio banco de dados e não funciona efetivamente com saídas de outros motores de busca populares. Isso limita sua aplicação em estudos do mundo real.

Por outro lado, o Unipept pode aceitar entradas de diferentes motores de busca, mas só conta o número de peptídeos para identificação.

Atualmente, não existem ferramentas de software que combinem estatísticas fortes, facilidade de uso, boas opções visuais e a capacidade de usar dados de qualquer motor de busca. Isso é importante porque o uso de dados de uma variedade maior de métodos está se tornando mais popular.

Apresentando o Peptonizer2000

Aqui apresentamos o Peptonizer2000, um novo fluxo de trabalho para identificar organismos em amostras de metaproteoma. Essa ferramenta fornece pontuações de confiança para identificações taxonômicas. O Peptonizer2000 se baseia em uma versão anterior chamada PepGM, que servia para identificar proteínas em amostras virais. Diferente do PepGM, o Peptonizer2000 foca em comunidades microbianas.

O Peptonizer2000 usa modelagem estatística para determinar taxonomias, considerando as pontuações de peptídeos de buscas em bancos de dados junto com informações do Unipept. Ele oferece uma identificação de microrganismos de alta resolução com pontuações de confiança para cada táxon.

Como o Peptonizer2000 Funciona

O Peptonizer2000 pode aceitar vários arquivos de entrada. Os usuários podem fornecer arquivos de espectros MS/MS e um banco de dados de referência para a busca Proteômica. Se preferirem, os usuários podem inserir suas correspondências peptídeo-espectro em formatos específicos. Essa flexibilidade permite que o Peptonizer2000 funcione com dados de métodos DDA e DIA.

O fluxo de trabalho inclui várias etapas importantes:

  1. Busca em Banco de Dados Proteômico: O espectro MS/MS é compatível com o banco de dados fornecido pelo usuário. Isso gera uma lista de correspondências peptídeo-espectro identificadas junto com pontuações.
  2. Consulta ao Unipept: Os peptídeos identificados são consultados no Unipept para coletar informações taxonômicas. Os peptídeos são agrupados e uma resposta contendo dados Taxonômicos é gerada.
  3. Criação do Modelo Gráfico: Um modelo gráfico é construído, ajudando a representar as relações entre peptídeos e táxons.
  4. Avaliação de Parâmetros: Os parâmetros do modelo gráfico são avaliados para encontrar o melhor ajuste para a amostra em questão.
  5. Visualização dos Resultados: Por fim, os resultados são apresentados em vários formatos, fornecendo aos usuários os táxons identificados e suas pontuações de confiança associadas.

Passos Detalhados do Peptonizer2000

1. Busca em Banco de Dados Proteômico

Os usuários começam buscando espectros MS/MS contra o banco de dados de referência escolhido. Essa busca produz uma lista de correspondências peptídeo-espectro, que inclui pontuações. É importante notar que usar a etapa de busca em banco de dados é opcional; os usuários podem fornecer correspondências peptídeo-espectro já pontuadas se preferirem.

2. Consultando o Unipept

Uma vez que os peptídeos são identificados, eles são enviados em lotes para o Unipept para anotação taxonômica. Essa parte foi melhorada com um novo endpoint de API que liga diretamente peptídeos aos seus táxons correspondentes. Um máximo de 10 peptídeos pode ser consultado de cada vez para evitar sobrecarga.

3. Montando o Modelo Gráfico

O modelo gráfico é criado usando a mesma abordagem fundamental que o PepGM. Ele inclui nós para peptídeos e táxons, e conexões são feitas entre eles com base em suas relações. Parâmetros para esse modelo são estabelecidos para ajudar a determinar a probabilidade de peptídeos estarem associados a táxons.

4. Avaliação de Parâmetros e Busca em Grade

O fluxo de trabalho avalia uma variedade de parâmetros do modelo para determinar qual combinação funciona melhor para cada amostra. Ele compara os resultados contra uma lista de táxons ponderados para encontrar as atribuições mais precisas.

5. Saída e Visualização dos Resultados

O Peptonizer2000 gera várias saídas, como um arquivo .csv básico listando todos os táxons identificados e suas pontuações de probabilidade. Os usuários também podem visualizar resultados em gráficos de barras ou vistas em árvore, fornecendo uma imagem clara das comunidades microbianas identificadas.

Analisando Amostras Metaproteômicas

O Peptonizer2000 foi testado em várias amostras de metaproteoma disponíveis em bancos de dados públicos. Uma dessas amostras é a mistura SIHUMIx, que inclui bactérias comuns encontradas no intestino humano.

Resultados para a Amostra SIHUMIx

Ao analisar essa amostra, o Peptonizer2000 identificou com sucesso todos os táxons presentes, com altas pontuações de confiança atribuídas a cada um. Isso demonstra quão eficaz o Peptonizer2000 pode ser na identificação de organismos em misturas mais simples.

Desempenho com Amostras Complexas

O Peptonizer2000 também foi aplicado a amostras mais complexas, como misturas montadas em laboratório de múltiplos microrganismos. Ele identificou corretamente a maioria dos táxons presentes, com algumas limitações ao distinguir organismos muito relacionados.

Avaliando com Bancos de Dados de Referência Não Especificados

O desempenho da ferramenta variou ao usar bancos de dados de referência maiores que não eram especificamente ajustados à amostra. Mostrou como usar tais bancos de dados poderia resultar em táxons perdidos e mais falsos positivos. Portanto, a seleção cuidadosa de bancos de dados de referência é importante para identificações precisas.

Análise de Amostra Fecal

O Peptonizer2000 também foi utilizado para analisar uma amostra fecal cuja composição verdadeira não era conhecida. Isso mostrou sua capacidade de identificar famílias de bactérias e fornecer pontuações que refletem confiança em sua presença.

Conclusão

O Peptonizer2000 representa um avanço significativo na identificação da composição taxonômica de amostras de metaproteoma. Ao integrar modelagem estatística com pontuações de peptídeos e informações taxonômicas do Unipept, ele oferece aos pesquisadores uma ferramenta poderosa para entender comunidades microbianas.

Nos futuros desenvolvimentos, a melhoria da eficiência do algoritmo, o aprimoramento das capacidades de banco de dados e o refinamento do acesso dos usuários continuarão a aumentar sua utilidade. No geral, o Peptonizer2000 mostra potencial para aprimorar nosso entendimento do mundo microbiano e seu impacto na saúde e doença.

Fonte original

Título: The Peptonizer2000: graphical model based taxonomic identifications of metaproteomic samples

Resumo: Metaproteomics, the large-scale study of proteins from microbial communities, presents complex challenges in taxonomic inference due to sequence homologies between proteins within and across taxa. Commonly, taxonomic inference relies on heuristics, and few more advanced methods are available. We introduce the Peptonizer2000, a novel graphical model-based workflow designed to provide high-resolution taxonomic identifications of metaproteomic samples with associated confidence scores. This tool integrates peptide scores from any proteomic search engine with peptide-taxon map-pings from the Unipept database, using advanced statistical modeling to enhance tax-onomic resolution. We demonstrate the Peptonizer2000s accuracy and robustness through the analysis of various publicly available metaproteomic samples, showcas-ing its ability to deliver reliable probabilistic taxonomic identifications. Our results highlight the Peptonizer2000s potential to improve the specificity and confidence of taxonomic assignments in metaproteomics, providing a valuable resource for the study of complex microbial communities.

Autores: Thilo Muth, T. Holstein, P. Verschaffelt, T. Van den Bossche, L. Martens

Última atualização: 2024-05-22 00:00:00

Idioma: English

Fonte URL: https://www.biorxiv.org/content/10.1101/2024.05.20.594958

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.05.20.594958.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao biorxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes