Presentiamo Peptonizer2000: Un Nuovo Strumento per l'Identificazione Microbica
Peptonizer2000 semplifica l'identificazione tassonomica nei campioni metaproteomici.
― 7 leggere min
Indice
Le comunità microbiche, spesso chiamate microbiomi, esistono in tanti ambienti diversi come gli oceani, gli impianti di biogas e i nostri intestini. Negli ultimi tempi, grazie ai progressi tecnologici, abbiamo imparato di più su queste comunità. Per esempio, gli scienziati hanno scoperto che alcuni microbiomi possono utilizzare il monossido di carbonio, possono cambiare in base alle nostre diete e possono influenzare la salute e le malattie sia negli esseri umani che negli animali.
Cos'è la Metaproteomica?
La metaproteomica è un campo che analizza queste comunità microbiche attraverso lo studio delle loro proteine. Questo aiuta i ricercatori a capire come funzionano queste comunità e quali organismi sono presenti. I metodi tradizionali per studiare le proteine possono essere complicati, specialmente quando si ha a che fare con campioni di microbiomi diversi. Questa complessità può rendere difficile identificare gli specifici microorganismi in un campione.
Sfide nell'Identificazione Tassonomica
Una delle sfide principali è determinare quali microorganismi ci siano in un campione. Le proteine possono apparire molto simili, rendendo complicato capire da quale organismo provengano. In campioni con molti organismi diversi, individuare specie specifiche può essere difficile.
I ricercatori hanno sviluppato vari strumenti bioinformatici per aiutare a identificare gli organismi e le loro funzioni nei campioni di microbiomi. Strumenti noti includono iMetaLab, Galaxy e Unipept. Questi strumenti generalmente si basano sul confronto di certe sequenze di peptide con organismi noti per fare identificazioni. Una pratica comune è considerare un taxon identificato se vengono rilevati due o tre Peptidi unici.
Se un peptide non può essere collegato a una specie specifica, viene spesso ricondotto a un livello Tassonomico più ampio, il che può rendere l'analisi meno precisa. Questo termine tassonomico più ampio è conosciuto come antenato comune più basso (LCA).
Con l'aumento delle basi di dati pubbliche, il numero di taxa e proteine noti è aumentato. Tuttavia, questo può portare a una minore accuratezza nell'identificare taxa a livelli inferiori. Pertanto, sono necessari metodi migliori per l'identificazione tassonomica.
Strumenti Avanzati per l'Identificazione Tassonomica
Uno strumento avanzato è Mi-CiD, progettato per l'analisi del metaproteoma e offre calcoli robusti per l'identificazione tassonomica. Tuttavia, richiede il proprio Database e non funziona efficacemente con i risultati di altri motori di ricerca popolari. Questo limita la sua applicazione negli studi reali.
D'altra parte, Unipept può accettare input da diversi motori di ricerca, ma conta solo il numero di peptidi per l'identificazione.
Attualmente, non ci sono strumenti software che combinano statistiche forti, facilità d'uso, buone opzioni visive e la possibilità di usare dati da qualsiasi motore di ricerca. Questo è significativo perché l'uso di dati da una varietà più ampia di metodi sta diventando più comune.
Presentiamo Peptonizer2000
Qui presentiamo Peptonizer2000, un nuovo flusso di lavoro per identificare organismi nei campioni di metaproteoma. Questo strumento fornisce punteggi di fiducia per le identificazioni tassonomiche. Il Peptonizer2000 si basa su una versione precedente chiamata PepGM, che era per l'identificazione di proteine in campioni virali. A differenza di PepGM, il Peptonizer2000 si concentra sulle comunità microbiche.
Il Peptonizer2000 utilizza modelli statistici per determinare le tassonomie, considerando i punteggi dei peptidi dai risultati delle ricerche nel database insieme alle informazioni di Unipept. Fornisce un'identificazione ad alta risoluzione dei microorganismi con punteggi di fiducia per ciascun taxon.
Come Funziona il Peptonizer2000
Il Peptonizer2000 può accettare vari file di input. Gli utenti possono fornire file di spettro MS/MS e un database di riferimento per la ricerca Proteomica. Se preferito, gli utenti possono inserire le loro corrispondenze peptide-spettro in formati specifici. Questa flessibilità consente al Peptonizer2000 di lavorare con dati sia dai metodi DDA che DIA.
Il flusso di lavoro include diversi passaggi importanti:
- Ricerca nel Database Proteomico: Lo spettro MS/MS viene confrontato con il database fornito dall'utente. Questo produce un elenco di corrispondenze peptide-spettro identificate insieme ai punteggi.
- Query Unipept: I peptidi identificati vengono quindi interrogati in Unipept per raccogliere informazioni tassonomiche. I peptidi vengono raggruppati e viene generata una risposta contenente dati tassonomici.
- Creazione del Modello Grafico: Viene costruito un modello grafico che aiuta a rappresentare le relazioni tra peptidi e tassoni.
- Valutazione dei Parametri: I parametri del modello grafico vengono valutati per trovare la miglior corrispondenza per il campione in questione.
- Visualizzazione dei Risultati: Alla fine, i risultati vengono restituiti in vari formati, fornendo agli utenti i taxa identificati e i loro punteggi di fiducia associati.
Passaggi Dettagliati del Peptonizer2000
1. Ricerca nel Database Proteomico
Gli utenti iniziano cercando gli spettri MS/MS contro il loro database di riferimento scelto. Questa ricerca produce un elenco di corrispondenze peptide-spettro, che include punteggi. È importante notare che l'uso del passaggio di ricerca nel database è opzionale; gli utenti possono fornire già le corrispondenze peptide-spettro con punteggio se preferiscono.
2. Interrogazione di Unipept
Una volta identificati i peptidi, vengono inviati in batch a Unipept per l'annotazione tassonomica. Questa parte è stata migliorata con un nuovo endpoint API che collega direttamente i peptidi ai loro rispettivi taxa. Un massimo di 10 peptidi può essere interrogato alla volta per evitare sovraccarichi.
3. Assemblaggio del Modello Grafico
Il modello grafico è costruito usando lo stesso approccio fondamentale di PepGM. Include nodi sia per i peptidi che per i taxa, e vengono effettuate connessioni tra di essi in base alle loro relazioni. I parametri per questo modello sono stabiliti per aiutare a determinare la probabilità che i peptidi siano associati ai taxa.
4. Valutazione dei Parametri e Ricerca a Griglia
Il flusso di lavoro valuta una gamma di parametri del modello per determinare quale combinazione funziona meglio per ogni campione. Confronta i risultati con un elenco di taxa ponderati per trovare le assegnazioni più accurate.
5. Restituzione dei Risultati e Visualizzazione
Il Peptonizer2000 genera vari output, come un file .csv di base che elenca tutti i taxa identificati e i punteggi di probabilità. Gli utenti possono anche visualizzare i risultati in grafici a barre o viste ad albero, fornendo un quadro chiaro delle comunità microbiche identificate.
Analisi dei Campioni Metaproteomici
Il Peptonizer2000 è stato testato su molteplici campioni metaproteomici disponibili da database pubblici. Uno di questi campioni è la miscela SIHUMIx, che include batteri comuni presenti nell'intestino umano.
Risultati per il Campione SIHUMIx
Analizzando questo campione, il Peptonizer2000 ha identificato con successo tutti i taxa presenti, con punteggi di fiducia elevati attribuiti a ciascuno. Questo dimostra quanto possa essere efficace il Peptonizer2000 nell'identificare organismi in miscele più semplici.
Prestazioni con Campioni Complessi
Il Peptonizer2000 è stato applicato anche a campioni più complessi, come miscugli assemblati in laboratorio di più microorganismi. Ha identificato correttamente la maggior parte dei taxa presenti, con alcune limitazioni quando si trattava di distinguere organismi strettamente correlati.
Valutazione con Database di Riferimento Non Personalizzati
Le prestazioni dello strumento variavano quando si usavano database di riferimento più grandi non specificamente adattati al campione. Ha dimostrato come l'uso di tali database potrebbe portare a perdere taxa e a un aumento dei falsi positivi. Pertanto, una selezione attenta dei database di riferimento è importante per identificazioni accurate.
Analisi di Campioni Fecali
Il Peptonizer2000 è stato utilizzato anche per analizzare un campione fecale di cui non si conosceva la vera composizione. Questo ha mostrato la sua capacità di identificare famiglie di batteri e fornire punteggi che riflettono la fiducia nella loro presenza.
Conclusione
Il Peptonizer2000 rappresenta un significativo passo avanti nell'identificazione della composizione tassonomica dei campioni di metaproteoma. Integrando modelli statistici con punteggi di peptidi e informazioni tassonomiche da Unipept, offre ai ricercatori uno strumento potente per comprendere le comunità microbiche.
Nei futuri sviluppi, migliorare l'efficienza dell'algoritmo, potenziare le capacità del database e affinare l'accesso degli utenti continuerà a migliorare la sua utilità. In generale, il Peptonizer2000 mostra promesse nel migliorare la nostra comprensione del mondo microbico e del suo impatto sulla salute e sulle malattie.
Titolo: The Peptonizer2000: graphical model based taxonomic identifications of metaproteomic samples
Estratto: Metaproteomics, the large-scale study of proteins from microbial communities, presents complex challenges in taxonomic inference due to sequence homologies between proteins within and across taxa. Commonly, taxonomic inference relies on heuristics, and few more advanced methods are available. We introduce the Peptonizer2000, a novel graphical model-based workflow designed to provide high-resolution taxonomic identifications of metaproteomic samples with associated confidence scores. This tool integrates peptide scores from any proteomic search engine with peptide-taxon map-pings from the Unipept database, using advanced statistical modeling to enhance tax-onomic resolution. We demonstrate the Peptonizer2000s accuracy and robustness through the analysis of various publicly available metaproteomic samples, showcas-ing its ability to deliver reliable probabilistic taxonomic identifications. Our results highlight the Peptonizer2000s potential to improve the specificity and confidence of taxonomic assignments in metaproteomics, providing a valuable resource for the study of complex microbial communities.
Autori: Thilo Muth, T. Holstein, P. Verschaffelt, T. Van den Bossche, L. Martens
Ultimo aggiornamento: 2024-05-22 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2024.05.20.594958
Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.05.20.594958.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.