Simple Science

Scienza all'avanguardia spiegata semplicemente

# La biologia# Bioinformatica

Progressi nella spettrometria di massa per l'analisi chimica

Un nuovo approccio migliora le previsioni di somiglianza chimica nella spettrometria di massa.

― 6 leggere min


Rivelato un nuovo metodoRivelato un nuovo metododi spettrometria di massaprecisione.somiglianze chimiche con maggioreUn approccio innovativo prevede
Indice

La spettrometria di massa è un metodo usato per scoprire quali sostanze chimiche ci sono in diverse sostanze, come estratti naturali e miscele biologiche. Nel campo della Metabolomica, che studia le piccole molecole negli organismi viventi, la spettrometria di massa gioca un ruolo fondamentale. Un approccio comune è chiamato metabolomica non target. Questo significa che i ricercatori guardano a tutte le molecole presenti senza concentrarsi su obiettivi specifici.

Per aiutare a capire la struttura di queste molecole, si usa spesso una tecnica chiamata Spettrometria di massa tandem (MS/MS). Questo comporta la scomposizione delle molecole in pezzi più piccoli e la loro analisi per vedere cosa sono. Ora i ricercatori usano programmi informatici per aiutare a interpretare i risultati di queste letture di spettrometria di massa, rendendo più facile determinare la struttura delle molecole.

Il Ruolo delle Modalità Ioniche

La spettrometria di massa può funzionare in due modalità diverse: modalità ione positivo e modalità ione negativo. Il tipo di modalità usata influisce su quanto bene certe molecole possono essere rilevate. Per questo motivo, gli scienziati di solito analizzano i campioni usando entrambe le modalità per avere un quadro più completo della composizione chimica.

Quando si confrontano gli spettri di massa di queste due modalità, i modelli possono sembrare piuttosto diversi. Questo significa che i metodi tradizionali di confronto, come il calcolo dei punteggi coseno, non funzionano bene quando i dati provengono da modalità ioniche diverse. Di conseguenza, i ricercatori spesso analizzano i dati degli ioni positivi e negativi separatamente, usando librerie di riferimento diverse e creando reti separate.

Esistono alcuni metodi che cercano di combinare entrambe le modalità in una rete unica, ma possono essere complicati e richiedere misurazioni precise. Se ci fosse un modo migliore per collegare le due modalità ioniche, si semplificherebbe il processo e permetterebbe ai ricercatori di usare una libreria di dati più ampia nelle loro analisi.

Un Nuovo Approccio per Prevedere la Similarità Chimica

In questo studio, è stato sviluppato un nuovo metodo per aiutare a prevedere le similarità tra spettri di massa di diverse modalità ioniche. Questo metodo si basa su un tipo di intelligenza artificiale conosciuta come rete neurale siamese, che ha dimostrato di valutare efficacemente le similarità chimiche.

Il modello originale era stato addestrato solo con dati da una modalità ionica alla volta, il che ne limitava l'efficacia. Il nuovo modello utilizza dati da entrambe le modalità positive e negative, il che significa che può valutare le somiglianze tra le due in modo più accurato. Inoltre, il nuovo approccio tiene conto di informazioni extra sui campioni, come la massa del precursore e il tipo di ionizzazione utilizzata. Questi dati aggiuntivi migliorano la capacità del modello di prevedere le somiglianze.

Inoltre, lo studio introduce un modo per determinare quanto siano affidabili le previsioni. Gli utenti possono filtrare i risultati con bassa fiducia, rendendo più facile concentrarsi sulle previsioni più affidabili.

Miglioramenti Chiave nella Metodologia

Il modello rivisitato ha molti miglioramenti rispetto al suo predecessore. Una modifica importante è l'uso di una struttura di codifica più semplice ed efficiente, che rende più veloce l'elaborazione dei dati. Allenare nuovi modelli è diventato anche più facile e efficiente.

Il nuovo modello, che utilizza dati da entrambe le modalità ioniche, ha dimostrato buone prestazioni nel prevedere le somiglianze anche all'interno delle stesse modalità ioniche. Ha superato i modelli precedenti che si concentravano solo su un tipo di modalità ionica. Questo approccio duale apre nuove opportunità per collegare entrambe le modalità nelle analisi. Ora i ricercatori possono creare reti di molecole che includono dati da entrambe le modalità positive e negative.

Dati di Input e Processo di Allenamento

Per il nuovo modello, gli spettri di massa sono stati puliti e organizzati prima dell'analisi. Solo quegli spettri che erano sufficientemente chiari-contenenti un numero minimo di picchi significativi-sono stati utilizzati per l'allenamento. In questo modo, il modello è più probabile che faccia previsioni accurate perché si basa su dati di alta qualità.

Durante l'allenamento, il modello ha imparato a identificare modelli negli spettri di massa e a confrontarli in modo efficace. I ricercatori hanno regolato varie impostazioni e parametri per migliorare ulteriormente le prestazioni del modello.

Valutazione della Qualità e Affidabilità

Un altro aspetto centrale della ricerca è stata la qualità dei dati di input. Il modello può avere difficoltà quando è presentato con spettri di bassa qualità, il che può portare a previsioni inaccurate. Per affrontare questo problema, i ricercatori hanno creato un nuovo strumento per valutare la qualità delle rappresentazioni degli spettri, cioè le rappresentazioni dei dati create dal modello.

Identificando esempi di qualità inferiore, il modello può migliorare l'accuratezza delle previsioni rimuovendo queste voci inaffidabili. Questo consente ai ricercatori di avere maggiore fiducia nei risultati generati dal modello.

Confronto con Metodi Tradizionali

I metodi tradizionali per misurare le somiglianze, come i punteggi coseno, si concentrano principalmente sui modelli specifici all'interno dei dati di frammentazione. Anche se questi metodi possono essere utili, spesso non riescono a tenere conto delle variazioni causate da lievi cambiamenti nelle strutture chimiche. Questo può portare a difficoltà nell'identificare composti veramente simili.

Il nuovo modello MS2DeepScore, d'altra parte, è stato addestrato con una gamma più ampia di esempi. Può confrontare in modo affidabile gli spettri di massa, anche quando i dati provengono da condizioni diverse. Quindi, offre un'alternativa più robusta ai metodi precedenti.

Applicazioni Potenziali

La capacità migliorata di prevedere Somiglianze Chimiche tra diverse modalità ioniche porta a possibilità entusiasmanti per i ricercatori. Ad esempio, possono creare grafici basati su somiglianze che mescolano dati da entrambe le modalità ioniche positive e negative. Questo faciliterà analisi più complete dei dati di spettrometria di massa.

Inoltre, i ricercatori possono confrontare gli spettri della modalità ione negativa con una grande libreria di dati della modalità ione positiva, arricchendo così le loro intuizioni sulle interazioni chimiche e le identità dei composti. Questo potrebbe portare a nuove scoperte e a una migliore comprensione di processi biologici complessi.

Conclusione

I progressi fatti nell'analisi degli spettri di massa attraverso il modello MS2DeepScore presentano significative opportunità per la ricerca nella metabolomica e nei campi correlati. Con la capacità di integrare dati da più modalità ioniche e una migliore valutazione dell'affidabilità delle previsioni, gli scienziati sono meglio attrezzati per esplorare il paesaggio chimico degli organismi viventi.

Man mano che i ricercatori continuano a spingere i confini di ciò che è possibile con la spettrometria di massa, l'impatto di queste metodologie sulla nostra comprensione della biologia sarà probabilmente profondo. La capacità di stabilire collegamenti tra diversi tipi di dati semplifica la ricerca e favorisce nuove scoperte che potrebbero avere importanti implicazioni in vari domini scientifici.

Fonte originale

Titolo: Reliable cross-ion mode chemical similarity prediction between MS2 spectra

Estratto: Mass spectrometry is commonly used to characterize metabolites in untargeted metabolomics. This can be done in positive and negative ionization mode, a choice typically guided by the fraction of metabolites a researcher is interested in. During analysis, mass spectral comparisons are widely used to enable annotation through reference libraries and to facilitate data organization through networking. However, until now, such comparisons between mass spectra were restricted to mass spectra of the same ionization mode, as the two modes generally result in very distinct fragmentation spectra. To overcome this barrier, here, we have implemented a machine learning model that can predict chemical similarity between spectra of different ionization modes. Hence, our new MS2DeepScore 2.0 model facilitates the seamless integration of positive and negative ionization mode mass spectra into one analysis pipeline. This creates entirely new options for data exploration, such as mass spectral library searching of negative ion mode spectra in positive ion mode libraries or cross-ionization mode molecular networking. Furthermore, to improve the reliability of predictions and better cope with unseen data, we have implemented a method to estimate the quality of prediction. This will help to avoid false predictions on spectra with low information content or spectra that substantially differ from the training data. We anticipate that the MS2DeepScore 2.0 model will extend our current capabilities in organizing and annotating untargeted metabolomics profiles.

Autori: Niek F. de Jonge, D. Joas, L.-J. Truong, J. J. J. van der Hooft, F. Huber

Ultimo aggiornamento: 2024-04-02 00:00:00

Lingua: English

URL di origine: https://www.biorxiv.org/content/10.1101/2024.03.25.586580

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.03.25.586580.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili