Simple Science

Scienza all'avanguardia spiegata semplicemente

# La biologia# Bioinformatica

Avanzamenti nella spettrometria di massa top-down per l'analisi dei proteoformi

Nuove tecniche migliorano l'identificazione dei proteoformi nei campioni biologici.

― 6 leggere min


Approcci diApprocci diIdentificazione delleProteoforme di Nuovaproteine complesse nei campioni.Metodi migliorati per analizzare
Indice

La spettrometria di massa top-down (MS) è uno strumento potente usato per studiare le proteine nei campioni biologici. Permette agli scienziati di analizzare forme intere di proteine, conosciute come Proteoforme, invece di limitarsi a frammenti. Questo metodo è particolarmente utile per analizzare campioni biologici complessi come le cellule umane, poiché può identificare e quantificare le diverse forme di proteine presenti.

Avanzamenti nella tecnologia

Recenti miglioramenti nelle tecniche di separazione delle proteoforme e nei sistemi di spettrometria di massa hanno portato a una migliore identificazione di queste proteine. Utilizzando la proteomica top-down (TDP), i ricercatori possono creare profili delle varie proteoforme e vedere quali sono più o meno presenti in campioni diversi.

La maggior parte degli studi che utilizzano la TDP si basa su un metodo chiamato spettrometria di massa a acquisizione dati dipendente dalla massa top-down (TD-DDA-MS). In questo metodo, lo spettrometro di massa scansiona gli ioni precursori-molecole che verranno analizzate mentre escono da un processo di separazione, come la cromatografia liquida. Gli ioni più intensi vengono selezionati per ulteriori analisi, dove vengono frammentati e analizzati per aiutare a identificare le proteoforme.

Tuttavia, ci sono alcune limitazioni con il TD-DDA-MS. Il metodo può essere incoerente, poiché dipende da quali ioni vengono scelti per l'analisi. A volte, segnali più deboli non vengono selezionati, il che significa che alcune proteine potrebbero essere trascurate.

Un approccio migliore: TD-DIA-MS

Un nuovo approccio, noto come spettrometria di massa a acquisizione dati indipendente dalla massa top-down (TD-DIA-MS), affronta alcune di queste problematiche. Invece di concentrarsi solo sui segnali più forti, il TD-DIA-MS raccoglie dati da tutti gli ioni precursori all'interno di intervalli specifici. Questo porta a un dataset più completo che non si basa su conoscenze pregresse riguardo a quali ioni siano importanti. Raccogliendo dati da tutti i segnali, il TD-DIA-MS può potenzialmente fornire risultati più coerenti e catturare segnali più deboli che potrebbero essere trascurati nel TD-DDA-MS.

Tuttavia, anche il TD-DIA-MS ha le sue sfide. Gli spettri di massa prodotti possono diventare complessi perché più ioni possono essere frammentati contemporaneamente, rendendo i dati più difficili da interpretare.

Metodi per identificare le proteine

Ci sono vari modi per analizzare i dati da DIA-MS per identificare i peptidi, che sono pezzi più piccoli di proteine. Questi metodi generalmente rientrano in due categorie: quelli che utilizzano librerie spettrali e quelli che non lo fanno.

I metodi basati su librerie spettrali utilizzano dati raccolti in precedenza per identificare peptidi in nuovi dataset. Esempi di strumenti in questa categoria includono OpenSWATH e Spectronaut. D'altra parte, i metodi liberi da librerie si basano su banche dati delle sequenze proteiche senza necessità di dati spettrali precedenti. Strumenti come DIA-Umpire e DIA-NN rientrano in questa categoria.

Nella TDP, l'analisi delle proteoforme intatte può creare ioni grandi e complessi. Questo può rendere difficile per gli strumenti tradizionali di analisi bottom-up elaborare in modo efficiente i dati del TD-DIA-MS.

Introducendo TopDIA

Per affrontare queste sfide, è stato sviluppato un nuovo strumento software chiamato TopDIA specificamente per l'identificazione delle proteoforme utilizzando TD-DIA-MS. TopDIA genera spettri semplificati dai dati complessi forniti dal TD-DIA-MS e poi li confronta con banche dati di sequenze proteiche per identificare le proteoforme.

Questo strumento ha dimostrato di migliorare il numero di proteoforme identificate rispetto ai metodi tradizionali. Ad esempio, quando applicato a campioni di batteri E. coli, TopDIA ha identificato significativamente più proteoforme e proteine rispetto al precedente metodo TD-DDA-MS.

Preparazione e analisi dei campioni

Negli esperimenti con E. coli, i ricercatori hanno prima preparato i loro campioni facendo crescere i batteri in un mezzo liquido, lavandoli e poi rompendo le cellule per estrarre le loro proteine. Dopo aver ottenuto la soluzione proteica, l'hanno analizzata utilizzando uno spettrometro di massa collegato a un sistema di cromatografia liquida.

Diversi parametri sono stati utilizzati per la spettrometria di massa per analizzare i campioni sia in modalità DDA che DIA, concentrandosi su vari intervalli di ioni precursori. Gli spettri sono stati elaborati e solo quelli con intensità superiori a una certa soglia sono stati mantenuti per l'analisi.

Generazione di pseudo spettri

TopDIA funziona creando quelli che vengono chiamati pseudo spettri dai dati del TD-DIA-MS. Questo processo implica il filtraggio e l'ordinamento delle caratteristiche dei frammenti per abbinarle alle caratteristiche delle proteoforme. L'obiettivo è creare una rappresentazione più gestibile dei dati complessi che possa essere utilizzata per identificare le proteoforme presenti nel campione.

Confronto dei risultati

Confrontando i risultati del TD-DIA-MS con quelli del TD-DDA-MS, è emerso che, mentre il TD-DIA-MS ha segnalato più proteoforme e proteine in totale, molti singoli run con il TD-DDA-MS hanno prodotto più proteoforme. Questa discrepanza è in parte dovuta al fatto che i run di TD-DIA-MS coprono un intervallo più ampio ma potrebbero perdere identificazioni sovrapposte quando si analizzano i dati.

Sfide nell'identificazione delle proteoforme

Nonostante i vantaggi del TD-DIA-MS, ci sono ancora sfide nell'identificazione accurata delle proteoforme. Un problema principale è la frequenza con cui gli spettri possono essere acquisiti. Gli attuali spettrometri di massa spesso richiedono più tempo per catturare dati di alta qualità, il che può portare a identificazioni mancanti delle proteoforme.

Un'altra sfida deriva dalla complessità degli spettri prodotti. Quando più proteoforme generano segnali sovrapposti, diventa difficile capire quali frammenti appartengano a quale proteoforma, rendendo l'identificazione più complicata.

Direzioni future

È fondamentale migliorare la velocità di acquisizione degli spettri nella spettrometria di massa per migliorare l'identificazione e la quantificazione delle proteoforme utilizzando il TD-DIA-MS. La ricerca su metodi migliori per assegnare le caratteristiche dei frammenti alle caratteristiche dei precursori è in corso, con la speranza di migliorare l'accuratezza e l'efficienza dell'analisi delle proteoforme.

Conclusione

In sintesi, la spettrometria di massa top-down offre una visione dettagliata delle proteoforme nei campioni biologici. I recenti avanzamenti, specialmente l'introduzione di metodi come il TD-DIA-MS e lo strumento software TopDIA, hanno migliorato la nostra capacità di identificare e quantificare efficacemente queste importanti forme proteiche. Anche se rimangono delle sfide, in particolare riguardo alla complessità dei dati e alla velocità di acquisizione, la ricerca continua a promettere di rendere questo campo di studio ancora più robusto. Lo sviluppo continuo di strumenti di analisi più efficaci aprirà nuove possibilità per comprendere le funzioni delle proteine e i loro ruoli nella biologia.

Fonte originale

Titolo: TopDIA: A Software Tool for Top-Down Data-Independent Acquisition Proteomics

Estratto: Top-down mass spectrometry is widely used for proteoform identification, characterization, and quantification owing to its ability to analyze intact proteoforms. In the last decade, top-down proteomics has been dominated by top-down data-dependent acquisition mass spectrometry (TD-DDA-MS), and top-down data-independent acquisition mass spectrometry (TD-DIA-MS) has not been well studied. While TD-DIA-MS produces complex multiplexed tandem mass spectrometry (MS/MS) spectra, which are challenging to confidently identify, it selects more precursor ions for MS/MS analysis and has the potential to increase proteoform identifications compared with TD-DDA-MS. Here we present TopDIA, the first software tool for proteoform identification by TD-DIA-MS. It generates demultiplexed pseudo MS/MS spectra from TD-DIA-MS data and then searches the pseudo MS/MS spectra against a protein sequence database for proteoform identification. We compared the performance of TD-DDA-MS and TD-DIA-MS using Escherichia coli K-12 MG1655 cells and demonstrated that TD-DIA-MS with TopDIA increased proteoform and protein identifications compared with TD-DDA-MS.

Autori: Xiaowen Liu, A. R. Basharat, X. Xiong, T. Xu, Y. Zang, L. Sun

Ultimo aggiornamento: 2024-04-09 00:00:00

Lingua: English

URL di origine: https://www.biorxiv.org/content/10.1101/2024.04.05.588302

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.04.05.588302.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili