Avanzamenti nella previsione dei complessi proteici con AlphaLink
AlphaLink migliora le previsioni dei complessi proteici usando dati di spettrometria di massa con incrociamento.
― 5 leggere min
Indice
- La Sfida di Prevedere le Strutture Proteiche
- Migliorare il Modello dei Complessi Proteici
- Usare i Crosslink per Aiutare le Previsioni
- Valutazione delle Prestazioni di AlphaLink
- Crosslinking per Interazioni anticorpo-antigene
- Dati Reali dai Batteri
- L'Importanza del Crosslinking
- Rivelare Interazioni Proteiche Nascoste
- Modellazione di Grandi Complessi Proteici
- Conclusione
- Fonte originale
- Link di riferimento
I Complessi proteici sono gruppi di proteine che lavorano insieme per svolgere funzioni specifiche negli organismi viventi. Capire come sono strutturati questi complessi è fondamentale per afferrare come funziona la vita a livello molecolare.
La Sfida di Prevedere le Strutture Proteiche
Prevedere la struttura di singole proteine è diventato più facile grazie ai progressi nei metodi di deep learning. Tuttavia, capire come sono disposti i complessi proteici rimane un compito difficile. Questa difficoltà deriva dal fatto che ci sono spesso meno strutture risolte disponibili per il confronto e meno informazioni su come le proteine nei complessi evolvono insieme nel tempo.
Tecniche sperimentali, come la spettrometria di massa per cross-linking (MS), forniscono dati preziosi. Questi metodi possono mettere in evidenza quali proteine interagiscono tra loro e come si uniscono. Aggiungendo questi dati sperimentali alle previsioni basate su informazioni evolutive, i ricercatori possono migliorare le loro previsioni.
Migliorare il Modello dei Complessi Proteici
Negli sforzi precedenti, i ricercatori hanno migliorato il modo in cui modellavano singole proteine usando restrizioni di distanza dai dati di cross-linking MS. Il metodo, chiamato AlphaLink, migliora le previsioni delle strutture proteiche. Ha mostrato successo quando applicato a proteine singole, e ora l'attenzione si concentra sull'estendere questo metodo ai complessi proteici.
I complessi proteici presentano una sfida ancora più grande. Non solo deve essere prevista la disposizione di ogni singola proteina, ma devono anche essere mappate le interazioni tra di esse. Il compito diventa più complesso man mano che aumenta la dimensione del complesso proteico.
Usare i Crosslink per Aiutare le Previsioni
I dati di cross-linking MS possono aiutare a restringere le strutture potenziali che i ricercatori devono considerare concentrandosi su aree importanti e sulle interazioni tra le proteine. In questo studio, i ricercatori hanno addestrato il loro modello usando un agente di cross-linking specifico chiamato SDA. Questo agente aiuta a creare legami tra specifici aminoacidi nelle proteine.
Anche se questi crosslink SDA hanno una risoluzione inferiore rispetto ad altri metodi, forniscono comunque informazioni utili. Il metodo AlphaLink può fare più affidamento sui dati di crosslink piuttosto che su quelli evolutivi quando fa previsioni sui complessi proteici.
Valutazione delle Prestazioni di AlphaLink
Il team ha valutato AlphaLink su diversi obiettivi proteici difficili dalla competizione CASP15, che è un campo di prova per i metodi di previsione della struttura. AlphaLink ha superato altri metodi, mostrando un miglioramento sostanziale nella qualità delle previsioni, specialmente per gli assemblaggi complessi. Le previsioni fatte con AlphaLink hanno ottenuto punteggi significativamente migliori in media rispetto a quelle usando solo AlphaFold-Multimer.
Utilizzando crosslink simulati nella modellazione, i ricercatori hanno scoperto che AlphaLink poteva migliorare i punteggi di otto obiettivi difficili. In diversi casi, le previsioni di AlphaLink hanno raggiunto o superato i migliori risultati in CASP15.
Interazioni anticorpo-antigene
Crosslinking perOltre agli obiettivi CASP15, i ricercatori hanno anche testato AlphaLink sulle interazioni anticorpo-antigene. Queste interazioni tendono ad essere complicate perché hanno meno dati disponibili su come evolvono insieme. Ancora una volta, AlphaLink ha mostrato miglioramenti significativi rispetto ai metodi precedenti. I risultati hanno evidenziato quanto siano utili i dati di crosslink, dato che AlphaLink ha costantemente fornito punteggi migliori rispetto ad AlphaFold-Multimer.
Dati Reali dai Batteri
Il team ha anche esplorato dati reali indagando le interazioni delle cellule di Bacillus Subtilis. Hanno scoperto che anche un solo crosslink poteva migliorare notevolmente le previsioni delle interazioni proteiche. Questo suggerisce che i dati reali possono fornire miglioramenti anche quando sono scarsi e poco definiti.
Ad esempio, un modello dell'interazione tra due proteine, CodY e YppF, ha mostrato un notevole aumento della fiducia grazie a un singolo crosslink, migliorando significativamente le previsioni. Allo stesso modo, un'altra interazione, RpoA-RpoC, ha visto il suo punteggio di previsione migliorare con l'aiuto di crosslink reali in-cell.
L'Importanza del Crosslinking
Il crosslinking aiuta i ricercatori a focalizzare le loro previsioni su aree significative nelle strutture proteiche. Questo focus porta a un minor numero di campioni necessari per ottenere previsioni affidabili. Gli approfondimenti ottenuti dal test di AlphaLink hanno dimostrato che integrare i dati di crosslink ha portato a risultati migliori nel complesso.
Rivelare Interazioni Proteiche Nascoste
Attraverso il loro lavoro, i ricercatori hanno scoperto interazioni precedentemente sconosciute tra proteine in Bacillus subtilis. Hanno trovato che una proteina chiave, Fur, interagisce con un'altra proteina, YlaN, che aveva un ruolo essenziale ma non era ben compresa prima. Questa interazione gioca un ruolo nel modo in cui le cellule batteriche controllano i livelli di ferro.
Utilizzando AlphaLink, i ricercatori sono stati in grado di scoprire una base strutturale di come Fpa (il rinominato YlaN) inibisce la funzione di Fur, influenzando la risposta al ferro in queste cellule batteriche. Le previsioni di AlphaLink hanno fornito importanti approfondimenti sui meccanismi molecolari che governano questo controllo.
Modellazione di Grandi Complessi Proteici
AlphaLink è stato applicato anche a un grande complesso multi-proteico, il complesso CRL4DCAF1. Questo assemblaggio è importante per studiare come le proteine interagiscono all'interno di un sistema più grande. Le previsioni del modello utilizzando AlphaLink con dati di crosslink reali hanno mostrato una maggiore fiducia rispetto ai tentativi precedenti con AlphaFold-Multimer.
I ricercatori hanno notato che le previsioni di AlphaLink si allineavano meglio con le osservazioni sperimentali, dimostrando il suo potenziale per modellare accuratamente grandi complessi. Questa accuratezza illustra come il crosslinking possa migliorare le previsioni, portando a una comprensione più profonda delle interazioni proteiche.
Conclusione
AlphaLink rappresenta un passo significativo avanti nel campo della previsione della struttura proteica. Integrando i dati della spettrometria di massa per cross-linking, i ricercatori possono migliorare la loro comprensione non solo delle proteine singole, ma anche di come più proteine lavorano insieme in strutture complesse.
Questa capacità di prevedere le interazioni proteiche in un contesto cellulare consente agli scienziati di scoprire approfondimenti vitali nei processi biologici. Man mano che i metodi continuano a progredire, il potenziale per scoprire nuovi aspetti della vita a livello molecolare si sta ampliando. L'integrazione di dati sperimentali reali porterà a scoperte nella comprensione delle funzioni proteiche e potrebbe presentare nuove possibilità per approcci terapeutici in diverse malattie.
Titolo: Modelling protein complexes with crosslinking mass spectrometry and deep learning
Estratto: Scarcity of structural and evolutionary information on protein complexes poses a challenge to deep learning-based structure modelling. We integrated experimental distance restraints obtained by crosslinking mass spectrometry (MS) into AlphaFold-Multimer, by extending AlphaLink to protein complexes. Integrating crosslinking MS data substantially improves modelling performance on challenging targets, by helping to identify interfaces, focusing sampling, and improving model selection. This extends to single crosslinks from whole-cell crosslinking MS, opening the possibility of whole-cell structural investigations driven by experimental data. We demonstrate this by revealing the molecular basis of iron homeostasis in Bacillus subtilis.
Autori: Juri Rappsilber, K. Stahl, L. Demann, R. Bremenkamp, R. Warneke, B. Hormes, J. Stülke, O. Brock
Ultimo aggiornamento: 2024-04-30 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2023.06.07.544059
Fonte PDF: https://www.biorxiv.org/content/10.1101/2023.06.07.544059.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.