Progressi nella previsione della struttura delle proteine con AF_unmasked
AF_unmasked migliora le previsioni della struttura proteica integrando modelli e dati sperimentali.
― 7 leggere min
Indice
Dal lancio di AlphaFold nel 2020, i ricercatori nel campo della biologia hanno lavorato per migliorare questo strumento per prevedere le Strutture Proteiche. AlphaFold utilizza sistemi informatici avanzati, in particolare deep learning, per fare previsioni su come le proteine si piegano nelle loro forme tridimensionali basandosi sulle sequenze degli amminoacidi. Ora, gli scienziati stanno trovando nuovi modi per rendere AlphaFold migliore e più utile per proteine e strutture complesse che non erano state progettate per essere gestite inizialmente.
Un'area di focus importante è stata come AlphaFold interpreta e genera informazioni strutturali da diverse fonti: il paesaggio energetico delle proteine e altre strutture esistenti. Questo è necessario perché prevedere come le proteine si piegano può essere molto complicato, e a volte i risultati possono essere imprevedibili. I ricercatori sospettano che AlphaFold utilizzi un metodo di campionamento per navigare attraverso un paesaggio energetico appreso mentre cerca di trovare le migliori previsioni strutturali.
AlphaFold fa questo attraverso due passaggi principali. La prima parte identifica un punto di partenza adatto, mentre la seconda parte affina la previsione per produrre la struttura atomica finale. Recentemente, gli scienziati si sono concentrati sul migliorare questo secondo passaggio per rendere le previsioni più accurate e affidabili.
Metodi per Migliorare AlphaFold
In un recente evento focalizzato sulla valutazione dei metodi di previsione delle strutture proteiche, i ricercatori hanno esaminato come diversi team hanno migliorato le prestazioni di AlphaFold. I team più performanti hanno utilizzato due strategie principali per migliorare i loro risultati:
- Hanno aggiunto elementi casuali durante il processo di previsione per creare una maggiore varietà di Modelli.
- Hanno creato dati di input migliori affinando gli allineamenti delle sequenze che AlphaFold utilizza per prevedere le strutture.
Il primo metodo ha aiutato AlphaFold a esplorare meglio le funzioni energetiche, mentre il secondo mirava a iniziare la previsione in una regione energetica più favorevole. Entrambe le strategie sono state progettate per aiutare AlphaFold a fornire modelli di qualità superiore.
Tuttavia, anche con questi miglioramenti, i ricercatori hanno notato che ottimizzare i dati di input delle strutture proteiche esistenti non stava portando benefici significativi. Infatti, alcuni team hanno persino sperimentato di disattivare completamente questi modelli di input strutturali.
In generale, c'è un consenso nella comunità biologica che mentre AlphaFold è uno strumento potente per aiutare gli scienziati a capire le strutture proteiche, non può ancora sostituire le tecniche sperimentali tradizionali. Questo evidenzia la continua necessità di migliori strumenti che possano integrare i Dati Sperimentali insieme alle previsioni.
Integrazione con Dati Sperimentali
Per migliorare le capacità di AlphaFold, gli scienziati stanno lavorando all'integrazione con i metodi esistenti per determinare le strutture proteiche. Ad esempio, Phenix è uno strumento che combina AlphaFold con tecniche tradizionali di sostituzione molecolare. Questa integrazione consente un miglior affinamento delle strutture previste rispetto ai dati sperimentali raccolti dalla cristallografia a raggi X.
Inoltre, i ricercatori hanno dimostrato che combinare AlphaFold con dati di microscopia elettronica criogenica (cryo-EM) può portare a previsioni ancora più accurate. Regolando i modelli di AlphaFold in base ai risultati sperimentali e poi reinserendo quei modelli affinati nel processo di previsione, gli scienziati possono migliorare la qualità e l'accuratezza complessiva delle previsioni.
Nonostante questi progressi, AlphaFold è stato originariamente progettato per previsioni di singole proteine e ha limitazioni quando si tratta di prevedere come più proteine interagiscano tra loro. I ricercatori hanno cercato di creare versioni riaddestrabili di AlphaFold che potrebbero tenere conto dei dati sperimentali, ma riaddestrare sistemi così grandi richiede risorse significative e non sempre ha successo.
Introduzione di AF_unmasked
Per sfruttare le informazioni provenienti da modelli esistenti contenenti strutture multi-proteiche senza dover riaddestrare il sistema, i ricercatori hanno sviluppato una nuova versione di AlphaFold chiamata AF_unmasked. Questa versione mira a semplificare il problema della previsione e consentire tempi di previsione più rapidi, fornendo modelli più accurati, specialmente per complessi proteici grandi.
AF_unmasked modifica la Rete Neurale di AlphaFold per utilizzare i modelli in modo più informativo. Questo significa che AF_unmasked può produrre modelli di alta qualità di complessi proteici, anche senza dati evolutivi su cui AlphaFold fa solitamente affidamento. Il nuovo metodo consente ai ricercatori di fornire modelli multi-proteici durante il processo di previsione per guidare l'arrangiamento delle catene proteiche l'una rispetto all'altra.
Cambiamenti nel Processo di Previsione
AF_unmasked introduce una nuova strategia per utilizzare i modelli nel processo di previsione. Questo include fasi in cui i dati strutturali provenienti da esperimenti vengono convertiti in un formato adatto e poi allineati con le sequenze target. Questo assicura che le coordinate del modello di template possano essere applicate accuratamente agli amminoacidi target, anche se i modelli provengono da famiglie proteiche diverse.
I ricercatori possono anche scegliere di semplificare i dati di input limitando il numero di sequenze utilizzate nelle analisi. Questo ha due vantaggi: riduce il tempo e la memoria necessari per i calcoli e aumenta anche l'influenza dei modelli nei risultati della previsione.
Un'altra caratteristica importante di AF_unmasked è la sua capacità di riempire le aree mancanti delle strutture proteiche. Utilizzando informazioni sia dai dati evolutivi che dai modelli, AF_unmasked può ricostruire parti delle proteine che sono assenti o incomplete nei dati sperimentali.
Applicazioni di AF_unmasked
Per valutare quanto sia efficace AF_unmasked, i ricercatori lo hanno applicato a varie strutture proteiche, incluse quelle derivate da cryo-EM, e hanno trovato risultati promettenti. AF_unmasked si è dimostrato utile nel prevedere strutture di grandi complessi dove AlphaFold tradizionale ha faticato.
Ad esempio, Rubisco, un enzima chiave nelle piante, consiste di più subunità. AF_unmasked è stato in grado di prevedere una versione chimera di Rubisco in modo più accurato confrontandola con i dati di cryo-EM, portando a strutture previste che corrispondevano meglio alle osservazioni sperimentali rispetto a quelle generate da AlphaFold standard.
AF_unmasked ha anche mostrato la sua capacità con proteine flessibili come ClpB, che subisce cambiamenti significativi durante la sua funzione. Utilizzando modelli derivati da dati di cryo-EM, AF_unmasked è stato in grado di produrre più conformazioni, catturando così la natura dinamica della proteina in modo più efficace.
Negli studi su Neurofibromina, una proteina legata al cancro, AF_unmasked è riuscito a prevedere parti mancanti della struttura mantenendo comunque l'arrangiamento generale. Questa capacità di riempire o completare regioni mancanti è particolarmente preziosa, consentendo ai ricercatori di visualizzare forme di proteine che non erano ben definite nei dati sperimentali.
Implicazioni nel Mondo Reale
I miglioramenti portati da AF_unmasked sono significativi non solo per la ricerca di base ma anche per applicazioni pratiche come la progettazione di farmaci o la comprensione delle malattie. Poiché AF_unmasked può produrre modelli accurati di proteine grandi e complesse in un colpo solo, gli scienziati potrebbero identificare potenzialmente nuovi bersagli farmacologici in modo più efficiente o prevedere come le mutazioni potrebbero influenzare le funzioni proteiche.
Ad esempio, le mutazioni nelle proteine possono portare a malattie, e capire come queste mutazioni cambiano la forma e la funzione della proteina è fondamentale. La capacità di AF_unmasked di prevedere diverse conformazioni basate su template strutturali potrebbe aiutare i ricercatori a capire meglio l'impatto di queste mutazioni.
Inoltre, poiché AF_unmasked può gestire strutture proteiche più grandi, apre nuove possibilità per lo studio di sistemi biologici complessi, ampliando la nostra comprensione di come le proteine interagiscono e funzionano in un contesto cellulare.
Conclusione
In generale, AF_unmasked rappresenta un significativo progresso nella nostra capacità di prevedere le strutture proteiche, specialmente per le proteine complesse. Utilizzando efficacemente i modelli strutturali esistenti e riducendo la dipendenza da dati evolutivi estesi, AF_unmasked offre un approccio più snello alla determinazione delle strutture.
Mentre i ricercatori continuano a esplorare il pieno potenziale di AF_unmasked, è probabile che diventi uno strumento prezioso nel campo della biologia strutturale. Questo potrebbe portare a scoperte non solo nella comprensione delle funzioni proteiche, ma anche nell'utilizzare questa conoscenza per interventi terapeutici e progressi nella biotecnologia.
Lo sviluppo di AF_unmasked esemplifica come integrare dati sperimentali con previsioni computazionali possa migliorare la nostra capacità di modellare le complessità della vita a livello molecolare. Con ulteriori perfezionamenti e applicazioni, AF_unmasked potrebbe presto diventare una parte essenziale del toolkit per gli scienziati che studiano le fondamenta molecolari della vita.
Titolo: Unmasking AlphaFold: integration of experiments and predictions in multimeric complexes
Estratto: Since the release of AlphaFold, researchers have actively refined its predictions and attempted to integrate it into existing pipelines for determining protein structures. These efforts have introduced a number of functionalities and results at the latest Critical Assessment of protein Structure Prediction edition (CASP15), resulting in a marked improvement in the prediction of multimeric protein structures. However, AlphaFolds capability of predicting large protein complexes is still limited and integrating experimental data in the prediction pipeline is not straightforward. In this study, we introduce AF_unmasked to overcome these limitations. Our results demonstrate that AF_unmasked can integrate experimental information to build larger or hard to predict protein assemblies with high confidence. The resulting predictions can help interpret and augment experimental data. This new approach generates near-perfect structures even when little to no evolutionary information is available and imperfect experimental structures are used as a starting point. AF_unmasked fills incomplete structures by a procedure called"structural inpainting", which may provide insights into protein dynamics. In summary, AF_unmasked provides an easy-to-use method that efficiently integrates experiments to predict large protein complexes more confidently. Codegithub.com/clami66/AF_unmasked
Autori: Claudio Mirabello, B. Wallner, B. Nystedt, S. Azinas, M. Carroni
Ultimo aggiornamento: 2024-05-13 00:00:00
Lingua: English
URL di origine: https://www.biorxiv.org/content/10.1101/2023.09.20.558579
Fonte PDF: https://www.biorxiv.org/content/10.1101/2023.09.20.558579.full.pdf
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.