Simple Science

Scienza all'avanguardia spiegata semplicemente

# La biologia# Biochimica

Enzimi personalizzati e il ruolo dell'IA nel design

Gli scienziati creano enzimi su misura usando l'IA per potenziare la ricerca in biochimica.

― 8 leggere min


Enzimi personalizzatiEnzimi personalizzatiguidati dall'IAfunzioni biochimiche migliorate.L'IA aiuta a creare nuovi enzimi per
Indice

Hai mai desiderato una pozione magica che possa far funzionare tutto alla perfezione? Nel mondo della biochimica, gli scienziati stanno cercando di creare qualcosa di simile: Enzimi su misura. Queste Proteine piccolissime sono come i lavoratori in una fabbrica, aiutando ad accelerare le reazioni chimiche nel nostro corpo. L'obiettivo è progettare enzimi che possano svolgere compiti specifici davvero bene.

Grazie a programmi informatici avanzati, ora è possibile creare questi enzimi da zero. I ricercatori stanno usando questi strumenti per sviluppare proteine che combaciano come vogliono, proprio come i mattoncini. Possono anche creare leganti per farmaci che sono super efficaci, produrre proteine che funzionano dentro gli organismi viventi e modificare enzimi esistenti per aggiungere nuove caratteristiche.

Tuttavia, ci sono ancora sfide quando si tratta di creare enzimi che possano legarsi a piccole molecole o eseguire reazioni complesse. È come cercare di far stare un chiodo quadrato in un buco rotondo. Gli scienziati devono essere precisi nel posizionare i mattoncini della proteina, assicurandosi anche che la struttura complessiva sia abbastanza compatta per funzionare in modo efficiente.

Recentemente, l'intelligenza artificiale (IA) è entrata in gioco. L'IA può prevedere come si piegheranno e si incastreranno le proteine, rendendo il processo di design più veloce ed efficiente. Questa nuova tecnologia è entusiasmante e ha già avuto un impatto significativo sul design degli enzimi. Usando l'IA, gli scienziati hanno sviluppato nuovi strumenti che consentono di generare sequenze e strutture proteiche uniche.

Ma non si tratta solo di progettare la struttura fisica delle proteine; è anche importante capire il "linguaggio" delle proteine. Gli scienziati stanno esaminando come applicare strumenti di elaborazione del linguaggio naturale (NLP) per creare proteine direttamente dalle loro sequenze. Questo approccio ha aperto nuove possibilità, permettendo ai ricercatori di esplorare il vasto mondo delle sequenze proteiche.

Sfruttando grandi modelli linguistici (LLM), gli scienziati possono analizzare, annotare e persino creare nuove sequenze proteiche. Un modello, ProtGPT2, ha dimostrato la capacità di generare sequenze proteiche uniche con diverse strutture e dimensioni. Altri modelli sono stati affilati per concentrarsi su famiglie specifiche di proteine.

In questo lavoro, gli scienziati sono interessati a creare enzimi funzionali che possono catalizzare una reazione specifica chiamata reazione della triose fosfato isomerasi (TIM). Questo enzima gioca un ruolo vitale in diversi percorsi metabolici, aiutando le cellule a mantenere il loro equilibrio energetico. Generando proteine nuove che sono diverse dagli enzimi naturali, i ricercatori sperano di valutare quanto bene possono funzionare queste nuove sequenze.

Creare un enzima come TIM

L'enzima TIM è piuttosto impressionante. Aiuta a convertire una molecola in un'altra nel nostro corpo. Questo processo è essenziale per mantenere le nostre cellule energiche. Puoi pensare a TIM come a un lavoratore esperto che deve adattarsi perfettamente a un ruolo specifico. Ha una struttura unica che gli consente di svolgere i suoi compiti in modo efficiente.

Quando i ricercatori hanno iniziato a creare nuovi enzimi TIM, dovevano considerare cosa rendesse l'enzima naturale così efficace. Volevano progettare proteine che imitassero la sua forma e funzione, pur essendo abbastanza distinte per distinguersi. Già, il palcoscenico era pronto per un po' di magia scientifica.

Sono stati impiegati due diversi approcci guidati dall'IA per generare queste nuove sequenze TIM. Il primo metodo ha coinvolto ZymCTRL, un modello condizionale che genera risultati basati su tag specifici. Il secondo approccio ha utilizzato ProtGPT2, che genera sequenze senza condizionamento. Questo significa che si basa su un database più ampio di proteine.

Alla fine, l'obiettivo era produrre proteine che potessero catalizzare la reazione TIM in modo efficiente. Per fare ciò, i ricercatori hanno utilizzato filtri per selezionare solo i candidati più promettenti. Hanno considerato cose come la lunghezza e l'identità per assicurarsi che le nuove sequenze fossero diverse dagli enzimi esistenti.

Una pioggia di sequenze

Usando ZymCTRL, i ricercatori hanno prodotto un incredibile numero di 90.000 potenziali sequenze di enzimi basate sull'input TIM. Anche se sembra impressionante, era essenziale esaminare attentamente queste sequenze. Dovevano concentrarsi su quelle che somigliavano agli TIM naturali senza essere troppo simili.

Il filtraggio è stato fondamentale. Ad esempio, hanno scartato tutte le sequenze che condividevano più del 35% di identità con le proteine esistenti. Questo ha aiutato a garantire che le nuove sequenze fossero sufficientemente uniche. Non male per un lavoro di un giorno, giusto?

Dopo il filtraggio, hanno ottenuto un pool diversificato di sequenze, molte delle quali imitavano la lunghezza tipica trovata negli enzimi TIM naturali. Queste sequenze sono state poi ulteriormente valutate per controllare se mantenevano le caratteristiche essenziali necessarie affinché l'enzima funzionasse in modo efficace.

Tra le selezioni finali, sono emerse dodici nuove sequenze promettenti. I ricercatori erano entusiasti di mettere alla prova questi candidati per vedere se potessero effettivamente fare il lavoro.

Mettere alla prova le proteine

Una volta scelte le nuove sequenze TIM, era il momento di vedere se potessero funzionare davvero nella pratica. Per farlo, i ricercatori hanno preso i candidati più promettenti e li hanno sottoposti a test rigorosi in E. coli, un comune batterio usato negli studi scientifici.

L'obiettivo era vedere se queste nuove proteine potessero aiutare i batteri a crescere senza il loro enzima TIM naturale. Fondamentalmente, se le nuove proteine erano efficaci, i batteri avrebbero prosperato. In caso contrario, avrebbero avuto difficoltà a crescere.

I risultati sono arrivati e, tra le dodici sequenze selezionate, tre hanno mostrato un reale potenziale e hanno aiutato i batteri a crescere in modo efficace. Tra queste, SpokenTIM9 si è distinta come il candidato con le migliori prestazioni. Questa piccola proteina era come il giocatore di punta di una squadra sportiva, dimostrando un forte potenziale di crescita.

Anche se SpokenTIM9 non era proprio efficiente quanto i TIM naturali, le sue prestazioni erano impressionanti considerando il suo design unico. Questo ha dimostrato che era davvero possibile creare enzimi efficaci da zero usando approcci guidati dall'IA.

L'arte del filtraggio e della raffinazione

Mentre i ricercatori continuavano il loro lavoro, si sono resi conto che il loro processo di filtraggio poteva ancora migliorare. Dopotutto, ogni grande squadra ha bisogno di affinare le proprie strategie. Rivalutando i criteri usati per selezionare le loro sequenze, volevano aumentare le possibilità di successo.

Ad esempio, hanno prestato maggiore attenzione alla carica netta delle sequenze proteiche. Mantenere le proteine solubili è fondamentale affinché possano svolgere il loro lavoro senza diventare appiccicose o grumose. I ricercatori hanno anche analizzato le proprietà idrofobiche delle proteine generate per evitare interazioni indesiderate.

Il perfezionamento del modello ProtGPT2 è entrato in gioco. Condizionandolo su sequenze TIM naturali, i ricercatori potevano generare candidati ancora migliori. Dopo aver applicato i nuovi metodi di filtraggio, hanno ottenuto sequenze con proprietà desiderabili.

Una nuova generazione di enzimi

Armati delle loro strategie affinate, i ricercatori hanno continuato la loro ricerca di TIM funzionali. Hanno selezionato dodici nuovi candidati, che hanno chiamato gptTIMs. Quando testati, due di queste nuove proteine sono state in grado di aiutare i batteri a crescere, dimostrando che il processo di affinamento era stato efficace.

Grazie alla combinazione dei processi ZymCTRL e ProtGPT2, i ricercatori sono stati in grado di creare un nuovo lotto di enzimi funzionali. Questo è stato un momento emozionante, che ha mostrato il potenziale dell'IA nel campo del design degli enzimi.

Dare vita a SpokenTIM9

Con SpokenTIM9 riconosciuto come il miglior candidato, gli scienziati si sono concentrati sull'analisi delle sue proprietà in modo più approfondito. Hanno purificato la proteina dai batteri per assicurarsi di avere un campione pulito per i test.

Ciò che hanno trovato è stato incoraggiante. La struttura di SpokenTIM9 assomigliava a quella degli enzimi TIM naturali, il che era un segnale vitale che potesse funzionare in modo efficace. Hanno confermato la sua naturale piegatura attraverso varie misurazioni biofisi che sono simili a mettere una nuova auto sportiva sotto il cofano per ispezionare il motore.

Hanno anche studiato la sua attività e fatto alcuni test per determinare quanto efficientemente potesse catalizzare la reazione TIM in laboratorio. Anche se SpokenTIM9 mostrava qualche promessa, era circa 30 volte meno efficiente degli TIM naturali. Tuttavia, per un enzima creato da zero, era un risultato notevole.

Conclusioni e Direzioni Future

Il viaggio nella creazione di enzimi su misura usando l'intelligenza artificiale è stato niente meno che emozionante. I ricercatori hanno fatto notevoli progressi nella comprensione del linguaggio delle proteine e su come progettare nuove sequenze che possano svolgere compiti complessi.

La generazione riuscita di enzimi funzionali segna una nuova era nel design delle proteine. Anche se ci sono ancora sfide da affrontare, il potenziale per creare enzimi su misura apre a possibilità entusiasmanti per progressi in medicina, industria e molto altro.

Con un'esplorazione e affinamento continui, non si sa quali innovazioni arriveranno dopo. Il futuro del design degli enzimi è luminoso e sicuramente sarà ricco di scoperte che potrebbero giovare a tutti noi. Dopotutto, chi non vorrebbe un po’ di magia in più nella propria vita?

Fonte originale

Titolo: De novo design of triosephosphate isomerases using generative language models

Estratto: The design of proteins with tailored functions is of immense interest to biotechnology, medicine, and the chemical industry. While protein design is rapidly evolving with the use of AI techniques, the design of complex enzymes remains a challenge. Here, we present the use of two large language models (LLMs), ZymCTRL and ProtGPT2, for the generation of de novo enzymes that catalyze the triosephosphate isomerase (TIM) reaction. Natural TIM enzymes are obligatory oligomers that catalyze a multi-step isomerization reaction near the diffusion limit. This makes TIM an ideal target to assess the generative ability of protein language models. Newly generated sequences were filtered to obtain a set of twelve candidates from each approach for experimental validation. Multiple constructs from both language models exhibit the intended function in vivo through their ability to complement a TIM-deficient E. coli strain. In-depth characterization of the best-behaving artificial enzyme reveals behavior and catalytic efficiency close to its natural counterparts. These findings support the use of conditional and fine-tuned unconditional LLMs for the generation of complex enzymes.

Autori: Sergio Romero-Romero, Alexander E. Braun, Timo Kossendey, Noelia Ferruz, Steffen Schmidt, Birte Höcker

Ultimo aggiornamento: 2024-11-10 00:00:00

Lingua: English

URL di origine: https://www.biorxiv.org/content/10.1101/2024.11.10.622869

Fonte PDF: https://www.biorxiv.org/content/10.1101/2024.11.10.622869.full.pdf

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia biorxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili