Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Bioquímica

Enzimas Personalizadas y el Papel de la IA en el Diseño

Los científicos crean enzimas personalizadas usando IA para impulsar la investigación en bioquímica.

― 9 minilectura


Enzimas PersonalizadasEnzimas PersonalizadasImpulsadas por IAmejorar funciones bioquímicas.La IA ayuda a crear nuevas enzimas para
Tabla de contenidos

¿Alguna vez has deseado una poción mágica que hiciera que todo funcionara a la perfección? En el mundo de la bioquímica, los científicos están tratando de crear algo similar: Enzimas hechas a la medida. Estas Proteínas diminutas son como los trabajadores en una fábrica, ayudando a acelerar las reacciones químicas en nuestros cuerpos. La meta es diseñar enzimas que puedan hacer trabajos específicos súper bien.

Gracias a programas de computadora avanzados, ahora es posible crear estas enzimas desde cero. Los investigadores están usando estas herramientas para desarrollar proteínas que encajen de la manera que quieren, como bloques de construcción. También pueden crear uniones para medicamentos que sean muy efectivas, producir proteínas que funcionen dentro de seres vivos y modificar enzimas existentes para añadir nuevas características.

Sin embargo, todavía hay desafíos al crear enzimas que puedan unirse a pequeñas moléculas o llevar a cabo reacciones complejas. Es como intentar meter una pieza cuadrada en un agujero redondo. Los científicos necesitan ser precisos al colocar los bloques de construcción de la proteína, mientras se aseguran de que la estructura general sea lo suficientemente compacta para funcionar de manera eficiente.

Recientemente, la inteligencia artificial (IA) ha entrado en juego. La IA puede predecir cómo se pliegan y encajan las proteínas, haciendo que el proceso de diseño sea más rápido y eficiente. Esta nueva tecnología es emocionante y ya ha tenido un impacto significativo en el diseño de enzimas. Usando IA, los científicos han desarrollado nuevas herramientas que les permiten generar secuencias y estructuras de proteínas únicas.

Pero no se trata solo de diseñar la estructura física de las proteínas; también es importante entender el ‘lenguaje’ de las proteínas. Los científicos están investigando cómo pueden aplicar herramientas de procesamiento de lenguaje natural (NLP) para crear proteínas directamente a partir de sus secuencias. Este enfoque ha abierto puertas a nuevas posibilidades, permitiendo a los investigadores explorar el vasto mundo de las secuencias de proteínas.

Al aprovechar grandes modelos de lenguaje (LLMs), los científicos pueden analizar, anotar e incluso crear nuevas secuencias de proteínas. Un modelo, ProtGPT2, ha demostrado la capacidad de generar secuencias de proteínas únicas con diferentes estructuras y tamaños. Otros modelos han sido ajustados para enfocarse en familias específicas de proteínas.

En este trabajo, los científicos están interesados en crear enzimas funcionales que puedan catalizar una reacción específica llamada la reacción de isomerasa de triosafosfato (TIM). Esta enzima juega un papel vital en varias vías metabólicas, ayudando a las células a mantener su equilibrio energético. Al generar proteínas novedosas que son diferentes de las enzimas naturales, los investigadores esperan evaluar cuán bien pueden desempeñarse estas nuevas secuencias.

Creando una Enzima Como TIM

La enzima TIM es bastante impresionante. Ayuda a convertir una molécula en otra en nuestros cuerpos. Este proceso es esencial para mantener nuestras células energizadas. Puedes pensar en TIM como un trabajador experto que necesita encajar perfectamente en un rol específico. Tiene una estructura única que le permite realizar sus tareas de manera eficiente.

Cuando los investigadores se propusieron crear nuevas enzimas TIM, necesitaban considerar qué es lo que hace que la enzima natural sea tan efectiva. Su objetivo era diseñar proteínas que imitaran su forma y función, mientras fueran lo suficientemente distintas como para destacar. Ya estaba todo listo para un poco de magia científica.

Se emplearon dos enfoques diferentes impulsados por IA para generar estas nuevas secuencias TIM. El primer método involucró a ZymCTRL, un modelo condicional que genera resultados en función de etiquetas específicas. El segundo enfoque utilizó ProtGPT2, que genera secuencias sin condicionamiento. Esto significa que se basa en una base de datos más amplia de proteínas.

En última instancia, el objetivo era producir proteínas que pudieran catalizar la reacción TIM de manera eficiente. Para lograrlo, los investigadores utilizaron filtros para seleccionar solo los candidatos más prometedores. Miraron cosas como la longitud y la identidad para asegurarse de que las nuevas secuencias fueran diferentes de las enzimas existentes.

Una Cosecha de Secuencias

Usando ZymCTRL, los investigadores generaron asombrosas 90,000 posibles secuencias de enzimas basadas en la entrada de TIM. Aunque suena impresionante, era esencial revisar cuidadosamente estas secuencias. Necesitaban enfocarse en aquellas que se parecieran a las TIM naturales sin ser demasiado similares.

Filtrar fue clave. Por ejemplo, desecharon cualquier secuencia que compartiera más del 35% de identidad con proteínas existentes. Esto ayudó a garantizar que las nuevas secuencias fueran suficientemente únicas. No está nada mal para un día de trabajo, ¿verdad?

Después de filtrar, terminaron con un grupo diverso de secuencias, muchas de las cuales imitaban la longitud típica encontrada en enzimas TIM naturales. Estas secuencias se evaluaron más para verificar si mantenían las características esenciales necesarias para que la enzima funcionara de manera efectiva.

Entre las selecciones finales, surgieron doce nuevas secuencias prometedoras. Los investigadores estaban emocionados de poner a prueba a estos candidatos para ver si realmente podían hacer el trabajo.

Poniendo a Prueba las Proteínas

Una vez que se eligieron las nuevas secuencias TIM, era hora de ver si podían funcionar en la práctica. Para ello, los investigadores tomaron los candidatos más prometedores y los sometieron a rigurosas pruebas en E. coli, una bacteria comúnmente usada en estudios científicos.

El objetivo era ver si estas nuevas proteínas podían ayudar a las bacterias a crecer sin su enzima TIM natural. Básicamente, si las nuevas proteínas eran efectivas, las bacterias prosperarían. Si no, pues tendrían problemas para crecer.

Llegaron los resultados, y de las doce secuencias seleccionadas, tres mostraron un verdadero potencial y ayudaron a las bacterias a crecer de manera efectiva. Entre ellas, SpokenTIM9 destacó como el candidato de mejor rendimiento. Esta pequeña proteína era como la estrella de un equipo deportivo, demostrando un fuerte potencial de crecimiento.

Aunque SpokenTIM9 no era tan eficiente como las TIM naturales, su rendimiento fue impresionante dada su diseño único. Esto mostró que de hecho era posible crear enzimas efectivas desde cero usando enfoques impulsados por IA.

El Arte de Filtrar y Refinar

A medida que los investigadores continuaron su trabajo, se dieron cuenta de que su proceso de filtrado aún podía mejorar. Después de todo, cada gran equipo necesita refinar sus estrategias. Al reevaluar los criterios que usaron para seleccionar sus secuencias, buscaban aumentar las posibilidades de éxito.

Por ejemplo, prestaron más atención a la carga neta de las secuencias de proteínas. Mantener las proteínas solubles es crucial para que puedan hacer su trabajo sin volverse pegajosas o grumosas. Los investigadores también analizaron las propiedades hidrofóbicas de las proteínas generadas para evitar interacciones no deseadas.

El ajuste fino del modelo ProtGPT2 también entró en juego. Al condicionarlo a partir de las secuencias TIM naturales, los investigadores podían generar incluso mejores candidatos. Después de aplicar los nuevos métodos de filtrado, terminaron con secuencias que tenían propiedades deseables.

Una Nueva Generación de Enzimas

Armados con sus estrategias refinadas, los investigadores continuaron su búsqueda de TIMS funcionales. Seleccionaron doce nuevos candidatos, a los que llamaron gptTIMs. Cuando se probaron, dos de estas nuevas proteínas pudieron ayudar a las bacterias a crecer, demostrando que el proceso de ajuste fue efectivo.

A través de la combinación de los procesos ZymCTRL y ProtGPT2, los investigadores pudieron crear un nuevo lote de enzimas funcionales. Este fue un momento emocionante, demostrando el potencial de la IA en el campo del diseño de enzimas.

Dando Vida a SpokenTIM9

Con SpokenTIM9 reconocido como el mejor candidato, los científicos se enfocaron en estudiar sus propiedades en más profundidad. Purificaron la proteína de las bacterias para asegurarse de que tenían una muestra limpia para probar.

Lo que encontraron fue alentador. La estructura de SpokenTIM9 se asemejaba a la de las enzimas TIM naturales, lo cual era un signo vital de que podría funcionar efectivamente. Confirmaron su naturaleza bien plegada a través de varias mediciones biofísicas, que son como poner un nuevo auto deportivo bajo el capó para inspeccionar su motor.

También estudiaron su actividad y realizaron algunas pruebas para determinar cuán eficientemente podría catalizar la reacción TIM en el laboratorio. Aunque SpokenTIM9 mostró cierta promesa, era aproximadamente 30 veces menos eficiente que las TIM naturales. Sin embargo, para una enzima creada desde cero, fue un logro notable.

Conclusiones y Direcciones Futuras

El viaje hacia la creación de enzimas personalizadas usando inteligencia artificial ha sido simplemente emocionante. Los investigadores han hecho avances significativos en entender el lenguaje de las proteínas y cómo diseñar nuevas secuencias que pueden realizar tareas complejas.

La generación exitosa de enzimas funcionales destaca una nueva era en el diseño de proteínas. Aunque aún hay desafíos que superar, el potencial de crear enzimas hechas a medida abre posibilidades emocionantes para avances en medicina, industria y mucho más.

Con la continua exploración y refinamiento, no hay forma de saber qué innovaciones vendrán a continuación. El futuro del diseño de enzimas es brillante, y seguramente estará lleno de descubrimientos que podrían beneficiarnos a todos. Después de todo, ¿quién no querría un poco de magia extra en sus vidas?

Fuente original

Título: De novo design of triosephosphate isomerases using generative language models

Resumen: The design of proteins with tailored functions is of immense interest to biotechnology, medicine, and the chemical industry. While protein design is rapidly evolving with the use of AI techniques, the design of complex enzymes remains a challenge. Here, we present the use of two large language models (LLMs), ZymCTRL and ProtGPT2, for the generation of de novo enzymes that catalyze the triosephosphate isomerase (TIM) reaction. Natural TIM enzymes are obligatory oligomers that catalyze a multi-step isomerization reaction near the diffusion limit. This makes TIM an ideal target to assess the generative ability of protein language models. Newly generated sequences were filtered to obtain a set of twelve candidates from each approach for experimental validation. Multiple constructs from both language models exhibit the intended function in vivo through their ability to complement a TIM-deficient E. coli strain. In-depth characterization of the best-behaving artificial enzyme reveals behavior and catalytic efficiency close to its natural counterparts. These findings support the use of conditional and fine-tuned unconditional LLMs for the generation of complex enzymes.

Autores: Sergio Romero-Romero, Alexander E. Braun, Timo Kossendey, Noelia Ferruz, Steffen Schmidt, Birte Höcker

Última actualización: 2024-11-10 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.11.10.622869

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.11.10.622869.full.pdf

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares