Torneo de Ingeniería de Proteínas: Una Nueva Frontera
Los científicos compiten para diseñar y probar proteínas innovadoras a través de la colaboración.
Chase Armer, Hassan Kane, Dana L. Cortade, Henning Redestig, David A. Estell, Adil Yusuf, Nathan Rollins, Hansen Spinner, Debora Marks, TJ Brunette, Peter J. Kelly, Erika DeBenedictis
― 8 minilectura
Tabla de contenidos
- El Desafío de Predecir el Comportamiento de las Proteínas
- Modelado Generativo: Creando Nuevas Proteínas
- Una Nueva Competencia: El Torneo de Ingeniería de Proteínas
- Estructura del Torneo: Cómo Funciona
- La Ronda In Silico
- La Ronda In Vitro
- Los Equipos Participan
- Conjuntos de Datos y Eventos: Los Ingredientes
- Resultados del Torneo: Los Resultados del Concurso
- Resultados de la Ronda In Vitro
- Aprendiendo y Adaptándose: Qué Viene Después
- Conclusión: El Futuro de la Ingeniería de Proteínas
- Fuente original
- Enlaces de referencia
El mundo de las proteínas puede ser bastante complejo, pero los científicos están tratando de darle sentido a todo esto. Están trabajando duro para entender cómo funcionan las proteínas y cómo diseñar nuevas. Piensa en las proteínas como máquinas pequeñitas en nuestro cuerpo que ayudan a que las cosas pasen, como digerir la comida o combatir gérmenes. Sin embargo, descubrir cómo hacer que estas máquinas funcionen mejor es un poco como intentar hornear un pastel sin una receta.
El Desafío de Predecir el Comportamiento de las Proteínas
Los científicos utilizan algo llamado modelado para predecir cómo se comportarán las proteínas basándose en su código genético. Es un poco como adivinar qué tipo de pastel obtendrás según los ingredientes que metas en un bol. Desafortunadamente, para muchas proteínas, los datos necesarios para hacer estas predicciones son escasos. Los Conjuntos de datos disponibles, como los que están en ProtaBank, suelen ser demasiado simples. Solo analizan cambios básicos en las proteínas, lo que dificulta que los científicos adivinen con precisión cómo funcionarán estas proteínas en la vida real.
Imagina intentar adivinar cómo sabrá un pastel si todo lo que sabes es que tiene harina y azúcar, pero no tienes idea de los huevos o el tiempo de horneado. Esa es la situación actual con los conjuntos de datos de proteínas. Sin datos diversos y complicados, entender las proteínas se convierte en un trabajo complicado.
Modelado Generativo: Creando Nuevas Proteínas
Por otro lado, hay otro enfoque llamado modelado generativo. Aquí es donde los científicos buscan diseñar nuevas proteínas con características específicas. Quieren crear proteínas que podrían funcionar mejor que las que tenemos actualmente, como proponer una nueva receta de pastel que podría saber aún mejor.
Sin embargo, hay un inconveniente. A menudo, a los científicos les cuesta poner a prueba sus ideas en la vida real. No tienen los medios para verificar si los nuevos diseños de proteínas realmente funcionan como se planeó. Piensa en ello como hacer una receta de pastel pero sin horno para hornearlo. Sin pruebas adecuadas, es difícil saber qué recetas (o diseños de proteínas) vale la pena seguir.
Una Nueva Competencia: El Torneo de Ingeniería de Proteínas
Para abordar estos problemas, nació una divertida competencia llamada Torneo de Ingeniería de Proteínas. El plan es simple: reunir a los científicos para predecir y crear proteínas increíbles. Al ofrecer nuevos conjuntos de datos y oportunidades para experimentar, el torneo espera cerrar la brecha entre la teoría y la práctica.
Piensa en este torneo como un concurso de repostería para científicos donde pueden mostrar sus mejores recetas de proteínas mientras compiten con sus colegas. Hablamos de una competencia amistosa donde los investigadores pueden poner a prueba sus habilidades y compartir conocimientos. ¿Qué no se puede amar?
Estructura del Torneo: Cómo Funciona
El torneo consiste en dos rondas principales: una ronda in silico y una ronda in vitro.
La Ronda In Silico
En la primera ronda, los equipos pueden usar modelos computacionales para predecir cómo se comportarán varias secuencias de proteínas. Se les da un conjunto de secuencias de proteínas y se les pide que adivinen características como la estabilidad y la actividad. Es similar a adivinar cómo resultará un pastel basado solo en los ingredientes.
Para esta ronda, hay dos caminos: cero-shot y supervisado. En la pista cero-shot, los participantes tienen que hacer predicciones sin ningún dato previo. Es un poco como intentar hornear un pastel por primera vez sin ninguna instrucción. Los equipos en esta pista tuvieron solo unas pocas semanas para presentar sus mejores conjeturas.
La pista supervisada da a los equipos algunos datos de entrenamiento para trabajar, que es un poco como darles una receta básica a seguir. Luego pueden entrenar sus modelos y ver qué tan bien se mantienen sus predicciones frente a datos desconocidos.
La Ronda In Vitro
La segunda ronda es donde la diversión realmente comienza. Aquí, los participantes utilizan sus modelos computacionales para crear nuevas proteínas que exhiban características deseables. Aquí es donde ocurre la acción: los equipos proponen emocionantes nuevos diseños de proteínas basados en sus predicciones y los prueban en laboratorios.
El objetivo es crear proteínas con mejor actividad mientras se mantiene la estabilidad bajo control. No se trata solo de hacer el pastel más elegante; se trata de asegurar que siga siendo delicioso una vez que salga del horno.
Los Equipos Participan
Cuando comenzó el torneo, más de 90 participantes formaron 28 equipos, incluyendo personas de universidades, empresas e investigadores independientes. Todos estaban emocionados de ver qué enfoque llevaría a las proteínas más sabrosas, eh, quise decir, a los modelos de proteínas mejor rendimiento.
En la ronda in silico, los equipos presentaron sus predicciones, y aquellos que lo hicieron bien fueron invitados a pasar a la ronda in vitro. Esos equipos pudieron jugar con lo real: dar vida a sus diseños y ver si funcionaban tan bien como esperaban.
Conjuntos de Datos y Eventos: Los Ingredientes
El torneo fue posible gracias a la generosidad de socios académicos e industriales, que proporcionaron varios conjuntos de datos para que los equipos trabajaran. En total, hubo seis conjuntos de datos únicos, incluyendo uno que se utilizó múltiples veces.
Estos conjuntos de datos fueron como los ingredientes secretos en una receta de pastel, ofreciendo a los equipos la oportunidad de probar diferentes enfoques. Con estos recursos, los participantes pudieron experimentar y encontrar las mejores soluciones a los desafíos planteados durante la competencia.
Resultados del Torneo: Los Resultados del Concurso
Después de mucha expectativa, llegaron los resultados de la ronda in silico. Los equipos fueron clasificados según qué tan precisamente predijeron las propiedades de las proteínas. El Marks Lab se llevó el primer lugar en la pista cero-shot, mientras que Exazyme y Nimbus compartieron la gloria en la pista supervisada. El campeón general de esta ronda fue Nimbus, quien demostró sus habilidades de modelado.
Resultados de la Ronda In Vitro
La ronda in vitro fue donde las cosas se pusieron realmente emocionantes. Los equipos tuvieron que presentar sus nuevos diseños de proteínas, y luego esos diseños fueron probados en el laboratorio. Imagina la tensión: viendo cómo tu pastel se metía en el horno, esperando ver cómo subía.
Durante esta ronda, el TUM Rostlab robó el show con su variante enzimática de puntuación más alta, mientras que MediumBio y Marks Lab también mostraron diseños impresionantes. La mayoría de los equipos logró crear proteínas que funcionaban mejor que las originales, con algunos incluso superando las expectativas.
Aprendiendo y Adaptándose: Qué Viene Después
El torneo fue un gran éxito, demostrando que la colaboración y la competencia pueden llevar a avances significativos en la ingeniería de proteínas. Subrayó la importancia de compartir conocimiento, juntar recursos y fomentar la creatividad.
Mirando hacia adelante, los futuros torneos se basarán en esta fundación, abordando funciones proteicas más complejas e incorporando lecciones aprendidas del evento piloto. El objetivo final es seguir empujando los límites de lo que es posible en el diseño de proteínas.
El Torneo de Ingeniería de Proteínas es más que una competencia; es una plataforma impulsada por la comunidad diseñada para acelerar el campo de la ingeniería de proteínas. Al crear oportunidades para que los científicos prueben sus ideas y compartan sus hallazgos, esta iniciativa allana el camino para la próxima generación de investigación en proteínas.
¿Quieres ver qué salió de este concurso científico? Todos los datos, resultados y presentaciones de los equipos están disponibles para cualquiera que esté interesado en sumergirse en el maravilloso mundo de la ingeniería de proteínas. ¡Es como invitar a todos a la fiesta del pastel, donde todos pueden intentar hornear algo nuevo!
Conclusión: El Futuro de la Ingeniería de Proteínas
Con la emoción creciendo en la comunidad de ingeniería de proteínas, el Torneo de Ingeniería de Proteínas ha preparado el escenario para futuras innovaciones. Al fomentar la colaboración y la competencia, los científicos pueden seguir aprendiendo unos de otros y empujar los límites de lo que es posible con las proteínas.
¿Quién sabe qué deliciosos y creativos descubrimientos nos esperan? A medida que los científicos generan nuevas ideas y se desafían entre sí, podemos esperar un futuro lleno de emocionantes avances en el diseño y función de proteínas. ¡Prepárate para sumergirte en la próxima ronda de diversión científica!
Título: Results of the Protein Engineering Tournament: An Open Science Benchmark for Protein Modeling and Design
Resumen: The grand challenge of protein engineering is the development of computational models to characterize and generate protein sequences for arbitrary functions. Progress is limited by lack of 1) benchmarking opportunities, 2) large protein function datasets, and 3) access to experimental protein characterization. We introduce the Protein Engineering Tournament--a fully-remote competition designed to foster the development and evaluation of computational approaches in protein engineering. The tournament consists of an in silico round, predicting biophysical properties from protein sequences, followed by an in vitro round where novel protein sequences are designed, expressed and characterized using automated methods. Upon completion, all datasets, experimental protocols, and methods are made publicly available. We detail the structure and outcomes of a pilot Tournament involving seven protein design teams, powered by six multi-objective datasets, with experimental characterization by our partner, International Flavors and Fragrances. Forthcoming Protein Engineering Tournaments aim to mobilize the scientific community towards transparent evaluation of progress in the field. Graphical Abstract O_FIG O_LINKSMALLFIG WIDTH=200 HEIGHT=113 SRC="FIGDIR/small/606135v2_ufig1.gif" ALT="Figure 1"> View larger version (30K): [email protected]@11da734org.highwire.dtl.DTLVardef@1cc51c0org.highwire.dtl.DTLVardef@10b3c27_HPS_FORMAT_FIGEXP M_FIG C_FIG
Autores: Chase Armer, Hassan Kane, Dana L. Cortade, Henning Redestig, David A. Estell, Adil Yusuf, Nathan Rollins, Hansen Spinner, Debora Marks, TJ Brunette, Peter J. Kelly, Erika DeBenedictis
Última actualización: 2024-11-19 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2024.08.12.606135
Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.08.12.606135.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.