Diseñando proteínas para mejores resultados en tratamientos
Nuevas técnicas buscan reducir las reacciones inmunitarias en proteínas terapéuticas.
― 10 minilectura
Tabla de contenidos
- Resumen de la Vía MHC-I
- Integrando Consideraciones Inmunológicas en el Diseño de Proteínas
- Historia sobre el Pliegue y Diseño de Proteínas
- El Flujo de Trabajo del Diseño de Proteínas
- Entendiendo la Vía MHC Clase I
- Ajustando ProteinMPNN Usando DPO
- Creando un Conjunto de Datos de Preferencias
- Evaluando el Impacto de DPO en el Diseño de Proteínas
- Compensaciones en el Diseño de Proteínas
- Evaluación del Rendimiento de Proteínas Específicas
- Conclusión y Direcciones Futuras
- Fuente original
El diseño de proteínas es un campo importante en biotecnología, especialmente cuando se trata de desarrollar nuevos tratamientos para enfermedades. Los científicos están utilizando métodos avanzados para predecir las secuencias de aminoácidos (AAs) que forman las proteínas basándose en sus estructuras tridimensionales (3D). Una herramienta popular para esta tarea se llama ProteinMPNN. Esta herramienta ayuda a predecir las mejores secuencias de aminoácidos que se pliegan en una forma específica de proteína.
Sin embargo, al crear nuevas proteínas, sobre todo las que se van a usar en medicina, es crucial considerar cómo reaccionará el sistema inmunológico humano a estas proteínas. El sistema inmune puede reconocer proteínas que son extrañas para el cuerpo, lo que puede llevar a tratamientos menos efectivos o incluso efectos secundarios dañinos. Esto es especialmente cierto para las proteínas terapéuticas, que están diseñadas para ayudar a tratar condiciones, pero pueden ser vistas como amenazas por el sistema inmunológico. Si el cuerpo reconoce estas proteínas como no propias, puede iniciar una respuesta inmune en su contra, reduciendo su efectividad o causando reacciones autoinmunes.
Al considerar cómo interactúa una proteína terapéutica con el sistema inmune, es importante centrarse en cómo se introduce la proteína en el cuerpo y dónde se supone que debe funcionar. Para las proteínas que operan fuera de las células, la respuesta inmune implicará tipos específicos de reconocimiento inmune. Sin embargo, algunas proteínas necesitan ser producidas dentro de las células humanas, como los tratamientos con ARN que abordan problemas a nivel celular. En estos casos, la respuesta inmune puede venir de diferentes vías.
En esta discusión, nos centraremos en cómo se pueden diseñar proteínas con una menor probabilidad de ser reconocidas por el sistema inmune, particularmente a través de un mecanismo llamado la vía MHC Clase I. Esta vía es clave para alertar a ciertos tipos de células inmunitarias, conocidas como linfocitos T citotóxicos (CTL), sobre la presencia de proteínas potencialmente dañinas dentro de las células.
Resumen de la Vía MHC-I
La vía MHC-I juega un papel crucial en la capacidad del sistema inmune para detectar proteínas anormales o extranjeras dentro de las células. Este sistema permite a nuestras células inmunitarias monitorear la salud de las células al presentar pequeños fragmentos de proteínas (llamados péptidos) en su superficie. Si un CTL encuentra un péptido que reconoce como extraño, puede desencadenar la destrucción de la célula que muestra ese péptido.
Para las proteínas terapéuticas que se expresan dentro de las células, se vuelve particularmente importante considerar cómo se pueden presentar estas proteínas en la superficie celular a través de la vía MHC-I. Para diseñar mejor proteínas para uso terapéutico, podemos ajustar nuestras herramientas de diseño de proteínas para crear secuencias que sean menos propensas a ser detectadas por el sistema inmune.
Integrando Consideraciones Inmunológicas en el Diseño de Proteínas
Una forma de mejorar nuestro enfoque de diseño es mediante una técnica de ajuste conocida como Optimización de Preferencias Directas (DPO). Este método nos permite modificar la herramienta ProteinMPNN para que produzca secuencias con menor visibilidad para el sistema inmune, mientras mantenemos la calidad deseada de la proteína.
El nuevo modelo ajustado, denominado CAPE-MPNN, mantiene la misma estructura que ProteinMPNN, lo que facilita su integración en los flujos de trabajo existentes. La clave de su éxito radica en su capacidad para encontrar un equilibrio entre reducir la detección inmune y asegurar la calidad funcional de las proteínas diseñadas.
Historia sobre el Pliegue y Diseño de Proteínas
Las proteínas se pliegan en formas 3D complejas basadas en la secuencia de aminoácidos que las componen. Este proceso de plegado es crucial para la función de la proteína. En los últimos años, ha habido avances significativos en la predicción de estructuras de proteínas, con modelos notables como AlphaFold que han captado la atención por sus capacidades. Esto también ha llevado a un renovado interés en el diseño de proteínas, que implica generar nuevas secuencias de proteínas que se plieguen correctamente en las formas deseadas.
Tradicionalmente, el diseño de proteínas se basaba en enfoques físicos, como los que utilizan Rosetta Packer, para predecir cómo se pliegan las proteínas. Sin embargo, el reciente auge del aprendizaje automático ha traído consigo una ola de métodos impulsados por datos. Herramientas como ProteinMPNN han surgido, aprovechando vastos conjuntos de datos para generar nuevas secuencias de aminoácidos basadas en estructuras de proteínas conocidas.
El Flujo de Trabajo del Diseño de Proteínas
Un flujo de trabajo general de diseño de proteínas comienza con la generación de una estructura de columna vertebral utilizando modelos como RFdiffusion o FoldingDiff. Una vez establecida la columna vertebral, ProteinMPNN puede crear secuencias candidatas de aminoácidos que pueden plegarse en la estructura deseada. Un enfoque alternativo es comenzar con una secuencia de proteína existente y modificarla para crear otras secuencias con funciones similares pero con potencialmente menos visibilidad para el sistema inmune.
El aspecto de aprendizaje automático de este proceso es crucial. Propone una gama de diseños candidatos, que luego se evalúan mediante métodos bioinformáticos para ver qué tan probable es que se plieguen correctamente y funcionen como se espera. Esta evaluación puede ser computacionalmente pesada, especialmente cuando se involucran simulaciones. Así, el objetivo es generar un conjunto de candidatos que ya sean propensos a cumplir con los criterios deseados, en este caso, reducir la visibilidad para el sistema inmune.
Entendiendo la Vía MHC Clase I
La vía MHC-I juega un papel vital en cómo el sistema inmune protege al cuerpo. Para las proteínas intracelulares, esta vía permite que las células comuniquen lo que está sucediendo dentro de ellas. Lo hace presentando secuencias cortas de proteínas en la superficie celular. Si alguna de estas secuencias es reconocida por CTLs como no propias, el sistema inmune puede eliminar la célula afectada para evitar la propagación de amenazas potenciales.
Los tratamientos con ARN, que se expresan dentro de las células, también tendrán sus productos expuestos en la superficie celular a través de la vía MHC-I. Por lo tanto, al diseñar proteínas, es esencial tener en cuenta esta visibilidad para reducir las posibilidades de desencadenar una respuesta inmune.
Ajustando ProteinMPNN Usando DPO
Para abordar la necesidad de menos visibilidad inmune, podemos ajustar ProteinMPNN utilizando DPO. Este método nos permite modificar las secuencias que genera para que se alineen mejor con nuestro objetivo de reducir la visibilidad. El proceso comienza con la recopilación de datos que reflejan nuestras preferencias y utilizarlos para ajustar la salida del modelo.
El conjunto de datos de preferencias consta de ejemplos que incluyen una estructura de columna vertebral, dos posibles respuestas generadas y cuál de estas respuestas se prefiere. Este conjunto de datos forma la base para ajustar el modelo a través de varios ciclos de entrenamiento.
Creando un Conjunto de Datos de Preferencias
Para crear nuestro conjunto de datos de preferencias, aprovechamos los datos existentes utilizados en ProteinMPNN. Los datos consisten en estructuras de proteínas obtenidas del Protein Data Bank, donde cada ejemplo está vinculado a secuencias de proteínas específicas. Este conjunto de datos contiene muchas cadenas de proteínas, que se pueden agrupar en función de su similitud. Al seleccionar proteínas aleatorias y evaluar sus diseños, podemos determinar qué secuencias exhiben menor visibilidad inmune.
En la práctica, generamos diseños de proteínas a partir del modelo CAPE-MPNN ajustado y los comparamos con las salidas originales de ProteinMPNN. Cada diseño se evalúa por su visibilidad y calidad. El objetivo es identificar qué secuencias pueden lograr la reducción deseada en visibilidad mientras mantienen un alto nivel de calidad.
Evaluando el Impacto de DPO en el Diseño de Proteínas
Mientras que el objetivo principal es reducir la visibilidad inmune a través de DPO, también es importante asegurarnos de que no comprometamos la calidad funcional de las proteínas diseñadas. Usando métodos de evaluación, podemos analizar cómo los ajustes realizados bajo DPO afectan el rendimiento de las proteínas.
Para medir el éxito de nuestro enfoque, podemos observar varios factores como el TM-score, que indica la similitud estructural entre la proteína diseñada y la secuencia original. La visibilidad se evalúa según la cantidad de péptidos que pueden presentarse a través de la vía MHC-I. Al comparar estas métricas, podemos analizar el impacto de DPO en la visibilidad y la calidad de las proteínas generadas.
Compensaciones en el Diseño de Proteínas
A través de este proceso, se hace evidente que hay compensaciones involucradas en el diseño de proteínas con menor visibilidad. Por ejemplo, aunque podemos lograr puntajes de visibilidad más bajos, esto puede venir a expensas de la recuperación de secuencia o la integridad estructural.
El análisis de compensaciones revela que diferentes hiperparámetros utilizados en DPO pueden desplazar la posición de un modelo a lo largo del espectro de visibilidad-calidad. Altos valores para ciertos parámetros pueden llevar a inestabilidad, mientras que otros pueden mejorar o obstaculizar los resultados generales del diseño.
Evaluación del Rendimiento de Proteínas Específicas
Para evaluar aún más la efectividad de nuestro enfoque, aplicamos el modelo CAPE-MPNN ajustado a proteínas específicas y evaluamos su rendimiento. Estas proteínas específicas son elegidas del Protein Data Bank y se seleccionan para probar la eficacia de nuestros métodos.
Al analizar qué tan bien se desempeñan los diseños de CAPE-MPNN en comparación con los de ProteinMPNN original, podemos determinar si los ajustes realizados usando DPO han llevado a resultados satisfactorios en términos de visibilidad y calidad.
Conclusión y Direcciones Futuras
La integración de consideraciones inmunológicas en el diseño de proteínas representa una frontera emocionante en biotecnología. Al emplear técnicas como DPO, podemos mejorar nuestra capacidad para crear proteínas terapéuticas que sean menos propensas a provocar respuestas inmunitarias no deseadas.
Aunque nuestros hallazgos destacan el potencial de ajustar modelos como ProteinMPNN, también revelan limitaciones para eliminar completamente la visibilidad inmune. El trabajo futuro involucrará refinar aún más estas técnicas y comprender la compleja relación entre la estructura de proteínas, función y respuesta inmune.
A medida que la investigación en este campo continúa avanzando, podríamos desbloquear nuevas posibilidades para proteínas terapéuticas más seguras y efectivas que puedan mejorar significativamente los resultados de los pacientes en el futuro.
Título: Integrating MHC Class I visibility targets into the ProteinMPNN protein design process
Resumen: ProteinMPNN is crucial in many protein design pipelines, identifying amino acid (AA) sequences that fold into given 3D protein backbone structures. We explore ProteinMPNN in the context of designing therapeutic proteins that need to avoid triggering unwanted immune reactions. More specifically, we focus on intra-cellular proteins that face the challenge of evading detection by Cytotoxic T-lymphocytes (CTLs) that detect their presence via the MHC Class I (MHC-I) pathway. To reduce visibility of the designed proteins to this immune-system component, we develop a framework that uses the large language model (LLM) tuning method, Direct Preference Optimization (DPO), to guide ProteinMPNN in minimizing the number of predicted MHC-I epitopes in its designs. Our goal is to design proteins with low MHC-I immune-visibility while preserving the original structure and function. For our assessment, we first use AlphaFold to predict the 3D structures of designed protein sequences. We then use TM-score, that measures the structural alignment between the predicted design and original protein, to evaluate fidelity to the original protein structure. We find our LLM-based tuning method for constraining MHC-I visibility is able to effectively reduce visibility without compromising structural similarity to the original protein.
Autores: Hans-Christof Gasser, D. A. Oyarzun, J. A. Alfaro, A. Rajan
Última actualización: 2024-06-05 00:00:00
Idioma: English
Fuente URL: https://www.biorxiv.org/content/10.1101/2024.06.04.597365
Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.06.04.597365.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.