Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Biología# Bioinformática

Avances en la Predicción de la Seguridad de los Medicamentos Usando Procesos Neurales

Nuevos métodos mejoran la detección temprana de los efectos secundarios de las drogas.

― 6 minilectura


Predicción de SeguridadPredicción de Seguridadde Medicamentos Hecha MásInteligentesecundarios.detección temprana de efectosLos procesos neuronales mejoran la
Tabla de contenidos

Un gran desafío en la creación de nuevos medicamentos son los Efectos secundarios inesperados, conocidos como Reacciones Adversas a Medicamentos (RAM), que pueden aparecer más adelante en el proceso. A veces, medicamentos que parecen muy prometedores tienen que ser abandonados después de haber gastado mucho tiempo y dinero debido a estos efectos secundarios. Además, los medicamentos pueden ser retirados del mercado años después de ser aprobados debido a estas reacciones inesperadas, lo que genera costos significativos para las empresas y daño a los pacientes. Esto no es algo raro; entre 1953 y 2013, más de 462 medicamentos fueron retirados del mercado, siendo los problemas hepáticos el efecto secundario más común.

Predecir estos efectos secundarios desde el principio podría ahorrar mucho dinero en el desarrollo de medicamentos. Si los científicos pueden identificar candidatos que probablemente fallarán, pueden descartarlos antes de invertir demasiados recursos.

Usando Aprendizaje automático en el Desarrollo de Medicamentos

Los modelos de aprendizaje automático (AA) muestran promesa en la identificación de RAM en etapas tempranas. Estos modelos pueden ayudar a filtrar medicamentos potenciales, permitiendo a los químicos realizar pruebas específicas para confirmar o descartar posibles efectos secundarios según las predicciones de los modelos. Sin embargo, un gran problema es que no se conocen muchos efectos secundarios para la mayoría de los medicamentos. Solo un número limitado de medicamentos ha sido aprobado en el pasado, resultando en pocas etiquetas de efectos secundarios confiables. Además, dado que los efectos secundarios pueden descubrirse años después de que un medicamento está disponible, la información en los Conjuntos de datos existentes probablemente esté incompleta. Sin embargo, incluso con esta falta de información, cada medicamento aprobado puede estar ya vinculado a muchas RAM, lo que sugiere que predecir estas reacciones podría considerarse un problema multitarea. Este enfoque puede mejorar la eficiencia de los datos y hacer que los modelos sean más sólidos al trabajar con conjuntos de datos incompletos.

Introduciendo Procesos Neurales

Los procesos neuronales (PN) son un tipo de red neuronal diseñada para el meta-aprendizaje, que puede compartir información de manera eficiente entre diferentes tareas. Son capaces de hacer predicciones precisas con solo una pequeña cantidad de datos etiquetados. Los PN toman muestras de datos de diferentes funciones durante su entrenamiento, lo que los hace adecuados para conjuntos de datos escasos. Recientemente, los investigadores han estado explorando cómo se pueden usar estos modelos para predecir funciones relacionadas con medicamentos.

En este estudio, nos enfocamos en procesos neuronales condicionales (PNC) para la predicción de RAM. Los evaluamos utilizando un conjunto de datos que contiene efectos secundarios históricos, conocido como el Recurso de Efectos Secundarios (SIDER). El conjunto de datos proporciona información detallada sobre varios efectos secundarios relacionados con diferentes medicamentos.

Cómo Funcionan los Procesos Neurales Condicionales

En nuestro análisis, usamos un conjunto de funciones de valor binario para representar si un medicamento particular tiene un cierto efecto secundario. Cada medicamento se categoriza como tener el efecto secundario (1) o no tenerlo (0). Nuestro objetivo es predecir la presencia de efectos secundarios para nuevos medicamentos usando las relaciones conocidas del conjunto de datos.

El PNC trabaja en tres pasos principales. Primero, utiliza una red de codificación para crear una representación de los datos conocidos (contexto). Luego, combina estas representaciones para formar un entendimiento global de los datos. Finalmente, una red de decodificación usa esta representación general para predecir los efectos secundarios de nuevos medicamentos.

Durante el entrenamiento, el modelo ve cada función solo una vez por ciclo de entrenamiento, y los datos se muestrean al azar para crear diferentes conjuntos de información y objetivos conocidos. El modelo luego se ajusta para proporcionar las mejores predicciones posibles basadas en los datos actuales.

Comparando PNC con Otros Modelos

Probamos el rendimiento de los PNC frente a dos modelos tradicionales: bosque aleatorio (RF) y XGBoost (XGB). Estos modelos son comunes en el campo y sirven como un estándar para medir la efectividad de los PNC.

El conjunto de datos SIDER contiene información sobre 1556 moléculas, principalmente medicamentos, y lista 5880 RAM junto con más de 140,000 pares de moléculas y efectos secundarios. Dividimos aleatoriamente el conjunto de datos en grupos de entrenamiento y prueba para evaluar el rendimiento de nuestros modelos.

Para simular un conjunto de datos escaso, realizamos un experimento donde eliminamos la mitad de las etiquetas de los datos de entrenamiento y prueba. Esto nos ayudó a evaluar qué tan bien podrían desempeñarse los modelos con información limitada.

Evaluando los Modelos

En nuestro primer experimento, analizamos qué tan bien los PNC podían predecir RAM tanto en el conjunto de datos completo como en el escaso. Requerimos que los modelos identificaran correctamente si cada medicamento tenía un efecto secundario específico o no. Nuestros hallazgos mostraron que los PNC superaron a los modelos tradicionales en ambos escenarios. Curiosamente, mientras que el rendimiento de RF y XGB disminuyó en el conjunto de datos escaso, los PNC mantuvieron su efectividad. Esto podría deberse a que los PNC pueden aprovechar la información de varias funciones incluso con datos incompletos.

Además, examinamos qué tan bien estaban calibradas las probabilidades predichas por nuestros modelos. Esto significa que queríamos ver si las predicciones reflejaban con precisión la probabilidad de que los efectos secundarios fueran ciertos. Tanto el PNC como el RF mostraron una calibración razonable, reflejando de cerca los resultados reales. Sin embargo, el XGB tuvo problemas con la calibración, a menudo subestimando las posibilidades de verdaderos positivos.

Rendimiento en Diferentes Categorías

También analizamos qué tan bien se desempeñaron los PNC en diferentes tipos de sistemas fisiológicos en el conjunto de datos. Entender las predicciones de RAM a través de varios sistemas es crucial para el desarrollo de medicamentos. Analizamos varias categorías y observamos que los PNC consistentemente se desempeñaron mejor que los modelos tradicionales en todos los sistemas fisiológicos.

Conclusión

Nuestro estudio sugiere que un enfoque de meta-aprendizaje usando PNC podría ofrecer ventajas significativas sobre los modelos tradicionales de tarea única en la predicción de RAM. Usando huellas moleculares, los PNC demostraron mayor precisión y mejor calibración que XGBoost o bosques aleatorios al analizar efectos secundarios.

Sin embargo, es importante notar que nuestra investigación se centra únicamente en etiquetas binarias del SIDER, lo que pasa por alto muchos factores importantes relacionados con RAM, como la gravedad y la frecuencia. Estos aspectos son vitales para entender los efectos secundarios en situaciones del mundo real, pero a menudo faltan en conjuntos de datos públicos. Por lo tanto, se necesita más investigación para explorar completamente el potencial de los PN en el desarrollo de medicamentos y realizar comparaciones más rigurosas con otros enfoques modernos de aprendizaje.

La exploración de estos modelos podría llevar a aplicaciones prácticas para tomar decisiones informadas para los químicos medicinales, mejorando, en última instancia, la seguridad y eficacia de nuevos tratamientos.

Fuente original

Título: Calibrated prediction of scarce adverse drug reaction labels with conditional neural processes

Resumen: Adverse drug reactions (ADRs) are a major source of concern in the development of novel pharmaceuticals. ADRs may be identified in the late stages of development or even after commercialization, which may lead to failure or discontinuation after spending enormous resources on candidate molecules. Thus, predicting ADRs early in the process could help reduce costs by avoiding future failures. However, due to the low number of drugs approved, the amount of historical datapoints on ADRs is limited, which makes their prediction challenging for traditional chemoinformatics methods. Interestingly, each approved drug may have been annotated for hundreds of ADRs, which opens the door to framing ADR prediction as a multi-task or meta-learning problem. In this work, we adopt a meta-learning approach to ADR prediction by applying conditional neural processes (CNPs) to the publicly available Side Effect Resource (SIDER). Our results suggest that CNPs are competitive against single-task baselines even when trained on sparse datasets with missing labels. Furthermore, we find that their predictions are well-calibrated. Finally, we evaluate their performance on ADRs associated to different physiological systems and confirm good predictions across organ classes. Our findings suggest that meta-learning strategies may be beneficial for data-limited clinical endpoints like ADRs.

Autores: Sergio Bacallado, M. Garcia-Ortegon, S. Seal, S. Singh, A. Bender

Última actualización: 2024-06-10 00:00:00

Idioma: English

Fuente URL: https://www.biorxiv.org/content/10.1101/2024.06.07.598036

Fuente PDF: https://www.biorxiv.org/content/10.1101/2024.06.07.598036.full.pdf

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a biorxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares