Predicción de Cambios en la Función Pulmonar en Pacientes con SSc-ILD Usando Aprendizaje Automático
Este estudio explora cómo el aprendizaje automático puede predecir cambios en la función pulmonar en SSc-ILD.
― 8 minilectura
Tabla de contenidos
- Métodos Actuales para Monitorear Enfermedades Pulmonares
- Avances en la Predicción de la Progresión de la Enfermedad
- Cómo Puede Ayudar el Aprendizaje Automático
- Nuestra Contribución
- Recopilación de Datos de Pacientes
- Entendiendo las Trayectorias de los Pacientes
- Analizando las Características de los Pacientes
- Modelos de Progresión de la Enfermedad
- Midiendo la Precisión de las Predicciones
- Incertidumbre en las Predicciones
- Importancia de las Características en las Predicciones
- Importancia de la Documentación del Tratamiento
- Conclusión
- Fuente original
La Esclerosis Sistémica (SSc) es una enfermedad a largo plazo que afecta el sistema inmunológico y daña los vasos sanguíneos. Puede provocar cambios en el funcionamiento de varios órganos y tejidos en el cuerpo. Un problema serio que puede surgir de la SSc es una condición llamada Enfermedad Pulmonar Intersticial (ILD). La ILD ocurre cuando se acumula demasiado tejido cicatricial en los pulmones, lo que dificulta la respiración de los pacientes. Esto puede empeorar con el tiempo y es una razón común para visitar hospitales y por muertes en personas con SSc.
Debido a que la ILD es un gran problema para las personas con SSc, los chequeos regulares son esenciales. Los doctores monitorean la función pulmonar de cerca para detectar cualquier cambio a tiempo. Este proceso generalmente implica tomar imágenes detalladas de los pulmones y realizar pruebas para evaluar qué tan bien están funcionando.
Métodos Actuales para Monitorear Enfermedades Pulmonares
Actualmente, los médicos usan tomografías computarizadas de alta resolución (HRCT) del pecho para ver cuánto están afectados los pulmones. También realizan Pruebas de Función Pulmonar (PFT) para evaluar la salud de los pulmones. Nuevos métodos de análisis que examinan la información recopilada de las tomografías han mostrado promesas para predecir cuánto tiempo podrían vivir los pacientes con SSc-ILD sin problemas de salud graves.
Otro estudio mostró que ciertas medidas, como la Capacidad Vital Forzada (FVC) y la habilidad de los pulmones para transferir gases (DLCO), pueden indicar cómo progresa la ILD en pacientes individuales. Sin embargo, cada paciente es diferente, y algunos experimentan una progresión más rápida de la enfermedad que otros, lo que lleva a mayores riesgos de complicaciones. Entender cómo cambia la función pulmonar de cada paciente con el tiempo es crucial para brindar la mejor atención.
Avances en la Predicción de la Progresión de la Enfermedad
Los investigadores han estado buscando señales o marcadores que puedan ayudar a predecir cómo progresará la SSc-ILD. Algunos estudios han identificado algunos marcadores potenciales que podrían ayudar a pronosticar la progresión de la enfermedad. Por ejemplo, algunos investigadores desarrollaron un modelo de predicción basado en qué tan bien camina un paciente y si tiene ciertos problemas en las articulaciones. Otros estudios encontraron diferentes factores, como ser hombre o no haber tomado aspirina antes, que podrían estar relacionados con cómo avanza la enfermedad.
A pesar de estos avances, todavía no hay una manera definitiva de predecir cómo progresará la ILD a nivel individual. Tampoco hay un acuerdo sobre con qué frecuencia deberían ser examinados los pacientes o cuáles son los mejores métodos para hacerlo.
Los diferentes hallazgos pueden deberse a las diferencias en los grupos de pacientes estudiados. Además, muchos de estos estudios utilizaron técnicas de análisis estándar que pueden no capturar la complejidad de los datos. A medida que la tecnología avanza, el Aprendizaje automático (ML) ha emergido como una herramienta poderosa. Ayuda a extraer información útil de grandes conjuntos de datos, lo que puede ofrecer mejores perspectivas sobre la atención al paciente.
Cómo Puede Ayudar el Aprendizaje Automático
Los métodos de aprendizaje automático pueden analizar información compleja y ayudar en la toma de decisiones. Por ejemplo, los investigadores han utilizado con éxito ML para predecir el desarrollo de enfermedades oculares al analizar datos genéticos y de imágenes. También lo han usado para identificar pacientes en riesgo de enfermedades cardíacas al evaluar la evolución de la placa en los vasos sanguíneos. Métodos similares se pueden aplicar a la SSc-ILD para predecir los cambios en la función pulmonar con el tiempo.
Nuestra Contribución
En este estudio, nos centramos en predecir los futuros valores de función pulmonar en pacientes con SSc-ILD usando aprendizaje automático. Creamos cronologías para cada paciente, recopilando información de sus visitas y preservando el orden de los eventos. Nos proponemos abordar varios objetivos principales:
- Desarrollar un nuevo modelo específicamente diseñado para entender los cambios en la función pulmonar en pacientes con SSc-ILD.
- Comparar nuestro nuevo modelo con varios modelos estándar de ML para evaluar su precisión.
- Analizar cómo ciertos factores pueden afectar la precisión de nuestras predicciones.
- Probar un método que mejore la incertidumbre en las predicciones.
- Determinar qué características jugaron papeles significativos en las predicciones de nuestro modelo.
Recopilación de Datos de Pacientes
Usamos una gran base de datos que contiene información de miles de pacientes. Esta base de datos incluye detalles sobre su salud, demografía y datos clínicos a lo largo de varias visitas. Para nuestro análisis, incluimos pacientes que cumplían criterios específicos, como ser adultos con ILD diagnosticada confirmada por pruebas de imagen, que tenían mediciones de función pulmonar registradas y habían realizado múltiples visitas a la clínica.
Entendiendo las Trayectorias de los Pacientes
Organizamos los datos recopilados en cronologías de pacientes, lo que nos permitió ver cómo evolucionaba la condición de cada paciente a lo largo del tiempo. Cada visita contribuyó a tener una imagen más clara de la salud y función pulmonar del paciente. El objetivo era usar visitas pasadas para predecir futuros resultados de función pulmonar.
Analizando las Características de los Pacientes
Nuestro grupo de estudio final consistió en más de 2000 pacientes, la mayoría de los cuales eran mujeres, con una edad promedio de alrededor de 53 años. Los datos mostraron una variedad de características, incluyendo edad, género y hábitos de fumar. Estas características ayudaron a proporcionar un contexto adicional para comprender la salud de cada paciente.
Modelos de Progresión de la Enfermedad
Usando los datos de las cronologías, nos centramos en predecir los resultados futuros para los pacientes basándonos en sus visitas anteriores. Empleamos varias técnicas de modelado, incluyendo:
- Redes Neuronales Recurrentes (RNN): Este tipo de modelo es excelente para manejar datos secuenciales como nuestras cronologías de pacientes.
- Redes Transformer: Otro modelo avanzado que puede resaltar la importancia de diferentes factores al hacer predicciones.
- Procesos Neurales Atentos (ANP): Este modelo está diseñado para aprender de los datos de manera eficiente y proporcionar estimaciones de incertidumbre para sus predicciones.
Midiendo la Precisión de las Predicciones
Usamos varios métodos para evaluar qué tan bien se desempeñaron nuestros modelos en términos de precisión. Una de las medidas clave fue el Error Cuadrático Medio (RMSE), que nos ayudó a medir qué tan cerca estaban las predicciones de los resultados reales. También evaluamos cómo diferentes factores influyeron en las predicciones.
Incertidumbre en las Predicciones
Entendiendo que las predicciones pueden no ser siempre precisas, analizamos cómo nuestros modelos podrían proporcionar estimaciones de incertidumbre. Por ejemplo, evaluamos cuán probable era que la función pulmonar real cayera dentro de un rango predicho. Esta estimación de incertidumbre es importante para que los doctores tomen decisiones informadas sobre el cuidado del paciente.
Importancia de las Características en las Predicciones
Analizamos qué características fueron más influyentes en nuestras predicciones. Este análisis reveló que las mediciones anteriores de la función pulmonar y factores como la extensión del compromiso cutáneo, la edad y ciertos detalles clínicos jugaron papeles significativos. Estos conocimientos pueden ayudar a los clínicos a entender qué factores deberían monitorear de cerca en los pacientes.
Importancia de la Documentación del Tratamiento
Un hallazgo notable fue la importancia de una documentación precisa del tratamiento. Observamos que a medida que aumentaba el nivel de documentación de la terapia, las predicciones de los modelos mejoraban. Esto resalta la necesidad de un registro exhaustivo en la atención médica para ayudar a entrenar modelos de predicción más efectivos en el futuro.
Conclusión
Nuestra investigación demuestra el potencial de usar técnicas avanzadas de aprendizaje automático para predecir cambios en la función pulmonar en pacientes con SSc-ILD. Los resultados mostraron que los modelos secuenciales superaron a los métodos estándar, proporcionando información precisa sobre las trayectorias de los pacientes. Este enfoque no solo mejora nuestra comprensión de cómo puede progresar la enfermedad, sino que también proporciona herramientas valiosas para que los proveedores de atención médica gestionen y traten a los pacientes de manera más efectiva. Al predecir con precisión los futuros resultados de salud, podemos tomar decisiones más informadas en el cuidado de los pacientes, mejorando en última instancia la calidad de vida de quienes viven con SSc-ILD.
Título: Predicting Interstitial Lung Disease Progression in Patients with Systemic Sclerosis Using Attentive Neural Processes - A EUSTAR Study
Resumen: AO_SCPLOWBSTRACTC_SCPLOWO_ST_ABSBackgroundC_ST_ABSSystemic sclerosis (SSc) is an autoimmune disease with high mortality with lung involvement being the primary cause of death. Progressive interstitial lung disease (ILD) leads to a decline in lung function (forced vital capacity, FVC% predicted) with risk of respiratory failure. These patients could benefit from an early and tailored pharmacological intervention. However, up to date, tools for prediction of individual FVC changes are lacking. In this paper, we aimed at developing a trustworthy machine learning system that is able to guide SSc management by providing not only robust FVC predictions, but also uncertainty quantification (i.e. the degree of certainty of model prediction) as well as similarity-based explainability for any patient P (i.e. a list of past SSc patients with similar FVC trajectories like P). We further aimed to identify the key clinical factors influencing the models predictions and to use model-guided data representation to identify SSc patients with similar sequential FVC measurements. MethodsWe trained and evaluated machine learning (ML) models to predict SSc-ILD trajectory as measured by FVC% predicted values using the international SSc database managed by the European Scleroderma Trials and Research group (EUSTAR), which comprises clinical, laboratory and functional parameters. EUSTAR records patients data in annual assessment visits, and, given any visit, we aimed at predicting the FVC value of a patients subsequent visit, taking into account all available patient data (i.e. baseline and follow-up visit data up to the time point where we make the prediction). For training of our ML models, we included 2220 SSc patients that had at least 3 recorded visits in the EUSTAR database, were at least 18 years old, had confirmed ILD and sufficient clinical documentation. We developed sequential ML models implementing the attentive neural process formalism with either a recurrent (ANP RNN) or transformer encoder (ANP transformer) architecture. We compared these architectures with baseline sequential models including gated recurrent neural networks (RNNs) and multi-head self-attention transformer-based networks. Baseline non-sequential models included tree-based models such as gradient boosting trees, and regression-based models with varying regularization schemes. Our experiments used stratified 5-fold cross-validation to train and test the models using the average root mean squared error (RMSE), weighted RMSE, and mean absolute error (MAE) as performance metrics. We computed the coverage and Winkler score for uncertainty quantification, SHAP values for grading the input features importance and used the data embeddings of the ANP architectures for both similarity-based explainability and the identification of similar SSc patient journeys. ResultsPatients baseline FVC scores ranged from 22 to 150% predicted with a mean (SD) of 90.53% predicted (21.52). Our deep learning models showed better performance for FVC forecasting, compared to tree- and regression-based models. The top performing ANP RNN architecture was able to closely model future FVC values with average (SD) performance of 8.240 (0.168) weighted RMSE and 6.94 (0.190) MAE that was further used as feature generator for a logistic regression trained to predict a FVC% decline of at least 10% points achieving 0.704 AUC score. In comparison, a naive baseline using the mean FVC value as a predictor achieved much lower FVC forecasting capabilities, with 18.718 (0.317) weighted RMSE, and 17.619 (0.599) MAE. SHAP value analysis indicated that prior FVC measurements, diffusion of carbon monoxide (DLCO) values, skin involvement, age, anti-centromere positivity, dyspnea and CRP-elevation contributed most to deep-learning-based FVC predictions. Regarding uncertainty quantification, ANP RNN achieved 79% coverage (i.e. the model would provide uncertainty estimates that included the true future FVC value in 79 out of 100 predictions) out of the box, and 90% using an additional conformal prediction module with an corresponding Winkler score of 892 (indicating the width of the uncertainty estimate plus penalty for mistakes), smaller than any other model at the same coverage level. We further demonstrate how the data abstraction provided by the ANP RNN model (embeddings) allows for deriving similar patient trajectories (for similarity-based explanation). ConclusionsOur study demonstrates the feasibility of FVC forecasting and thus the ability to predict ILD trajectories in individual SSc patients using deep learning. We show that model predictions can be paired with uncertainty quantification and similarity-based model explainability, which are crucial elements for deploying trustworthy ML algorithms. Our study is thus an important first step towards reliable automated ILD trajectory (i.e. FVC%) prediction system with potential clinical utility.
Autores: Ahmed Allam, A. N. Horvath, M. Dittberner, C. Trottet, E. Siegert, V. Sobanski, P. Carreira Delgado, D. Lorenzo, V. Smith, S. Guiducci, N. Hunzelmann, A.-M. Hoffmann-Vold, S. Trugli, A. M. Gheorghiu, A. Svetlana, C. Ribi, M. Krauthammer, B. Maurer, EUSTAR Collaborators
Última actualización: 2024-04-26 00:00:00
Idioma: English
Fuente URL: https://www.medrxiv.org/content/10.1101/2024.04.25.24306365
Fuente PDF: https://www.medrxiv.org/content/10.1101/2024.04.25.24306365.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a medrxiv por el uso de su interoperabilidad de acceso abierto.