Prediciendo el Riesgo de Neumonía Asociada a Accidentes Cerebrovasculares
Nuevos modelos ayudan a identificar el riesgo de neumonía en pacientes con accidente cerebrovascular.
Ting Wang, C. Li, J. Yuan, L. Yuan, M. You
― 7 minilectura
Tabla de contenidos
- La Importancia de los Modelos de Predicción de Riesgo
- Diseño del Estudio y Participantes
- Identificación de Factores Predictivos
- ¿Qué es la NAAC?
- Cálculo del Tamaño de la Muestra
- Recolección y Preparación de Datos
- Construcción y Evaluación del Modelo
- Comprendiendo las Predicciones del Modelo
- Ventajas del Aprendizaje Automático
- Limitaciones del Estudio
- Conclusión
- Fuente original
El accidente cerebrovascular es un problema de salud serio que puede afectar mucho la calidad de vida y la supervivencia de una persona. En 2019, alrededor de 6.55 millones de personas murieron por accidente cerebrovascular en todo el mundo, convirtiéndose en una de las principales causas de muerte. Después de sufrir un accidente cerebrovascular, muchos pacientes enfrentan varios desafíos, siendo una complicación común la neumonía asociada al accidente cerebrovascular (NAAC). Los estudios muestran que la ocurrencia de NAAC puede variar del 7% al 38% en pacientes con accidente cerebrovascular. La NAAC puede llevar a estancias más largas en el hospital, mayores costos médicos y un mayor riesgo de muerte. Actualmente, los doctores tratan principalmente la NAAC con antibióticos, pero estos pueden no reducir efectivamente las posibilidades de desarrollar NAAC. Por lo tanto, es esencial que los proveedores de salud identifiquen rápidamente a los pacientes con alto riesgo de NAAC y tomen medidas para prevenirla, lo que puede mejorar los resultados para los pacientes.
La Importancia de los Modelos de Predicción de Riesgo
Crear modelos que predigan el riesgo de NAAC puede ayudar a los doctores a identificar temprano a los pacientes de alto riesgo, permitiendo intervenciones a tiempo para reducir la posibilidad de que desarrollen NAAC. Los investigadores han creado diferentes modelos de predicción en los últimos años, como sistemas de puntuación que ayudan a los profesionales de salud a evaluar el riesgo de un paciente para NAAC. Sin embargo, incluso los modelos fiables pueden perder efectividad con el tiempo debido a cambios en los factores de riesgo, métodos de tratamiento u otros factores. Esto significa que estos modelos necesitan ser actualizados regularmente. Además, pocos estudios han usado técnicas de aprendizaje automático interpretables para crear modelos de predicción de NAAC. Este estudio combina predictores nuevos y conocidos usando aprendizaje automático y un método llamado SHAP para explicar mejor las predicciones.
Diseño del Estudio y Participantes
Este estudio examinó a pacientes con accidente cerebrovascular de un hospital específico durante casi un año. Para ser incluidos en el estudio, los participantes debían tener al menos 18 años, haber sido diagnosticados con accidente cerebrovascular y no haber necesitado una máquina de respiración dentro de la semana posterior al accidente. Los pacientes fueron excluidos si fueron dados de alta o fallecieron dentro de las 24 horas de su ingreso, si tenían una infección pulmonar antes del accidente cerebrovascular, si decidieron detener el tratamiento o si sus datos estaban mayormente faltantes. Esta investigación siguió las pautas éticas y obtuvo la aprobación del comité de ética del hospital.
Identificación de Factores Predictivos
Los investigadores identificaron 27 factores que podrían ayudar a predecir el riesgo de NAAC. Estos factores incluían información demográfica general, como edad y género, así como detalles médicos como las habilidades diarias de los pacientes, el tipo y la ubicación del accidente cerebrovascular, la presencia de dificultades para tragar y otras condiciones de salud como la hipertensión y la diabetes. Otros factores incluían los antecedentes personales de los pacientes, los tratamientos recibidos y varios resultados de pruebas de laboratorio.
¿Qué es la NAAC?
La NAAC se define como una neumonía que ocurre dentro de los siete días para pacientes con accidente cerebrovascular que no necesitaron una máquina de respiración. Para diagnosticar la NAAC, se siguen pautas específicas, asegurando que el diagnóstico esté alineado con los estándares médicos establecidos.
Cálculo del Tamaño de la Muestra
Para determinar cuántos pacientes se necesitaban incluir en el estudio, los investigadores usaron un método que toma en cuenta múltiples factores para asegurar un modelo de predicción preciso. Basándose en datos existentes, estimaron que entre 701 y 1272 pacientes debían ser incluidos para crear un modelo confiable.
Recolección y Preparación de Datos
Los investigadores recopilaron datos revisando los registros médicos electrónicos, incluyendo los registros de admisión y los resultados de laboratorio. Se aseguraron de que el proceso de recolección de datos fuera imparcial manteniendo la información de resultados separada de los factores predictivos. Para manejar los datos faltantes, usaron un método que preserva la precisión e integridad de los datos. Después de clasificar los datos, los dividieron en dos partes: una para construir el modelo de predicción y otra para probar qué tan bien funcionaba el modelo.
Construcción y Evaluación del Modelo
El estudio se centró en usar varios métodos estadísticos para construir un modelo que predijera el riesgo de NAAC. Los investigadores usaron una técnica llamada regresión Lasso para reducir los factores predictivos a seis: terapia con sonda nasogástrica, edad, actividades diarias y varios resultados de laboratorio. Probaron múltiples métodos de aprendizaje automático, incluyendo árboles de decisión, regresión logística y otros. El método con mejor rendimiento, llamado XGBoost, demostró una fuerte capacidad predictiva, permitiendo una evaluación efectiva del rendimiento del modelo.
Comprendiendo las Predicciones del Modelo
El método SHAP ayuda a explicar cómo cada predictor contribuye al resultado del modelo. Proporciona información sobre la importancia de cada variable. Por ejemplo, puntajes más bajos en actividades diarias indicaron un mayor riesgo de NAAC. Esto puede ser porque una capacidad limitada de autocuidado puede llevar a más tiempo en la cama y un mayor riesgo de infecciones.
De manera similar, el uso de una sonda nasogástrica para la alimentación fue identificado como un factor de riesgo. Esta sonda puede llevar a complicaciones que aumentan la probabilidad de neumonía. Los pacientes mayores también mostraron un mayor riesgo, probablemente debido a un declive natural en la función inmunológica con la edad. El estudio encontró que niveles altos de ciertos resultados de laboratorio, en particular la proteína C-reactiva sensible y niveles bajos de hemoglobina, estaban asociados con un mayor riesgo para NAAC.
Ventajas del Aprendizaje Automático
Las técnicas de aprendizaje automático, como las usadas en este estudio, tienen ventajas distintivas sobre los métodos tradicionales. Pueden manejar eficientemente grandes cantidades de datos y descubrir relaciones complejas que los modelos más simples podrían pasar por alto. El método XGBoost destacó en este estudio por su precisión y su capacidad para proporcionar resultados interpretables, convirtiéndolo en una herramienta valiosa para predecir riesgos en pacientes.
Limitaciones del Estudio
A pesar de los resultados prometedores, el estudio tuvo algunas limitaciones. Primero, se realizó en un solo centro, lo que puede restringir la aplicabilidad de los hallazgos a otros entornos. El estudio también se basó en registros médicos existentes, lo que podría llevar a datos incompletos. Además, la validación externa en poblaciones diversas aún no se ha realizado, lo que significa que la generalizabilidad del modelo necesita más examen. Los esfuerzos futuros deben centrarse en mejorar el modelo incorporando más factores y probando otros métodos avanzados.
Conclusión
Los modelos desarrollados a través de esta investigación muestran un gran potencial para predecir el riesgo de neumonía en pacientes con accidente cerebrovascular. El modelo XGBoost tuvo un desempeño particularmente bueno y proporciona información práctica que puede ayudar a los proveedores de salud a tomar decisiones informadas. El uso del método SHAP ofrece una comprensión más clara de los factores que influyen en el riesgo de desarrollar neumonía, ayudando en definitiva a la atención al paciente y mejorando los resultados.
Título: Prediction of stroke-associated pneumonia risk in stroke patients based on interpretable machine learning
Resumen: BackgroundStroke-associated pneumonia (SAP) is a frequent complication of stroke, characterized by its high incidence rate, and it can have a severe impact on the prognosis of patients. The limitations of current clinical treatment measures underscore the critical need to identify high-risk factors promptly to decrease the incidence of SAP. ObjectiveTo analyze the risk factors of SAP in stroke patients, construct a predictive model of SAP based on the SHAP interpretable machine learning method, and explain the important variables. MethodsA total of 763 stroke patients admitted to the Second Affiliated Hospital of Anhui University of Traditional Chinese Medicine from July 1, 2023, to May 31, 2024, were selected and randomly divided into the model training set (n=457) and model validation set (n=306) according to the ratio of 6:4. Firstly, the included data were sorted out, and then Lasso regression was used to screen the included characteristic variables. Based on the tidymodels framework, Using decision tree (DT), logistic regression, extreme gradient boosting (XGBoost), support vector machine (SVM), The classification model was constructed by five machine learning methods, including SVM and LightGBM. The grid search and 5-fold cross validation were used to optimize the hyperparameter optimization strategy and the performance index of the model. The predictive performance of the model was evaluated by the area under the receiver operating curve (AUC), calibration curve, and decision curve analysis (DCA), and we used Shapley additive explanation (SHAP) to account for the model predictions and provide interpretable insights. ResultsThe incidence of SAP in this study was 31.72% (242/763). Six variables were selected by Lasso regression, including nasogastric tube use, age, ADL score, Alb, Hs-CRP, and Hb. The model with the best performance in the validation set was the XGBoost model, with an AUC of 0.926, an accuracy of 0.914, and an F1 score of 0.889. Its calibration curve and DCA showed good performance. SHAP algorithm showed that ADL score ranked first in importance. ConclusionThe model constructed using XGBoost has good prediction performance and clinical applicability, which is expected to support clinical decision-making and improve the prognosis of patients.
Autores: Ting Wang, C. Li, J. Yuan, L. Yuan, M. You
Última actualización: 2024-10-29 00:00:00
Idioma: English
Fuente URL: https://www.medrxiv.org/content/10.1101/2024.10.27.24316222
Fuente PDF: https://www.medrxiv.org/content/10.1101/2024.10.27.24316222.full.pdf
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a medrxiv por el uso de su interoperabilidad de acceso abierto.