Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Ciencias de la Salud# Epidemiología

Mejorando las Predicciones de Hospitalización por Gripe

Nuevos métodos mejoran la precisión en la predicción de hospitalizaciones relacionadas con la gripe.

― 9 minilectura


Avances en la PredicciónAvances en la Predicciónde la Gripegripe.predicciones de hospitalizaciones porNuevas estrategias mejoran las
Tabla de contenidos

La influenza, comúnmente conocida como gripe, es una infección viral que afecta el sistema respiratorio. Esta infección ha existido durante muchos siglos, pero sigue siendo un problema serio para la salud pública en todo el mundo. Cada año, la gripe causa muchas Hospitalizaciones y muertes. En Estados Unidos, por ejemplo, las hospitalizaciones relacionadas con la gripe pueden variar bastante, alcanzando entre 100,000 y 700,000, con muertes que oscilan entre 5,000 y 50,000 anualmente.

Tener pronósticos precisos y a tiempo de la actividad de la gripe puede ayudar a las agencias de salud, hospitales, empresas y al público en general a prepararse mejor para la temporada de gripe. Sin embargo, predecir las tendencias de la gripe puede ser complicado porque los patrones de los brotes son impredecibles y los datos históricos suelen ser limitados.

Avances en la Predicción de la Influenza

En los últimos años, la ciencia de la predicción de la influenza ha avanzado mucho. Los investigadores ahora combinan varias fuentes de datos y métodos para predecir la actividad de la gripe de manera más precisa a nivel estatal. Hay muchas técnicas estadísticas efectivas que se utilizan para esto, como modelos de regresión y métodos autoregresivos. Los investigadores también han empleado técnicas más nuevas de aprendizaje automático para mejorar las predicciones.

Un gran aporte a este campo han sido los desafíos de FluSight organizados por los Centros para el Control y la Prevención de Enfermedades (CDC). Desde 2013, estos desafíos han motivado a los científicos a desarrollar y probar modelos de predicción en tiempo real. Mientras que los desafíos anteriores se centraron en predecir la actividad general de la gripe, los recientes se han enfocado más en predecir hospitalizaciones debido a la gripe. Este cambio surge del reconocimiento de que las tasas de hospitalización son más relevantes para los funcionarios de salud que intentan gestionar recursos de manera efectiva.

Datos Limitados y Sus Desafíos

Un gran desafío en la predicción de las hospitalizaciones por gripe es que antes de 2020, los datos consistentes sobre hospitalizaciones solo estaban disponibles en un puñado de estados. Con el reciente enfoque en los datos de hospitalización, solo hay dos temporadas de gripe (2020-21 y 2021-22) donde hay información completa de hospitalización disponible para todos los estados. Además, la pandemia de COVID-19 impactó las tendencias de hospitalización por gripe, haciendo aún más difícil reunir datos útiles para las predicciones.

Los datos limitados presentan desafíos para entrenar modelos de predicción, especialmente para enfoques avanzados de aprendizaje automático que requieren grandes cantidades de datos. Los modelos estadísticos tradicionales pueden funcionar con menos datos, pero su precisión puede disminuir cuando no hay suficiente información para ajustarlos.

Otro obstáculo es la necesidad de producir pronósticos en tiempo real rápidamente. Durante el inicio de la temporada de gripe 2022-23, los investigadores tuvieron menos de dos semanas para preparar sus pronósticos, lo que no fue suficiente tiempo para abordar adecuadamente el problema de la escasez de datos. Además, las inconsistencias en la presentación de datos y las diferencias en la calidad de los datos entre regiones complican las cosas para quienes intentan crear pronósticos confiables.

Un Nuevo Enfoque para la Predicción

Para abordar los problemas de datos limitados y la necesidad de predicciones precisas, los investigadores desarrollaron un nuevo método. Usaron aprendizaje por transferencia, una técnica donde el conocimiento adquirido de un área se aplica a otra. Al hacer esto, crearon una estrategia para mejorar los datos utilizando información histórica sobre enfermedades similares a la influenza (ILI) en los Estados Unidos.

Los investigadores primero construyeron un modelo para analizar las hospitalizaciones pasadas por gripe utilizando datos de ILI, lo que ayudó a crear un conjunto de datos más grande al estimar hospitalizaciones basadas en tendencias de una década de datos de ILI disponibles. Este conjunto de datos enriquecido hizo posible usar datos de todos los estados, excepto Florida y Puerto Rico, para predecir hospitalizaciones a pesar de la escasez de datos directos de hospitalización. Este enfoque de aprendizaje por transferencia permitió entrenar y ajustar modelos avanzados de aprendizaje automático que podían predecir con precisión las hospitalizaciones por gripe.

Métodos Utilizados en la Predicción

Recolección de Datos

Los datos de hospitalizaciones por gripe provienen de varias fuentes. El CDC mantiene una base de datos que rastrea el número de hospitalizaciones vinculadas a la influenza. Esta información es crucial para crear pronósticos precisos. Otra fuente clave de datos fue la Red de Vigilancia de Enfermedades Similares a la Influenza, que recopila información de proveedores de salud sobre pacientes que muestran síntomas de gripe.

Aumento de Datos

Para abordar las limitaciones de datos, los investigadores desarrollaron un método para extender los datos de hospitalización disponibles utilizando información de ILI. Crearon un modelo para mapear datos históricos de ILI a hospitalizaciones. Este proceso involucró estandarizar los datos para asegurar consistencia y fiabilidad. Los investigadores encontraron que analizar datos combinados de estados con datos completos de hospitalización produjo mejores resultados que intentar analizar cada estado por separado.

Después de desarrollar el modelo, crearon una serie temporal extendida de datos de hospitalización, que luego se fusionó con datos de hospitalización reales para formar un conjunto de datos continuo que comienza en 2012. Este paso fue crucial para generar un conjunto de datos completo útil para entrenar modelos de predicción.

Modelos de Predicción

Para crear pronósticos sólidos, los investigadores emplearon varios modelos para predecir hospitalizaciones por gripe. Estos incluyeron métodos estadísticos estándar como ARIMA y regresión vectorial autoregulada (VAR), junto con modelos de aprendizaje automático como LightGBM. Durante el proceso de predicción, ajustaron los modelos según el rendimiento reciente y refinaron continuamente sus predicciones.

Para las temporadas 2022-23 y 2023-24, los investigadores usaron diferentes combinaciones de estos modelos. Desarrollaron métodos para crear pronósticos de hasta cuatro semanas de anticipación en la temporada 2022-23 y hasta cinco semanas en la siguiente. Esta flexibilidad permitió actualizaciones oportunas de los pronósticos a medida que se disponía de nuevos datos.

Validación del Modelo y Rendimiento

Los investigadores probaron rigurosamente sus modelos de predicción para asegurar precisión. Sus modelos participaron en el desafío FluSight del CDC, donde quedaron cuartos en la primera temporada y segundos en la siguiente. Esta validación demostró cuán efectivo fue su enfoque para crear pronósticos confiables.

Compararon el rendimiento de sus modelos de datos aumentados con aquellos que usaron datos originales, encontrando que los modelos entrenados con conjuntos de datos extendidos tuvieron un rendimiento significativamente mejor. La combinación de aumento de datos y métodos de modelado avanzados fue crucial para lograr pronósticos más precisos de hospitalizaciones.

Evaluación de la Precisión del Modelo

Para evaluar la efectividad de sus modelos de predicción, los investigadores calcularon errores de pronóstico y compararon sus predicciones con los datos reales de hospitalización. Sus hallazgos indicaron que sus modelos aumentados podían capturar efectivamente el timing de las temporadas de gripe y las tendencias, aunque todavía había discrepancias en predecir con precisión los valores máximos de hospitalización.

Por ejemplo, mientras que sus pronósticos se alinearon estrechamente con los datos reales durante períodos típicos de gripe, hubo instancias donde subestimaron los picos. Esto subrayó la necesidad de mejorar continuamente sus técnicas de aumento de datos para afinar aún más los modelos.

Descubrimientos Clave y Desafíos

La investigación brindó información valiosa. Primero, tener una mejor calidad y disponibilidad de datos jugó un papel significativo en mejorar el rendimiento de los modelos. El enfoque de aumento de datos permitió a los investigadores utilizar información histórica para crear un conjunto de datos más rico para entrenar modelos, lo cual fue esencial para pronósticos precisos.

Sin embargo, siguieron existiendo desafíos. Los investigadores reconocieron que su método para estimar los picos de volumen de hospitalización necesitaba mejoras. Había una tendencia sistemática a subestimar estos valores máximos, lo que apuntaba a la necesidad de refinar sus métodos de recolección de datos e integrar fuentes de datos adicionales.

Direcciones Futuras en la Predicción de Influenza

Mirando hacia el futuro, los investigadores destacaron varias áreas para la exploración futura. Hay potencial para mejorar los métodos de aumento de datos, incorporando diversos tipos de datos para mejorar la precisión en la estimación de curvas de hospitalización. Fuentes de datos en tiempo real, como tendencias en redes sociales y consultas de búsqueda, también podrían mejorar las capacidades predictivas para las hospitalizaciones.

Además, aunque sus métodos demostraron ser efectivos para predecir la gripe, sería importante evaluar si estos enfoques podrían aplicarse a otras enfermedades infecciosas. Además, desarrollar modelos que incorporen múltiples flujos de datos y diferentes marcos temporales podría fortalecer la resiliencia de los esfuerzos de predicción en escenarios donde los datos son escasos.

Por último, con los recientes avances en técnicas de aprendizaje automático, existe una oportunidad para refinar modelos diseñados específicamente para virus respiratorios. Esto podría mejorar significativamente las capacidades predictivas para las tendencias de salud subyacentes.

Conclusión

Predecir con precisión las hospitalizaciones por influenza es esencial para la preparación de la salud pública y la asignación de recursos. La integración de técnicas de modelado avanzadas, métodos estadísticos y estrategias de aumento de datos demuestra un potencial prometedor para mejorar los esfuerzos de predicción de la gripe. Aunque el enfoque ha mostrado eficacia, la investigación continua es crucial para mejorar aún más los métodos y abordar las brechas existentes en la precisión de las predicciones. Al continuar desarrollando estas técnicas, los investigadores pueden contribuir a mejores respuestas de salud pública ante brotes de influenza y potencialmente otras enfermedades infecciosas también.

Fuente original

Título: A prospective real-time transfer learning approach to estimate Influenza hospitalizations with limited data.

Resumen: Accurate, real-time forecasts of influenza hospitalizations would facilitate prospective resource allocation and public health preparedness. State-of-the-art machine learning methods are a promising approach to produce such forecasts, but they require extensive historical data to be properly trained. Unfortunately, historically observed data of influenza hospitalizations, for the 50 states in the United States, are only available since the beginning of 2020, as their collection was motivated and enabled by the COVID-19 pandemic. In addition, the data are far from perfect as they were under-reported for several months before health systems began consistently and reliably submitting their data. To address these issues, we propose a transfer learning approach to perform data augmentation. We extend the currently available two-season dataset for state-level influenza hospitalizations in the US by an additional ten seasons. Our method leverages influenza-like illness (ILI) surveillance data to infer historical estimates of influenza hospitalizations. This cross-domain data augmentation enables the implementation of advanced machine learning techniques, multi-horizon training, and an ensemble of models for forecasting using the ILI training data set, improving hospitalization forecasts. We evaluated the performance of our machine learning approaches by prospectively producing forecasts for future weeks and submitting them in real time to the Centers for Disease Control and Prevention FluSight challenges during two seasons: 2022-2023 and 2023-2024. Our methodology demonstrated good accuracy and reliability, achieving a fourth place finish (among 20 participating teams) in the 2022-23 and a second place finish (among 20 participating teams) in the 2023-24 CDC FluSight challenges. Our findings highlight the utility of data augmentation and knowledge transfer in the application of machine learning models to public health surveillance where only limited historical data is available. Author summaryInfluenza is a major public health concern in the United States, causing thousands of hospitalizations annually. Accurate and timely forecasts of hospitalization rates are essential for effective public health preparedness. However, limited historical data makes forecasting with state-of-the-art models challenging. To address this issue, we developed a cross-domain data augmentation method that allowed us to train advanced machine learning models using symptom-based (syndromic) surveillance data. We then created a set of models, focusing on gradient-boosted machines, and combined them into an ensemble framework. This approach successfully overcame data limitations, outperforming the majority of teams participating in the CDC FluSight project for 2022-23 and 2023-24. Additionally, our forecasts demonstrated superior accuracy to the CDCs composite model in the 2022-23 season and matched its performance in 2023-24. Our study demonstrates a robust and data-efficient strategy for training machine learning models for use in public health forecasting.

Autores: Austin G Meyer, F. Lu, L. Clemente, M. Santillana

Última actualización: 2024-07-18 00:00:00

Idioma: English

Fuente URL: https://www.medrxiv.org/content/10.1101/2024.07.17.24310565

Fuente PDF: https://www.medrxiv.org/content/10.1101/2024.07.17.24310565.full.pdf

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a medrxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares