Faltan datos en los EHR: Perspectivas de COVID-19
Un estudio revela conexiones entre los datos de laboratorio faltantes y los resultados de los pacientes durante la pandemia.
― 9 minilectura
Tabla de contenidos
Los Registros de Salud Electrónicos (EHRs) son versiones digitales de los historiales médicos en papel de los pacientes. Se han utilizado en hospitales principalmente para la facturación y la gestión de operaciones de salud. Sin embargo, recientemente, los datos de los EHR se están usando para aprender más sobre los resultados de los pacientes, rastrear enfermedades y verificar qué tan bien están funcionando los tratamientos. Durante la pandemia de COVID-19, los investigadores han utilizado los EHR para estudiar el nuevo Coronavirus, también conocido como SARS-CoV-2.
A pesar de su utilidad, analizar los EHR presenta desafíos. Estos registros a menudo necesitan mucha preparación para producir un conjunto de datos limpio que muestre detalles claros sobre la salud de un paciente. Por ejemplo, los EHR pueden tener diferentes formatos, llevar a sesgos en cómo se recopilan los datos y pueden incluir errores en los diagnósticos. También hay un problema con los sistemas de EHR que no son compatibles entre sí. Además, algunas áreas u hospitales pueden no tener la tecnología o los fondos para usar los EHR de manera efectiva. Un problema significativo que se informa a menudo es la falta de datos: información que debería haberse recopilado pero no se hizo.
La falta de datos no siempre significa que la atención fue insuficiente. Por ejemplo, en pacientes hospitalizados, las pruebas de laboratorio a menudo se realizan de forma regular, pero la frecuencia puede depender de qué tan grave sea la condición del paciente. Los pacientes con problemas más serios son monitoreados más de cerca, lo que podría conducir a menos resultados de pruebas faltantes, mientras que aquellos con casos menos graves pueden tener más vacíos en sus datos.
Ciertos patrones de Datos faltantes pueden contarnos cosas importantes. Si un grupo de pruebas a menudo se omite junto, podría indicar enfermedades específicas que se están monitoreando. Si las pruebas de laboratorio que normalmente están desconectadas comienzan a mostrar falta de datos juntas, puede significar que ha aparecido un nuevo problema, como una infección. Estos patrones de datos faltantes también pueden ayudar a identificar problemas de salud existentes y rastrear cómo les va a los pacientes hospitalizados.
La investigación ha demostrado que tener en cuenta los datos faltantes puede ayudar a mejorar los modelos que predicen los resultados de los pacientes. Por ejemplo, algunos estudios han investigado cómo los datos faltantes pueden ser usados para entender mejor enfermedades a largo plazo y otras condiciones de salud.
Durante la pandemia, los médicos aprendieron más sobre cómo manejar el COVID-19, y los cambios de 2020 a 2021 pueden reflejar nuevas formas de entender y tratar la enfermedad. La información sobre otros problemas de salud de los pacientes y las prácticas de monitoreo es crucial para mejorar la atención y reducir la presión sobre el sistema de salud. Esta investigación tiene como objetivo mirar los datos faltantes durante la pandemia para entender mejor a los pacientes a largo plazo, particularmente aquellos con problemas respiratorios severos, y evaluar riesgos como la Mortalidad a 90 días en estos pacientes.
Detalles del Estudio
Este estudio observa a pacientes en hospitales y fue aprobado por los comités de revisión apropiados. Se recopilaron datos de hospitales en Pennsylvania que formaban parte de un grupo de investigación clínica sobre COVID-19. Los hospitales tenían casi 2,500 camas y trataban a más de 100,000 pacientes al año. Para ser parte de este estudio, los pacientes debían dar positivo por COVID-19 y permanecer en el hospital al menos 14 días. Solo se analizó la información de su primera visita al hospital, centrándose en 16 pruebas de laboratorio específicas que se han relacionado con malos resultados en pacientes con COVID-19.
Dado que el estudio incluye solo a pacientes hospitalizados a largo plazo, los individuos mayores, especialmente los de más de 70 años, tenían menos probabilidades de ser incluidos. Esto se debe a que los pacientes mayores con COVID-19 severo a menudo tienen menos probabilidades de recuperarse lo suficiente como para estar en el hospital durante 14 días.
En esta investigación, los datos faltantes se definen como no haber realizado una prueba de laboratorio en un día específico. La cantidad de datos faltantes se calcula en función de con qué frecuencia no se realizó la prueba. Es importante destacar que estos datos faltantes no significan necesariamente que se haya brindado una mala atención. Algunas pruebas pueden realizarse de rutina cada pocos días, lo que puede crear grandes cantidades de datos faltantes cuando se ven a lo largo del tiempo.
Los investigadores definieron dos períodos de tiempo para observar a los pacientes: Fase 1 (2020) y Fase 2 (2021). Solo observaron los primeros 14 días de la estadía de los pacientes en el hospital para asegurar una comparación justa al estudiar los datos faltantes.
Encontrando Patrones en Resultados de Laboratorio
Al principio, los investigadores buscaron entender las relaciones entre los resultados de laboratorio basados en patrones de datos faltantes. El objetivo era agrupar pruebas que mostraran una falta similar de datos para simplificar el análisis. Para hacer esto, se utilizó un enfoque estadístico conocido como Asignación de Dirichlet Latente (LDA). Este método se aplica típicamente a datos textuales, pero aquí se utilizó para resultados de laboratorio.
El análisis tenía como objetivo encontrar grupos de pruebas de laboratorio que a menudo faltaban juntas. Usando este método, los investigadores identificaron temas basados en los patrones de datos faltantes. Crearon diferentes modelos para 2020 y 2021, evaluando cuál número de temas proporcionaba la mejor comprensión de los datos.
Al observar los datos de probabilidad de laboratorio, los investigadores pudieron evaluar cómo estaban relacionadas las pruebas. Si dos pruebas mostraban consistentemente altas probabilidades de estar ausentes juntas, indicaba que podrían estar vinculadas.
A partir de este análisis, los investigadores identificaron grupos de pruebas de laboratorio que son biológicamente significativos. Estos grupos incluían pruebas relacionadas con inflamación, infecciones, función renal y función hepática, que mostraron patrones en los datos faltantes durante los dos años. También notaron algunas pruebas de laboratorio independientes que no encajaban en estos grupos, como la Protrombina.
Relacionando Datos de Pruebas Faltantes con Condiciones del Paciente
El equipo de investigación estaba particularmente interesado en si los datos de pruebas de laboratorio faltantes podrían relacionarse con el síndrome de distrés respiratorio agudo (SDRA). El SDRA es una condición pulmonar grave que puede ocurrir en pacientes con COVID-19. Usando los resultados de su análisis anterior, calcularon puntuaciones de falta de datos para cada grupo y prueba de laboratorio para ver cómo estas puntuaciones se relacionaban con el SDRA.
Se consideraba que un paciente tenía SDRA según códigos de diagnóstico específicos. Para asegurar que sus hallazgos fueran confiables, los investigadores utilizaron métodos estadísticos para tener en cuenta factores como la edad, la raza y las condiciones de salud existentes. Esto ayudó a reducir los efectos de los datos faltantes.
En 2020, tener SDRA se relacionó con menos datos faltantes en casi todas las pruebas de laboratorio, excepto en las pruebas relacionadas con infecciones y riñones. Para 2021, la relación cambió y más datos faltantes en pruebas relacionadas con riñones se volvieron significativos para los pacientes con SDRA.
Examinando Tasas de Mortalidad Entre los Pacientes
Los investigadores tenían como objetivo determinar si podían usar datos de pruebas de laboratorio faltantes para predecir resultados, particularmente la mortalidad a 90 días en pacientes con SDRA. Un paciente se marcaba como que había experimentado mortalidad a 90 días si moría dentro de los tres meses de su estadía en el hospital.
Una vez más, los investigadores observaron si la falta de ciertos tests de laboratorio estaba relacionada con la mortalidad. En 2020, no encontraron conexiones fuertes. Sin embargo, en 2021, tener más datos faltantes en pruebas relacionadas con el hígado parecía correlacionarse con un mayor riesgo de mortalidad.
También observaron algunos patrones respecto a los niveles de Protrombina y procalcitonina, aunque los resultados eran menos significativos. Encontraron que más pacientes que sobrevivieron 90 días tenían un historial de eventos trombóticos.
A través de esta investigación, el equipo enfatizó la importancia de monitorear los datos faltantes de laboratorio para los pacientes con SDRA. Podría proporcionar mejores resultados si se monitorean de cerca las pruebas de función hepática y otros laboratorios relevantes. Sin embargo, reconocieron la necesidad de un análisis adicional con tamaños de muestra más grandes para confirmar las tendencias observadas.
Limitaciones y Direcciones Futuras
Este estudio tiene algunas limitaciones. El requisito de estadías largas en el hospital puede haber sesgado a la población de pacientes. Aquellos que sobreviven lo suficiente como para ser incluidos pueden no representar al grupo más amplio de pacientes con COVID-19.
Otra limitación es el marco temporal del estudio. Tener datos más recientes podría arrojar luz sobre cómo los datos faltantes se relacionan con el SDRA y predecir la mortalidad. Además, el pequeño número de pacientes con SDRA en el estudio podría limitar la importancia de los hallazgos.
Los investigadores expresaron interés en integrar datos de otros hospitales para ampliar su análisis. Planean explorar años adicionales y examinar más condiciones de salud que puedan coocurrir con el COVID-19.
En conclusión, el estudio destaca las conexiones entre los datos faltantes en pruebas de laboratorio y los resultados de los pacientes durante la pandemia de COVID-19. Al agrupar resultados de laboratorio y examinar sus relaciones, los investigadores esperan obtener información que podría mejorar la atención e informar futuras investigaciones. Entender cómo usar los datos faltantes podría desempeñar un papel significativo en la mejora de la gestión de la atención al paciente en el futuro.
Título: Leveraging informative missing data to learn about acute respiratory distress syndrome and mortality in long-term hospitalized COVID-19 patients throughout the years of the pandemic
Resumen: Electronic health records (EHRs) contain a wealth of information that can be used to further precision health. One particular data element in EHRs that is not only under-utilized but oftentimes unaccounted for is missing data. However, missingness can provide valuable information about comorbidities and best practices for monitoring patients, which could save lives and reduce burden on the healthcare system. We characterize patterns of missing data in laboratory measurements collected at the University of Pennsylvania Hospital System from long-term COVID-19 patients and focus on the changes in these patterns between 2020 and 2021. We investigate how these patterns are associated with comorbidities such as acute respiratory distress syndrome (ARDS), and 90-day mortality in ARDS patients. This work displays how knowledge and experience can change the way clinicians and hospitals manage a novel disease. It can also provide insight into best practices when it comes to patient monitoring to improve outcomes.
Autores: Emily J Getzen, A. L. Tan, G. Brat, G. S. Omenn, Z. Strasser, The Consortium for Clinical Characterization of COVID-19 by EHR (4CE), Q. Long, J. H. Holmes, D. Mowery
Última actualización: 2023-12-19 00:00:00
Idioma: English
Fuente URL: https://www.medrxiv.org/content/10.1101/2023.12.18.23300181
Fuente PDF: https://www.medrxiv.org/content/10.1101/2023.12.18.23300181.full.pdf
Licencia: https://creativecommons.org/licenses/by-nc/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a medrxiv por el uso de su interoperabilidad de acceso abierto.