Dados Faltando nos EHRs: Perspectivas da COVID-19
Estudo revela conexões entre dados laboratoriais faltantes e os resultados dos pacientes durante a pandemia.
― 8 min ler
Índice
Os Registros eletrônicos de saúde (EHRs) são versões digitais dos registros em papel dos pacientes. Eles têm sido usados em hospitais principalmente para cobrança e gerenciamento de operações de saúde. Recentemente, no entanto, os dados dos EHRs estão sendo utilizados para entender melhor os resultados dos pacientes, rastrear doenças e verificar como os tratamentos estão funcionando. Durante a pandemia de COVID-19, os pesquisadores usaram os EHRs para estudar o novo Coronavírus, também conhecido como SARS-CoV-2.
Apesar de serem úteis, analisar os EHRs traz desafios. Esses registros geralmente precisam de muita preparação para produzir um conjunto de dados limpo que mostre detalhes claros sobre a saúde do paciente. Por exemplo, os EHRs podem ter formatos diferentes, levar a viés na coleta de dados e podem incluir erros nos diagnósticos. Também rola um problema com os sistemas de EHR não sendo compatíveis entre si. Além disso, algumas áreas ou hospitais podem não ter a tecnologia ou financiamento necessários para usar os EHRs de forma eficaz. Um grande problema frequentemente relatado é a falta de dados – informações que deveriam ter sido coletadas, mas não foram.
Falta de dados não significa sempre que o atendimento foi deficiente. Por exemplo, em pacientes internados, exames laboratoriais são geralmente feitos regularmente, mas a frequência pode depender da gravidade da condição do paciente. Pacientes com problemas mais graves são monitorados mais de perto, o que pode resultar em menos resultados de exames faltando, enquanto aqueles com casos menos severos podem ter mais lacunas nos dados.
Certos padrões de falta de dados podem nos dizer coisas importantes. Se um grupo de exames é frequentemente ausente junto, pode indicar doenças específicas que estão sendo monitoradas. Se exames laboratoriais que geralmente não estão relacionados começam a mostrar faltas juntos, pode significar que um novo problema apareceu, como uma infecção. Esses padrões de dados ausentes também podem ajudar a identificar problemas de saúde existentes e acompanhar como os pacientes internados estão indo.
Pesquisas mostraram que considerar dados ausentes pode ajudar a melhorar modelos que previsem os resultados dos pacientes. Por exemplo, alguns estudos olharam como os dados ausentes podem ser usados para entender melhor doenças crônicas e outras condições de saúde.
Durante a pandemia, os médicos aprenderam mais sobre como gerenciar a COVID-19, e as mudanças de 2020 para 2021 podem refletir novas maneiras de entender e tratar a doença. Informações sobre outros problemas de saúde dos pacientes e práticas de monitoramento são cruciais para melhorar o atendimento e reduzir a pressão sobre o sistema de saúde. Essa pesquisa tem como objetivo olhar para os dados ausentes durante a pandemia para entender melhor os pacientes de longa duração, particularmente aqueles com problemas respiratórios graves, e avaliar riscos como Mortalidade em 90 dias nesses pacientes.
Detalhes do Estudo
Este estudo observa pacientes em hospitais e foi aprovado pelos conselhos de revisão apropriados. Os dados foram coletados de hospitais na Pensilvânia envolvidos em um grupo de pesquisa clínica sobre a COVID-19. Os hospitais tinham quase 2.500 leitos e tratavam mais de 100.000 pacientes anualmente. Para fazer parte deste estudo, os pacientes tinham que testar positivo para COVID-19 e ficar internados por pelo menos 14 dias. Apenas os dados da primeira visita ao hospital foram analisados, com foco em 16 testes laboratoriais específicos que foram ligados a resultados ruins em pacientes com COVID-19.
Como o estudo inclui apenas pacientes internados a longo prazo, indivíduos mais velhos, especialmente aqueles com mais de 70 anos, eram menos propensos a serem incluídos. Isso porque pacientes mais velhos com COVID-19 severa costumam ter menos chances de se recuperar o suficiente para ficar no hospital por 14 dias.
Nesta pesquisa, a falta de dados é definida como a não realização de um exame laboratorial em um dia específico. A quantidade de dados ausentes é calculada com base na frequência com que o exame não foi realizado. Importante ressaltar que essa falta de dados não significa necessariamente que o atendimento foi ruim. Alguns testes podem ser realizados rotineiramente a cada poucos dias, o que pode criar grandes quantidades de dados ausentes quando vistos ao longo do tempo.
Os pesquisadores definiram dois períodos de tempo para observar os pacientes: Fase 1 (2020) e Fase 2 (2021). Eles apenas olharam para os primeiros 14 dias de internação dos pacientes para garantir uma comparação justa ao estudar dados ausentes.
Encontrando Padrões em Resultados de Exames
Logo no começo, os pesquisadores buscaram entender as relações entre os resultados dos testes laboratoriais com base nos padrões de dados ausentes. O objetivo era agrupar os testes que mostraram similaridades na falta de dados para simplificar a análise. Para isso, foi utilizada uma abordagem estatística conhecida como Alocação Dirichlet Latente (LDA). Esse método é normalmente aplicado a dados textuais, mas aqui foi utilizado para resultados de exames.
A análise visava encontrar grupos de exames laboratoriais que frequentemente estavam ausentes juntos. Usando esse método, os pesquisadores identificaram tópicos com base nos padrões de dados ausentes. Eles criaram modelos diferentes para 2020 e 2021, avaliando qual número de tópicos proporcionou a melhor compreensão dos dados.
Ao olhar para os dados de probabilidade dos exames, os pesquisadores puderam avaliar como os testes estavam relacionados. Se dois testes mostravam constantemente altas probabilidades de estarem ausentes juntos, isso indicava que poderiam estar ligados.
A partir dessa análise, os pesquisadores identificaram agrupamentos de testes laboratoriais que têm significado biológico. Esses agrupamentos incluíram testes relacionados à inflamação, infecções, função renal e função hepática, que mostraram padrões de dados ausentes ao longo dos dois anos. Eles também notaram alguns testes laboratoriais isolados que não se encaixavam nesses agrupamentos, como o Prothrombin.
Ligando Dados de Testes Ausentes às Condições dos Pacientes
A equipe de pesquisa estava especialmente interessada em saber se os dados ausentes de testes laboratoriais poderiam se relacionar à síndrome do desconforto respiratório agudo (ARDS). ARDS é uma condição pulmonar séria que pode ocorrer em pacientes com COVID-19. Usando os resultados da análise anterior, calcularam escores de ausência para cada agrupamento e teste laboratorial para ver como esses escores se relacionavam à ARDS.
Um paciente era considerado com ARDS com base em códigos de diagnóstico específicos. Para garantir que suas descobertas fossem confiáveis, os pesquisadores usaram métodos estatísticos para levar em conta fatores como idade, raça e condições de saúde existentes. Isso ajudou a limitar os efeitos de dados ausentes.
Em 2020, ter ARDS estava relacionado a menos dados ausentes em quase todos os testes laboratoriais, exceto nos testes relacionados a infecções e rins. Em 2021, a relação mudou e mais dados ausentes em testes relacionados aos rins se tornaram significativos para pacientes com ARDS.
Examinando Taxas de Mortalidade entre Pacientes
Os pesquisadores queriam determinar se poderiam usar os dados ausentes de testes laboratoriais para prever resultados, particularmente a mortalidade em 90 dias em pacientes com ARDS. Um paciente era marcado como tendo experienciado mortalidade em 90 dias se morresse dentro de três meses após a internação.
Mais uma vez, os pesquisadores notaram se a falta de certos testes laboratoriais estava ligada à mortalidade. Em 2020, não encontraram conexões fortes. No entanto, em 2021, mais dados ausentes em testes relacionados ao fígado pareciam correlacionar-se com um risco maior de mortalidade.
Eles também observaram alguns padrões relacionados aos níveis de Prothrombin e procalcitonina, embora os resultados fossem menos significativos. Descobriram que mais pacientes que sobreviveram 90 dias tinham um histórico de eventos trombóticos.
Com essa pesquisa, a equipe enfatizou a importância de monitorar os dados ausentes de exames laboratoriais para pacientes com ARDS. Isso poderia proporcionar melhores resultados se os testes de função hepática e outros laboratórios relevantes forem monitorados de perto. No entanto, reconheceram a necessidade de uma análise mais profunda com tamanhos de amostra maiores para confirmar as tendências observadas.
Limitações e Direções Futuras
Esse estudo tem algumas limitações. A exigência de longas internações pode ter influenciado a população de pacientes. Aqueles que sobrevivem o suficiente para serem incluídos podem não representar o grupo mais amplo de pacientes com COVID-19.
Outra limitação é o período de tempo do estudo. Ter dados mais recentes poderia esclarecer como os dados ausentes se relacionam à ARDS e prever a mortalidade. Além disso, o pequeno número de pacientes com ARDS no estudo pode limitar a significância das descobertas.
Os pesquisadores expressaram interesse em integrar dados de outros hospitais para ampliar sua análise. Eles planejam explorar anos adicionais e examinar mais condições de saúde que podem ocorrer em conjunto com a COVID-19.
Em conclusão, o estudo destaca as conexões entre dados ausentes em testes laboratoriais e resultados dos pacientes durante a pandemia de COVID-19. Agrupando resultados de exames e examinando suas relações, os pesquisadores esperam obter insights que possam melhorar o atendimento e informar futuras pesquisas. Entender como usar dados ausentes pode desempenhar um papel significativo na melhoria do gerenciamento do atendimento ao paciente daqui pra frente.
Título: Leveraging informative missing data to learn about acute respiratory distress syndrome and mortality in long-term hospitalized COVID-19 patients throughout the years of the pandemic
Resumo: Electronic health records (EHRs) contain a wealth of information that can be used to further precision health. One particular data element in EHRs that is not only under-utilized but oftentimes unaccounted for is missing data. However, missingness can provide valuable information about comorbidities and best practices for monitoring patients, which could save lives and reduce burden on the healthcare system. We characterize patterns of missing data in laboratory measurements collected at the University of Pennsylvania Hospital System from long-term COVID-19 patients and focus on the changes in these patterns between 2020 and 2021. We investigate how these patterns are associated with comorbidities such as acute respiratory distress syndrome (ARDS), and 90-day mortality in ARDS patients. This work displays how knowledge and experience can change the way clinicians and hospitals manage a novel disease. It can also provide insight into best practices when it comes to patient monitoring to improve outcomes.
Autores: Emily J Getzen, A. L. Tan, G. Brat, G. S. Omenn, Z. Strasser, The Consortium for Clinical Characterization of COVID-19 by EHR (4CE), Q. Long, J. H. Holmes, D. Mowery
Última atualização: 2023-12-19 00:00:00
Idioma: English
Fonte URL: https://www.medrxiv.org/content/10.1101/2023.12.18.23300181
Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.12.18.23300181.full.pdf
Licença: https://creativecommons.org/licenses/by-nc/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.