Simple Science

Ciência de ponta explicada de forma simples

# Ciências da saúde# Salute pubblica e globale

Identificando Instabilidade Habitacional em Registros de Saúde

Estudo avalia LLMs para detectar instabilidade habitacional em anotações clínicas.

― 9 min ler


LLMs na Análise deLLMs na Análise deRegistros de Saúdedetecção de instabilidade habitacional.Avaliando o desempenho do modelo na
Índice

Muitos pacientes nos EUA têm suas informações de saúde salvas em registros eletrônicos. Uma parte importante dessas informações é sobre fatores sociais que afetam a saúde, como onde uma pessoa mora, seu trabalho, educação e condições de vida em geral. Esses fatores, conhecidos como Determinantes Sociais da Saúde (SDoH), podem ter um grande impacto nos Resultados de Saúde e influenciar o tratamento e o atendimento. Estudos sugerem que fatores sociais podem explicar até metade das diferenças de saúde entre diferentes grupos, enquanto o atendimento médico é responsável por bem menos.

A habitação é uma parte chave desse quadro. A situação de moradia de uma pessoa está intimamente ligada à sua saúde geral. Saber onde alguém mora e suas condições de vida passadas pode ajudar os prestadores de saúde a oferecer um atendimento melhor e mais justo. Essa informação também é crucial para pesquisas que analisam como as condições de vida afetam a saúde ao longo do tempo.

A estabilidade habitacional, que se refere a quão segura é a situação de moradia de alguém, existe em um espectro. De um lado, estão as pessoas com moradia estável, o que significa que têm lugares seguros e protegidos para viver sem ameaças. Do outro lado, estão aqueles com moradia instável, que podem não ter acesso a uma habitação decente. Pessoas enfrentando instabilidade habitacional têm mais chances de lidar com outros problemas de saúde, incluindo doenças mentais e abuso de substâncias. Elas também enfrentam um risco maior de se tornarem sem-teto, o que pode levar a sérios problemas de saúde e uma maior chance de problemas graves ou morte.

Indivíduos sem moradia estável costumam visitar departamentos de emergência com mais frequência, ficar mais tempo em hospitais se forem internados e usar serviços de saúde preventivos com menos frequência. Mulheres grávidas que enfrentam instabilidade habitacional enfrentam desafios únicos, precisando de cuidados médicos consistentes durante a gravidez. Condições de vida negativas antes e durante a gravidez podem prejudicar tanto a mãe quanto a criança, levando a riscos de saúde significativos.

Apesar da importância dos SDoH, essa informação raramente é bem registrada em registros eletrônicos de saúde. Isso gera desafios tanto para os prestadores de cuidados quanto para os pesquisadores que desejam melhorar o atendimento. Procurar esses dados manualmente é demorado e caro. Métodos padronizados para coletar e registrar SDoH nos registros de saúde ainda estão nos estágios iniciais de desenvolvimento.

Os métodos tradicionais para extrair esse tipo de informação de anotações dependem de identificar certas palavras-chave ou usar regras específicas. No entanto, esses métodos costumam gerar falsos positivos e não capturam a complexidade dos fatores sociais que afetam a saúde. Pesquisas anteriores se concentraram principalmente em conceitos básicos, como a falta de moradia, perdendo detalhes mais finos das situações habitacionais. Como a instabilidade habitacional pode ser complexa e variar muito de pessoa para pessoa, é mais desafiador categorizar com precisão do que comportamentos de saúde mais simples, como fumar.

Avanços recentes em tecnologia, especificamente modelos de linguagem de grande porte (LLMs), como o GPT da OpenAI, oferecem novas maneiras de analisar grandes quantidades de dados não estruturados. Esses modelos podem interpretar informações complexas usando solicitações simples. No entanto, pesquisas usando esses modelos para analisar registros de saúde ainda estão em andamento. Muitos estudos se concentraram em ajustar modelos para torná-los relevantes em contextos médicos ou comparar seu desempenho na identificação de SDoH. Também há uma necessidade de avaliar se o texto identificado por esses modelos corresponde à qualidade da avaliação humana e se surgem imprecisões.

Este estudo investiga se os LLMs podem identificar melhor a instabilidade habitacional em anotações clínicas em comparação com métodos tradicionais. Também procura sinais de viés em como os modelos se desempenham entre diferentes grupos demográficos e examina como seu desempenho varia com anotações desidentificadas, que protegem a privacidade do paciente.

Design e Configuração do Estudo

Neste estudo, focamos nos registros eletrônicos de saúde do Providence St Joseph Health (PSJH), um sistema de saúde comunitário nos EUA que atende áreas urbanas e rurais em vários estados. Revisamos registros de partos de junho de 2010 a maio de 2023. Incluímos registros de indivíduos grávidas com idades entre 18 e 44 anos e garantimos que as informações que analisamos estavam completas em relação a sua história de gravidez.

Para identificar pacientes vivendo em instabilidade habitacional, procuramos códigos específicos relacionados à habitação em suas anotações. Aqueles que não atendiam a esses critérios eram considerados em uma categoria separada.

Métodos e Coleta de Dados

Para definir vários níveis de estabilidade e instabilidade habitacional, consultamos uma variedade de especialistas, incluindo médicos e assistentes sociais. A partir dessas discussões, criamos diretrizes para rotular o status habitacional nas anotações clínicas.

Analisamos as anotações em duas rodadas para garantir consistência. Cada anotação foi rotulada como tendo moradia estável, atualmente instável, com histórico de instabilidade ou desconhecida com base nas informações presentes. Desacordos entre revisores foram resolvidos por consenso com uma terceira pessoa.

Todo o processamento foi feito dentro de um ambiente seguro na nuvem, e usamos modelos e métodos estabelecidos para rotular as anotações com termos relacionados à moradia.

Desempenho dos Métodos

Após analisar as anotações, encontramos uma variedade de informações sinalizadas como relacionadas à habitação. Calculamos métricas de desempenho para avaliar quão bem cada método identificou o status habitacional.

Comparamos os resultados dos LLMs com os de anotadores manuais e métodos tradicionais de palavras-chave. Notou-se que, enquanto a anotação manual era a mais precisa, ela exigia muito mais tempo. Em contrapartida, os LLMs forneceram análises mais rápidas com precisão razoavelmente boa.

Resultados

Muitas anotações sinalizadas pelos métodos mostraram padrões na identificação do status habitacional. A maioria das anotações que forneciam informações relevantes sobre moradia vinha de tipos específicos de documentação clínica, como notas de progresso ou notas de emergência.

Interessantemente, entre os indivíduos identificados como tendo problemas habitacionais, apenas uma pequena parte tinha códigos estruturados correspondentes em seus registros médicos. Isso indica que a documentação estruturada não captura detalhes suficientes sobre a situação de moradia de um paciente.

As Anotações Manuais mostraram um quadro mais claro de instabilidade habitacional do que qualquer outro método, mas o processo era intensivo em tempo. Os LLMs mostraram promessa em identificar casos de instabilidade habitacional rapidamente, embora com algumas inconsistências quando comparados a anotadores humanos.

Desafios com Anotações

Várias anotações eram complexas e difíceis de interpretar, levando a interpretações variadas entre os revisores. Por exemplo, frases vagas sobre a situação de vida atual de alguém poderiam levar a opiniões diferentes sobre se estavam estáveis ou enfrentando instabilidade.

A análise destacou que LLMs como o GPT-4 tiveram um desempenho melhor em certos cenários em comparação com o GPT-3.5 e métodos tradicionais. A nova versão mostrou uma melhor compreensão para distinguir entre instabilidade habitacional passada e atual.

Avaliação de LLMs e Viés

Também examinamos quão bem os modelos performaram entre diferentes grupos demográficos. Diferenças nas taxas de falso positivo e negativo foram observadas, mas na maioria das vezes, houve uma sobreposição suficiente, sugerindo que não há viés significativo. No entanto, estudos maiores seriam necessários para conclusões mais concretas.

Ao analisar anotações desidentificadas, descobrimos que a recuperação caiu, o que significa que os modelos tiveram mais dificuldades para identificar informações habitacionais relevantes sem o contexto original. A precisão melhorou levemente, indicando um desempenho melhor em menos anotações.

Considerações de Custo e Tempo

Analisar grandes volumes de anotações manualmente é tanto demorado quanto caro. Nossa análise mostrou como usar LLMs poderia economizar quantidades significativas de tempo e dinheiro ao processar grandes conjuntos de dados.

Ao considerar o custo de realizar essas análises em comparação com a despesa de anotação manual, os LLMs ofereceram uma opção muito mais econômica para revisar grandes quantidades de dados.

Conclusão

O potencial dos modelos de linguagem de grande porte para ajudar a identificar determinantes sociais da saúde, especificamente a instabilidade habitacional, é promissor. Eles podem ajudar a automatizar o processo de anotação enquanto mantêm um nível razoável de precisão.

Pesquisas futuras devem se concentrar em melhorar esses modelos para capturar melhor múltiplos aspectos da insegurança habitacional e garantir que os procedimentos de desidentificação não resultem em perda de informações contextuais. Maior acesso a esses dados pode ser crucial para aprimorar o atendimento ao paciente, melhorar os esforços de pesquisa e permitir que os prestadores de saúde cheguem mais efetivamente àqueles que precisam.

Ao enfrentar esses problemas, os prestadores de saúde podem trabalhar em direção a um atendimento mais equitativo para todos os pacientes, considerando os vários fatores sociais que desempenham um papel significativo nos resultados de saúde.

Fonte original

Título: Using Large Language Models to Annotate Complex Cases of SDoH in Longitudinal Clinical Records

Resumo: Social Determinants of Health (SDoH) are an important part of the exposome and are known to have a large impact on variation in health outcomes. In particular, housing stability is known to be intricately linked to a patients health status, and pregnant women experiencing housing instability (HI) are known to have worse health outcomes. Most SDoH information is stored in electronic health records (EHRs) as free text (unstructured) clinical notes, which traditionally required natural language processing (NLP) for automatic identification of relevant text or keywords. A patients housing status can be ambiguous or subjective, and can change from note to note or within the same note, making it difficult to use existing NLP solutions. New developments in NLP allow researchers to prompt LLMs to perform complex, subjective annotation tasks that require reasoning that previously could only be attempted by human annotators. For example, large language models (LLMs) such as GPT (Generative Pre-trained Transformer) enable researchers to analyze complex, unstructured data using simple prompts. We used a secure platform within a large healthcare system to compare the ability of GPT-3.5 and GPT-4 to identify instances of both current and past housing instability, as well as general housing status, from 25,217 notes from 795 pregnant women. Results from these LLMs were compared with results from manual annotation, a named entity recognition (NER) model, and regular expressions (RegEx). We developed a chain-of-thought prompt requiring evidence and justification for each note from the LLMs, to help maximize the chances of finding relevant text related to HI while minimizing hallucinations and false positives. Compared with GPT-3.5 and the NER model, GPT-4 had the highest performance and had a much higher recall (0.924) than human annotators (0.702) in identifying patients experiencing current or past housing instability, although precision was lower (0.850) compared with human annotators (0.971). In most cases, the evidence output by GPT-4 was similar or identical to that of human annotators, and there was no evidence of hallucinations in any of the outputs from GPT-4. Most cases where the annotators and GPT-4 differed were ambiguous or subjective, such as "living in an apartment with too many people". We also looked at GPT-4 performance on de-identified versions of the same notes and found that precision improved slightly (0.936 original, 0.939 de-identified), while recall dropped (0.781 original, 0.704 de-identified). This work demonstrates that, while manual annotation is likely to yield slightly more accurate results overall, LLMs, when compared with manual annotation, provide a scalable, cost-effective solution with the advantage of greater recall. At the same time, further evaluation is needed to address the risk of missed cases and bias in the initial selection of housing-related notes. Additionally, while it was possible to reduce confabulation, signs of unusual justifications remained. Given these factors, together with changes in both LLMs and charting over time, this approach is not yet appropriate for use as a fully-automated process. However, these results demonstrate the potential for using LLMs for computer-assisted annotation with human review, reducing cost and increasing recall. More efficient methods for obtaining structured SDoH data can help accelerate inclusion of exposome variables in biomedical research, and support healthcare systems in identifying patients who could benefit from proactive outreach.

Autores: Jennifer J Hadlock, A. Ralevski, A. Taiyab, M. Nossal, L. Mico, S. Piekos

Última atualização: 2024-04-27 00:00:00

Idioma: English

Fonte URL: https://www.medrxiv.org/content/10.1101/2024.04.25.24306380

Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.04.25.24306380.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes