Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões

Deep Learning Ajuda na Análise de Raio-X de Tórax

Um estudo mostra que ferramentas de deep learning podem melhorar as avaliações de raios-X do peito.

― 6 min ler


IA na Triagem de Raio-XIA na Triagem de Raio-Xde Tóraxe a eficiência de raios-X do tórax.Os algoritmos de IA melhoram a análise
Índice

Radiografias de tórax (CXRs) são um exame médico bem comum pra checar problemas de saúde na área do peito. No Reino Unido, o número de CXRs realizados tá aumentando, colocando pressão nos departamentos de radiologia. Tem uma necessidade de maneiras eficientes de gerenciar essa demanda crescente. Avanços recentes em tecnologia, principalmente em aprendizado profundo (DL), mostraram potencial pra ajudar a reduzir a carga de trabalho dos radiologistas.

Propósito do Estudo

Esse estudo tem como objetivo avaliar quão bem um programa de aprendizado profundo funciona na identificação de radiografias de tórax normais dentro dos NHS Trusts. O software foi feito pra ajudar os médicos a classificar rapidamente certas CXRs como normais, o que pode aliviar a pressão sobre os radiologistas.

Contexto

Entre abril de 2021 e abril de 2022, mais de 7,9 milhões de radiografias de tórax foram feitas no NHS, marcando um aumento significativo em comparação com anos anteriores. Os departamentos de radiologia estão sob muita pressão, já que mais pacientes aguardam tratamento. Em março de 2023, tinha 7,3 milhões de pacientes na lista de espera do NHS, o dobro do que era antes da pandemia.

Além disso, tem uma falta de radiologistas, o que dificulta o manejo do cuidado dos pacientes. O Royal College of Radiologists pediu mais investimento em tecnologia pra ajudar no diagnóstico e tratamento.

Algoritmo de Aprendizado Profundo

O algoritmo de aprendizado profundo usado nesse estudo é um programa de computador que analisa radiografias de tórax. Ele foi implementado em dois NHS trusts pra ajudar a identificar CXRs que provavelmente são normais. O software atribui pontuações a cada radiografia, ajudando a classificá-las. Se uma pontuação indica alta confiança de que a radiografia é normal, ela é rotulada como tal.

Esse programa específico tá funcionando no Somerset NHS Foundation Trust desde dezembro de 2022 e no Calderdale Huddersfield NHS Foundation Trust desde março de 2023.

Desenho do Estudo

O estudo envolveu 4.654 radiografias de tórax processadas pelo algoritmo de aprendizado profundo ao longo de seis semanas. O objetivo era ver quão efetivamente o programa podia marcar CXRs normais com uma taxa baixa de erros. Radiologistas auditores foram contratados pra revisar as radiografias identificadas como normais pela ferramenta de aprendizado profundo.

Resultados

O algoritmo de aprendizado profundo classificou 20% das radiografias avaliadas como normais com alta confiança (HCN). Ele alcançou um Valor Preditivo Negativo (NPV) de 0.96, indicando que era bem preciso. De todos os exames marcados como HCN, só uma pequena fração (0.77%) foi encontrada como incorretamente classificada.

O tempo médio pra receber os resultados do algoritmo foi de apenas 7,1 segundos, mostrando sua capacidade de resposta rápida e eficiência.

Impacto na Carga de Trabalho

Ao identificar corretamente as CXRs normais, o algoritmo de aprendizado profundo ajuda a reduzir o número de radiografias que os radiologistas precisam revisar. Isso permite que eles se concentrem mais em casos que podem precisar de exame ou intervenção adicional.

Entendendo a Normalidade

Pra garantir que o algoritmo funcione bem, foi usada uma definição específica do que é uma radiografia de tórax normal. Uma radiografia normal mostra imagens claras dos pulmões e do coração, sem sinais de anomalias. Se uma radiografia não atendesse a esses critérios, ela era classificada como anormal, mesmo que não fossem encontrados problemas significativos.

Processo de Revisão dos Auditores

Depois que o algoritmo processou as radiografias, radiologistas independentes revisaram os resultados. Eles tinham como objetivo confirmar as descobertas do algoritmo e identificar possíveis erros. O ciclo de feedback de revisar e verificar ajuda a construir confiança no desempenho do sistema.

Desempenho do Modelo em Diferentes Trusts

O desempenho do algoritmo de aprendizado profundo foi consistente em ambos os NHS Trusts envolvidos no estudo. No Somerset NHS Foundation Trust, o NPV foi de 0.96 com uma taxa de discrepância de 0.79%. No Calderdale Huddersfield NHS Trust, os resultados foram comparáveis, com uma taxa de discrepância de 0.76%. Isso sugere que o algoritmo funciona bem, independentemente da localização ou do equipamento específico usado.

Tipos de Discrepâncias

Embora o desempenho geral tenha sido forte, algumas discrepâncias foram notadas. O problema mais comum envolveu anomalias ósseas crônicas, como variações benignas das costelas ou fraturas antigas. Algumas radiografias foram classificadas como subótimas, significando que sua qualidade não era boa o suficiente pra determinar claramente a normalidade.

Altos Níveis de Serviço

Durante o estudo, o sistema manteve altos níveis de serviço. A grande maioria das radiografias foi auditada em até 24 horas, garantindo respostas rápidas pros clínicos. Essa resposta rápida aumenta a eficiência do processo de saúde e ajuda na tomada de decisões.

Combinando Tecnologia com Expertise Humana

O estudo ilustra a importância tanto da tecnologia quanto da expertise humana no diagnóstico médico. O algoritmo de aprendizado profundo lidou efetivamente com uma parte da carga de trabalho, mas ter radiologistas revisando os resultados foi crucial. Isso destaca a ideia de que a tecnologia deve complementar as habilidades humanas, e não substituí-las.

Equidade em Diferentes Cenários

O desempenho semelhante do algoritmo em diferentes locais indica que ele pode ser implantado efetivamente em diversos ambientes de saúde. Isso é crítico, pois mostra que pacientes de diferentes contextos podem se beneficiar do mesmo nível de suporte diagnóstico.

Direções Futuras

Pra coletar mais dados, os pesquisadores podem querer revisar todas as radiografias processadas, não apenas aquelas classificadas como HCN. Isso poderia fornecer métricas adicionais de desempenho e ajudar a comparar a precisão do algoritmo com a dos radiologistas humanos de forma mais abrangente.

Conclusão

Esse estudo demonstra o papel promissor de um algoritmo de aprendizado profundo na identificação de radiografias de tórax normais em um cenário real. Ele reduz efetivamente a carga de trabalho dos radiologistas enquanto mantém uma taxa de precisão alta. O programa foi implementado com sucesso em caminhos clínicos ativos, sugerindo que tais tecnologias podem ajudar a atender à crescente demanda nos sistemas de saúde.

No geral, as descobertas apoiam a integração de tecnologia avançada nas práticas médicas de rotina, abrindo caminho pra um cuidado ao paciente mais eficiente sem comprometer a qualidade. O estudo mostra que com as ferramentas e processos certos, a saúde pode se adaptar aos desafios enquanto otimiza recursos.

Fonte original

Título: Real-World Performance of Autonomously Reporting Normal Chest Radiographs in NHS Trusts Using a Deep-Learning Algorithm on the GP Pathway

Resumo: AIM To analyse the performance of a deep-learning (DL) algorithm currently deployed as diagnostic decision support software in two NHS Trusts used to identify normal chest x-rays in active clinical pathways. MATERIALS AND METHODS A DL algorithm has been deployed in Somerset NHS Foundation Trust (SFT) since December 2022, and at Calderdale & Huddersfield NHS Foundation Trust (CHFT) since March 2023. The algorithm was developed and trained prior to deployment, and is used to assign abnormality scores to each GP-requested chest x-ray (CXR). The algorithm classifies a subset of examinations with the lowest abnormality scores as High Confidence Normal (HCN), and displays this result to the Trust. This two-site study includes 4,654 CXR continuous examinations processed by the algorithm over a six-week period. RESULTS When classifying 20.0% of assessed examinations (930) as HCN, the model classified exams with a negative predictive value (NPV) of 0.96. There were 0.77% of examinations (36) classified incorrectly as HCN, with none of the abnormalities considered clinically significant by auditing radiologists. The DL software maintained fast levels of service to clinicians, with results returned to Trusts in a mean time of 7.1 seconds. CONCLUSION The DL algorithm performs with a low rate of error and is highly effective as an automated diagnostic decision support tool, used to autonomously report a subset of CXRs as normal with high confidence. Removing 20% of all CXRs reduces workload for reporters and allows radiology departments to focus resources elsewhere.

Autores: Jordan Smith, Tom Naunton Morgan, Paul Williams, Qaiser Malik, Simon Rasalingham

Última atualização: 2023-06-28 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2306.16115

Fonte PDF: https://arxiv.org/pdf/2306.16115

Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Artigos semelhantes