Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões

Melhorando a Detecção de Tuberculose com Tecnologia de IA

Novos métodos em IA mostram potencial para detectar TB cedo usando raios X do tórax.

― 6 min ler


Avanços da IA na DetecçãoAvanços da IA na Detecçãode TBtórax.tuberculose usando radiografias deMétodos de IA melhoram o diagnóstico de
Índice

Detectar tuberculose ativa (TB) cedo pode fazer toda a diferença, principalmente em países onde os recursos de saúde são limitados. Embora imagens de radiografias de tórax (CXR) ajudem a diagnosticar TB, muitas áreas têm falta de profissionais qualificados para interpretar essas imagens. Isso mostra a importância de usar tecnologia, especialmente programas de computador, para identificar automaticamente a TB nas imagens de raio-X.

Avanços recentes em inteligência artificial, especialmente em programas que ajudam na detecção, melhoraram muito a forma como as imagens de CXR são analisadas para detectar TB. Esses programas não só automatizam o processo, mas também conseguem identificar outras condições que podem não estar relacionadas à TB. A Organização Mundial da Saúde (OMS) até recomendou usar esses programas para substituir leitores humanos nas triagens para TB, principalmente em pessoas com 15 anos ou mais.

Porém, existem desafios ao usar esses programas de computador em ambientes médicos. Os algoritmos que movem esses programas costumam ser bem complexos, tornando suas decisões pouco claras. Essa falta de transparência dificulta a confiança dos trabalhadores da saúde nesses sistemas e a avaliação de quão bem eles funcionam. Uma maneira de melhorar essa situação é com técnicas de mapeamento de saliência, que destacam visualmente as áreas nas radiografias com que o programa está focando. Isso pode ajudar os médicos a fazer diagnósticos mais precisos mostrando o que o programa detectou.

O problema surge devido à quantidade limitada de conjuntos de dados bons e equilibrados necessários para treinar esses programas de computador de forma eficaz. Não há muitos conjuntos de dados disponíveis publicamente que contenham imagens de raio-X bem anotadas para treinamento, o que dificulta o desenvolvimento de modelos confiáveis. Em vez disso, existe um grande conjunto de dados chamado TBX11K, que tem mais de 11.000 imagens de raios-X que podem ser usadas. Porém, usar esse conjunto de dados sozinho não é o suficiente para desenvolver um programa que alinhe com o julgamento e entendimento humano.

Para lidar com esses problemas, os pesquisadores estão explorando o uso de conjuntos de dados maiores e relacionados para pré-treinar modelos que podem ser ajustados para tarefas específicas como detecção de TB. Um desses conjuntos de dados é o NIH-CXR14, que possui uma grande quantidade de imagens de CXR, mas com etiquetas que não são perfeitamente adequadas para TB. A ideia é que treinar nesse conjunto maior ajude a criar um modelo fundamental que possa se adaptar melhor aos menores conjuntos de dados de TB.

A abordagem também envolve equilibrar os dados de treinamento, o que significa garantir que haja uma representação igual de diferentes condições no conjunto de dados. Isso é importante porque desequilíbrios podem levar os modelos a se concentrarem em características incorretas que não estão realmente relacionadas à TB, resultando em previsões não confiáveis. Usando um método chamado rede de otimização de objetivos mistos (MOON), os pesquisadores podem garantir que o modelo aprenda de cada classe igualmente durante o treinamento.

A pesquisa busca descobrir se usar um conjunto de dados maior como o NIH-CXR14 para treinar modelos pode ajudar a produzir um sistema de detecção de TB confiável. Os pesquisadores acreditam que esse método não só melhorará a generalização dos modelos, mas também fará com que eles interpretem suas decisões de uma maneira que se alinha mais de perto com o raciocínio humano.

Para verificar isso, os pesquisadores realizam testes em diferentes modelos. Alguns são pré-treinados usando o conjunto de dados maior, e outros são treinados apenas no conjunto de dados de TB. Eles analisam como cada modelo se sai no conjunto de dados TBX11K e em um conjunto de dados secundário chamado Shenzhen.

Os resultados mostram que os modelos pré-treinados no conjunto de dados maior, embora não relacionado, geralmente apresentam um desempenho melhor quando avaliados no menor conjunto de dados de TB. Embora todos os modelos tenham alcançado alta precisão no conjunto de teste de treinamento, o verdadeiro teste veio quando foram avaliados no Conjunto de Dados Externo. Aqui, os modelos equilibrados se saíram significativamente melhor, mostrando que podiam generalizar seu aprendizado de forma mais eficaz.

Os mapas de saliência são então avaliados para verificar quão interpretáveis são os resultados dos modelos. Quanto mais equilibrado o treinamento, melhores esses mapas refletem as anotações humanas. Essa correlação permite uma melhor compreensão das áreas da radiografia que influenciaram a tomada de decisão do modelo, facilitando para os médicos confiarem na saída do modelo.

No geral, fica claro que treinar modelos de forma ingênua geralmente leva a sistemas que não são confiáveis. No entanto, pré-treinar essas redes em conjuntos de dados maiores ajuda a reduzir os vieses. Equilibrar as classes durante o treinamento também melhora quão de perto o raciocínio do modelo se alinha com a compreensão humana dos sinais de TB.

Embora os achados sejam promissores, ainda existem algumas limitações. Embora os modelos mostrem bom desempenho nos testes, ainda há preocupações sobre vieses residuais que podem afetar aplicações no mundo real. A interpretabilidade observada dos modelos, medida pelos mapas de saliência, também sugere que há espaço para melhorias.

Em conclusão, usar técnicas avançadas para treinar modelos de computador para detecção de TB é um passo à frente para melhorar a saúde, especialmente em áreas onde especialistas não estão facilmente disponíveis. Com conjuntos de dados confiáveis e métodos de treinamento pensativos, é possível criar modelos que ajudem os médicos a tomar melhores decisões com base em imagens de CXR. O desenvolvimento contínuo neste campo não só visa melhorar o diagnóstico de TB, mas também construir confiança no uso de IA em ambientes de saúde.

Fonte original

Título: Refining Tuberculosis Detection in CXR Imaging: Addressing Bias in Deep Neural Networks via Interpretability

Resumo: Automatic classification of active tuberculosis from chest X-ray images has the potential to save lives, especially in low- and mid-income countries where skilled human experts can be scarce. Given the lack of available labeled data to train such systems and the unbalanced nature of publicly available datasets, we argue that the reliability of deep learning models is limited, even if they can be shown to obtain perfect classification accuracy on the test data. One way of evaluating the reliability of such systems is to ensure that models use the same regions of input images for predictions as medical experts would. In this paper, we show that pre-training a deep neural network on a large-scale proxy task, as well as using mixed objective optimization network (MOON), a technique to balance different classes during pre-training and fine-tuning, can improve the alignment of decision foundations between models and experts, as compared to a model directly trained on the target dataset. At the same time, these approaches keep perfect classification accuracy according to the area under the receiver operating characteristic curve (AUROC) on the test set, and improve generalization on an independent, unseen dataset. For the purpose of reproducibility, our source code is made available online.

Autores: Özgür Acar Güler, Manuel Günther, André Anjos

Última atualização: 2024-10-08 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2407.14064

Fonte PDF: https://arxiv.org/pdf/2407.14064

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes