Simple Science

Ciência de ponta explicada de forma simples

# Ciências da saúde# Radiologia e diagnostica per immagini

Melhorando a Confiabilidade da IA em Imagens Médicas

Um novo método melhora a precisão da IA em diagnosticar condições médicas.

― 8 min ler


IA em Imagem MédicaIA em Imagem Médicaresultados de saúde melhores.Melhorando a precisão da IA pra
Índice

Modelos de IA usados em imagens médicas muitas vezes não têm o mesmo desempenho em hospitais reais do que nas testes iniciais. Esse problema geralmente acontece porque os novos dados podem ser diferentes do que a IA foi treinada. Fatores como idade, gênero e tipo de doença podem causar essas diferenças. Além disso, variações nas máquinas e processos usados podem levar a uma queda no desempenho. Às vezes, essa queda é imediata, e outras vezes aparece com o tempo. Quando esses modelos falham em dar resultados precisos, isso pode levar a consequências negativas para os pacientes e fazer com que os médicos confiem menos na tecnologia.

Problema da Generalização

O principal problema é que modelos de IA têm dificuldade em generalizar. Isso significa que eles não conseguem aplicar o que aprenderam com os dados de treinamento para novos dados de forma eficaz. Isso é uma preocupação significativa em ambientes médicos, pois pode levar a erros no diagnóstico das condições dos pacientes. Para qualquer ferramenta de IA ser usada de maneira segura e eficaz na saúde, ela deve ter um desempenho consistente, independentemente das diferenças nas populações de pacientes que atende.

Solução Proposta

Uma abordagem para lidar com isso é uma técnica chamada quantificação de incerteza (UQ). Essa estratégia envolve primeiro aprender com os dados iniciais e depois testar o modelo em novos dados. Usando dados de imagem recentes de uma instituição de saúde específica, podemos melhorar a confiabilidade da IA em vários cenários clínicos.

Nós categorizamos os pacientes em três grupos: baixo risco, alto risco e incerto. O grupo de baixo risco provavelmente será negativo para uma condição grave, enquanto o grupo de alto risco é mais provável de ser positivo. O grupo incerto fica no meio. Essa categorização é tradicionalmente feita por médicos experientes. No entanto, propomos que um algoritmo de aprendizado de máquina pode ajudar nessa classificação para aumentar a confiabilidade, oferecendo resultados mais controlados.

Chamamos esse método de triagem conformal, onde o algoritmo de IA toma decisões que vêm com garantias estatísticas. Ao contrário de outros métodos, a triagem conformal não precisa de re-treinamento do modelo e é robusta contra variações na distribuição dos dados, o que significa que pode manter seu desempenho mesmo quando as condições mudam.

Implementação da Triagem Conformal

O método de triagem conformal foi aplicado a um modelo de IA específico projetado para identificar sangramentos intracranianos em tomografias computadorizadas da cabeça. Embora esse modelo tenha sido treinado principalmente para detectar um problema, ele também mostrou a capacidade de identificar outras condições significativas do cérebro, como tumores, quando testado em dados do mundo real.

A IA fornece um escore de probabilidade para anomalias significativas detectadas por meio de TC, e usamos um conjunto de exames locais para garantir um alto desempenho preditivo. Usando métodos estatísticos, garantimos que os pacientes do grupo de alto risco receberão um diagnóstico positivo com a taxa esperada de precisão. Da mesma forma, pacientes do grupo de baixo risco têm alta probabilidade de serem negativos.

Se a IA estiver incerta sobre um caso, ela pode optar por não fazer uma previsão. O número desses casos incertos depende da rigorosidade dos níveis de precisão definidos para ambos os grupos de risco. Esse método permite transferir a confiabilidade do modelo para novos grupos de pacientes enquanto mantém uma base estatística sólida.

Benefícios para o Fluxo de Trabalho Médico

Esse método pode ajudar bastante os Radiologistas, auxiliando-os a priorizar quais casos revisar primeiro. Focando em casos que têm mais probabilidade de apresentar resultados sérios, os hospitais podem melhorar sua eficiência e o cuidado com os pacientes. Processos mais ágeis não só melhoram os resultados dos pacientes, mas também podem reduzir o tempo que os pacientes esperam por diagnóstico e tratamento.

Abordagem Inédita

Essa abordagem de usar classificação seletiva em IA médica é nova. Mostra como podemos fazer previsões confiáveis aplicando raciocínio estatístico para melhorar o desempenho da IA na saúde. Ao contrário dos modelos de previsão existentes, nosso método pode fornecer resultados claros para a tomada de decisões médicas.

Ao realizar testes usando dados reais de hospitais, validamos nossos procedimentos. Essa é a primeira vez que tal abordagem foi aplicada a imagens médicas reais fora de condições controladas.

Avaliando o Desempenho

Normalmente, em tarefas de classificação binária, o objetivo é equilibrar duas medições conhecidas como Valor Preditivo Positivo (VPP) e Valor Preditivo Negativo (VPN). Nosso método, no entanto, permite que configuremos ambas as medições sem precisar comprometer uma em relação à outra.

Se um hospital tiver um conjunto representativo de dados de imagem anteriores, podemos prometer que os níveis de desempenho tanto para o VPP quanto para o VPN não cairão abaixo de certos limites. Isso é particularmente útil para hospitais que podem ter demografias de pacientes em mudança ou condições de saúde variadas.

Dados Usados para Experimentos

Testamos nosso método em dois conjuntos de exames de TC da cabeça com dados reais de pacientes. O primeiro conjunto consistiu em exames que foram meticulosamente verificados por um radiologista altamente experiente. O segundo conjunto incluiu um número maior de exames que foram inicialmente processados por um programa de computador e depois verificados por outro radiologista experiente.

Esses dois conjuntos de dados oferecem uma mistura de dados de muito alta qualidade e dados típicos de hospital, refletindo a variabilidade na imagem médica. Nossos experimentos empregaram diferentes técnicas de regressão para refinar as previsões do modelo.

Comparando o Desempenho com Métodos Existentes

Nós avaliamos nosso método em comparação a uma estratégia de limite tradicional desenvolvida por radiologistas especialistas. A diferença ficou clara quando comparamos como nosso método de IA se saiu em relação às regras desenhadas manualmente usadas no passado.

Nossa abordagem não apenas igualou o desempenho de referência, mas muitas vezes o superou, especialmente ao considerar diferentes condições e populações de pacientes. Enquanto os limites desenhados por humanos funcionam bem em situações específicas, eles podem não se sair bem de forma consistente em diferentes grupos de pacientes.

Em contrapartida, nossa abordagem de IA permitiu flexibilidade e repetibilidade adaptadas a várias situações, o que é crucial em um cenário de saúde que muda rapidamente.

Resultados em Diferentes Cenários

Nossos achados indicaram que a triagem conformal alinhou efetivamente o desempenho do modelo de IA com os exames de pacientes atuais. Isso significa que a IA poderia oferecer altos níveis de VPP e VPN sem precisar passar por treinamento adicional, garantindo que o número de casos incertos permanecesse em níveis aceitáveis.

Em nossos testes, definimos nossas metas de desempenho tanto para VPP quanto para VPN em níveis altos, e os resultados demonstraram que poderíamos alcançar essas metas enquanto mantínhamos um número razoável de casos onde o modelo optou por não prever.

Avaliando as Taxas de Risco

Para entender como conseguimos identificar casos positivos e negativos de forma eficaz, analisamos as taxas de verdadeiros positivos e verdadeiros negativos. Isso nos ajuda a ver a troca entre quantas previsões são feitas e quantas são precisas.

Como esperado, aumentar o número de casos não previstos tende a melhorar a precisão das classificações positivas, enquanto potencialmente reduz a cobertura sobre os positivos reais. Essas dinâmicas são importantes para manter uma visão equilibrada das capacidades da IA e entender seu desempenho em diversos cenários clínicos.

Conclusão

Ao aplicar a triagem conformal, estamos introduzindo uma nova metodologia para melhorar a IA em imagens médicas. Esse método proporciona uma base sólida para tomada de decisões precisas em ambientes clínicos diversos.

Os prestadores de saúde agora podem contar com ferramentas de IA que oferecem garantias sobre suas capacidades preditivas, permitindo que usem essas tecnologias com confiança nos cuidados reais dos pacientes. À medida que o campo médico começa a depender cada vez mais da IA, métodos como esse serão essenciais para garantir uma entrega de saúde de alta qualidade, segura e eficaz.

Ao continuar usando e refinando essas técnicas, podemos aprimorar muito como os profissionais médicos tomam decisões, levando a melhores resultados para os pacientes e práticas hospitalares mais eficientes. O potencial da IA na saúde é vasto, e abordagens como a triagem conformal garantem que estamos aproveitando isso de maneira responsável e eficaz.

Fonte original

Título: Conformal Triage for Medical Imaging AI Deployment

Resumo: BackgroundThe deployment of black-box AI models in medical imaging presents significant challenges, especially in maintaining reliability across different clinical settings. These challenges are compounded by distribution shifts that can lead to failures in reproducing the accuracy attained during the AI models original validations. MethodWe introduce the conformal triage algorithm, designed to categorize patients into low-risk, high-risk, and uncertain groups within a clinical deployment setting. This method leverages a combination of a black-box AI model and conformal prediction techniques to offer statistical guarantees of predictive power for each group. The high-risk group is guaranteed to have a high positive predictive value, while the low-risk group is assured a high negative predictive value. Prediction sets are never constructed; instead, conformal techniques directly assure high accuracy in both groups, even in clinical environments different from those in which the AI model was originally trained, thereby ameliorating the challenges posed by distribution shifts. Importantly, a representative data set of exams from the testing environment is required to ensure statistical validity. ResultsThe algorithm was tested using a head CT model previously developed by Do and col-leagues [9] and a data set from Massachusetts General Hospital. The results demonstrate that the conformal triage algorithm provides reliable predictive value guarantees to a clinically significant extent, reducing the number of false positives from 233 (45%) to 8 (5%) while only abstaining from prediction on 14% of data points, even in a setting different from the training environment of the original AI model. ConclusionsThe conformal triage algorithm offers a promising solution to the challenge of deploying black-box AI models in medical imaging across varying clinical settings. By providing statistical guarantees of predictive value for categorized patient groups, this approach significantly enhances the reliability and utility of AI in optimizing medical imaging workflows, particularly in neuroradiology.

Autores: Anastasios Nikolas Angelopoulos, S. R. Pomerantz, S. Do, S. Bates, C. P. Bridge, D. C. Elton, M. H. Lev, R. G. Gonzalez, M. I. Jordan, J. Malik

Última atualização: 2024-02-11 00:00:00

Idioma: English

Fonte URL: https://www.medrxiv.org/content/10.1101/2024.02.09.24302543

Fonte PDF: https://www.medrxiv.org/content/10.1101/2024.02.09.24302543.full.pdf

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes