Desafio da Densidade Mamária Avança Técnicas de IA
Um desafio global destaca o aprendizado federado para classificação de densidade mamária.
― 8 min ler
Índice
- Importância da Classificação Precisa da Densidade Mamária
- Visão Geral do Desafio de Densidade Mamária FL
- Arquitetura do Desafio e Ferramentas
- Dados Usados no Desafio
- Avaliando as Submissões
- Analisando o Viés Demográfico
- Principais Descobertas e Considerações Futuras
- Pensamentos Finais
- Fonte original
- Ligações de referência
A densidade mamária é um fator importante pra determinar o risco de câncer de mama. Entender como o tecido mamário denso pode obscurecer tumores é chave pra avaliar o risco de uma paciente e planejar seus futuros exames. A inteligência artificial (IA) tem mostrado potencial em prever a densidade mamária com precisão, mas o desafio vem dos diferentes tipos de máquinas de mamografia usadas em vários lugares. Modelos treinados com um tipo de dado de mamografia não funcionam tão bem com dados de um tipo de máquina diferente. Pra resolver isso, o Aprendizado Federado (FL) surgiu como um método que permite treinar modelos de IA com dados de vários locais sem precisar compartilhar informações. Essa abordagem ainda está sendo estudada pra descobrir as melhores formas de manter características importantes de todos os dados de treinamento.
Pra investigar técnicas de FL, foi realizado um desafio de classificação de densidade mamária. Esse evento foi uma colaboração envolvendo instituições acadêmicas e empresas de tecnologia. Os participantes enviaram Algoritmos que poderiam realizar FL com dados médicos simulados de diferentes instalações, cada uma com seu próprio grande conjunto de dados de mamografias. O desafio ocorreu de meados de junho a início de setembro de 2022 e atraiu muitos participantes de todo o mundo. A melhor submissão conseguiu uma pontuação notável, indicando um nível de desempenho semelhante a um modelo treinado em um único conjunto de dados centralizado.
Importância da Classificação Precisa da Densidade Mamária
Determinar com precisão a densidade mamária nas mamografias é crucial pra avaliar o risco de câncer de mama. O tecido mamário denso pode esconder tumores, dificultando a detecção precoce do câncer. No entanto, essa tarefa de classificação tem uma alta variabilidade devido às diferenças de como vários radiologistas podem interpretar as imagens. Embora alguns modelos de IA consigam classificar a densidade mamária com alta precisão, mamografias de diferentes sistemas de imagem ou populações não incluídas no treinamento do modelo podem ter um desempenho ruim. Isso é especialmente relevante à medida que a tecnologia de imagem melhora e os modelos são levados a diferentes configurações médicas.
Por causa da natureza sensível dos dados médicos, o FL se tornou um método popular pra treinar algoritmos de IA enquanto mantém os dados dos pacientes seguros. No FL, o treinamento acontece localmente em diferentes instalações, permitindo que os dados permaneçam no local. Somente informações necessárias sobre o desempenho dos modelos locais são compartilhadas pra criar um modelo combinado que deve ter um desempenho melhor em diferentes Conjuntos de dados.
Modelos de FL mostraram ser mais eficazes do que modelos treinados com dados de uma única instituição em várias situações médicas, incluindo a classificação da densidade mamária, previsão de resultados de tratamento da COVID-19 e segmentação de tumores cerebrais. No entanto, ainda há pesquisas sendo feitas pra determinar as formas mais eficazes de treinar esses modelos e como gerenciar os dados que vêm de várias fontes durante esse processo.
Visão Geral do Desafio de Densidade Mamária FL
O desafio de densidade mamária FL aconteceu em um ambiente seguro criado por uma grande organização de radiologia. Participantes interessados puderam aprender sobre as regras do desafio e se inscrever pra competir através de um site público. Após receber a aprovação, os participantes tiveram acesso a uma área privada onde puderam enviar suas inscrições.
O objetivo era que os participantes desenvolvessem algoritmos de FL que pudessem classificar com precisão a densidade mamária nas mamografias. Eles puderam usar modelos pré-treinados pra ajudar nas suas submissões. A equipe organizadora não participou da competição, mas se concentrou em facilitar o evento.
As submissões consistiam em arquivos compactados contendo instruções pra configurar execuções automatizadas de FL. O desafio foi dividido em duas partes. A primeira parte focou no treinamento de algoritmos, permitindo que os participantes fizessem um número limitado de submissões a cada dia. A segunda parte testou a última submissão de cada participante em um conjunto de dados separado. Depois da primeira fase, feedback foi coletado dos participantes sobre suas experiências e abordagens.
Arquitetura do Desafio e Ferramentas
A arquitetura do desafio consistia em várias máquinas virtuais projetadas pra realizar funções específicas. Uma máquina processava as submissões do desafio, uma coordenava as execuções de FL entre diferentes submissões dos participantes, e outras hospedavam os conjuntos de dados únicos usados para treinamento.
Os participantes interagiam com o ambiente do desafio através de uma plataforma web projetada pra suportar competições em aprendizado de máquina. Eles podiam enviar arquivos contendo seus algoritmos, que eram então revisados manualmente por motivos de segurança. Em seguida, os algoritmos eram compilados e testados dentro da configuração de FL.
O servidor de FL gerenciava as submissões entre as diferentes máquinas clientes, cada uma operando de forma independente com seus conjuntos de dados únicos. Os participantes não eram limitados em recursos computacionais, o que lhes permitiu focar no desenvolvimento de seus algoritmos sem restrições técnicas.
Dados Usados no Desafio
Os conjuntos de dados utilizados no desafio foram derivados de um extenso estudo de mamografia. Permissões específicas foram necessárias pra acessar esse conjunto de dados, então os participantes não receberam diretamente os dados originais. Em vez disso, um conjunto de dados amostral foi fornecido para uso deles.
O desafio apresentou mamografias rotuladas com uma das quatro categorias que descrevem a densidade mamária. A distribuição desses rótulos variou entre os diferentes conjuntos de dados usados pelos participantes. Métricas foram criadas pra avaliar o quão bem os algoritmos performaram na classificação da densidade mamária com base nesses rótulos.
Avaliando as Submissões
Depois que o desafio terminou, o desempenho dos algoritmos foi avaliado usando várias métricas pra medir sua eficácia na classificação da densidade mamária. Os resultados da competição foram compartilhados em uma conferência, com a melhor submissão recebendo prêmios pelo seu desempenho.
Com as submissões da Fase II testadas em um conjunto de validação externo, os participantes puderam ver como seus algoritmos se saíram em um conjunto de dados novo que não foi visto durante o treinamento. Através dessa análise, o desempenho dos algoritmos foi avaliado em relação a outros modelos relevantes pra entender melhor sua eficácia.
Analisando o Viés Demográfico
O desafio também incluiu uma análise de Fatores Demográficos que poderiam influenciar o desempenho dos algoritmos. Por exemplo, o desempenho entre diferentes grupos raciais e etários foi analisado pra ver se os modelos eram igualmente eficazes, independente desses fatores.
Foi descoberto que alguns grupos demográficos apresentaram taxas de desempenho mais baixas, provavelmente ligadas ao tamanho dos dados de treinamento para aqueles grupos. Isso destacou a necessidade de mais pesquisas sobre como tornar os modelos de IA mais justos e eficazes para todas as populações.
Principais Descobertas e Considerações Futuras
O desafio de densidade mamária FL proporcionou insights valiosos sobre as metodologias associadas ao aprendizado federado. Ele estabeleceu uma estrutura pra competições futuras semelhantes, onde dados sensíveis podem permanecer seguros enquanto permite comparações justas entre algoritmos de IA.
Os resultados indicaram que, embora os algoritmos de FL geralmente tenham um bom desempenho, houve quedas notáveis na eficácia quando avaliados em conjuntos de dados externos, especialmente para grupos demográficos sub-representados. Essa descoberta aponta para a necessidade de pesquisas contínuas pra criar modelos de IA que sejam justos e imparciais.
Enquanto várias equipes utilizaram modelos pré-treinados pra aprimorar suas submissões, nem todas as abordagens resultaram em resultados igualmente bem-sucedidos. Alguns algoritmos mostraram que ter um modelo global foi benéfico pra generalização, apesar de outras equipes se concentrarem apenas em modelos locais.
No geral, o desafio demonstrou o potencial do FL na IA médica e destacou a importância da diversidade de dados no treinamento de algoritmos. Isso estimula futuros estudos a se concentrarem em fazer modelos de IA que possam atender de forma precisa e justa todos os pacientes.
Pensamentos Finais
O desafio de densidade mamária FL teve sucesso em atrair participação global e forneceu descobertas significativas sobre a metodologia de aprendizado federado. Esse sucesso pode servir como um modelo pra futuras competições de IA que buscam avaliações justas sem exigir que os participantes acessem dados sensíveis diretamente.
Os resultados do desafio defendem a melhoria contínua dos modelos de IA usados em configurações de saúde, enfatizando a importância de desenvolver algoritmos que possam se adaptar a populações de pacientes diversas e fontes de dados variadas. Pesquisas futuras devem visar refiná-los pra garantir que possam suportar diagnósticos precisos enquanto são sensíveis a questões de justiça e representação.
Título: Fair Evaluation of Federated Learning Algorithms for Automated Breast Density Classification: The Results of the 2022 ACR-NCI-NVIDIA Federated Learning Challenge
Resumo: The correct interpretation of breast density is important in the assessment of breast cancer risk. AI has been shown capable of accurately predicting breast density, however, due to the differences in imaging characteristics across mammography systems, models built using data from one system do not generalize well to other systems. Though federated learning (FL) has emerged as a way to improve the generalizability of AI without the need to share data, the best way to preserve features from all training data during FL is an active area of research. To explore FL methodology, the breast density classification FL challenge was hosted in partnership with the American College of Radiology, Harvard Medical School's Mass General Brigham, University of Colorado, NVIDIA, and the National Institutes of Health National Cancer Institute. Challenge participants were able to submit docker containers capable of implementing FL on three simulated medical facilities, each containing a unique large mammography dataset. The breast density FL challenge ran from June 15 to September 5, 2022, attracting seven finalists from around the world. The winning FL submission reached a linear kappa score of 0.653 on the challenge test data and 0.413 on an external testing dataset, scoring comparably to a model trained on the same data in a central location.
Autores: Kendall Schmidt, Benjamin Bearce, Ken Chang, Laura Coombs, Keyvan Farahani, Marawan Elbatele, Kaouther Mouhebe, Robert Marti, Ruipeng Zhang, Yao Zhang, Yanfeng Wang, Yaojun Hu, Haochao Ying, Yuyang Xu, Conrad Testagrose, Mutlu Demirer, Vikash Gupta, Ünal Akünal, Markus Bujotzek, Klaus H. Maier-Hein, Yi Qin, Xiaomeng Li, Jayashree Kalpathy-Cramer, Holger R. Roth
Última atualização: 2024-05-22 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2405.14900
Fonte PDF: https://arxiv.org/pdf/2405.14900
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://www.latex-project.org/lppl.txt
- https://lenova.river-valley.com/svn/elsarticle/trunk/medima-template.tex
- https://support.stmdocs.com/wiki/
- https://support.stmdocs.com/wiki/index.php?title=Elsarticle.cls
- https://www.elsevier.com/wps/find/journaldescription.cws_home/505619/authorinstructions
- https://mirrors.ctan.org/macros/latex/contrib/
- https://mirrors.ctan.org/macros/latex/contrib/endfloat/endfloat.pdf
- https://www.elsevier.com/locate/authorartwork
- https://breastdensityfl.acr.org
- https://github.com/Project-MONAI/tutorials/tree/main/federated_learning/breast_density_challenge
- https://github.com/wiesenfa/challengeR
- https://www.hologic.com/