Melhorando Imagens Médicas com Aprendizado Federado
Um método pra melhorar o treinamento de modelos usando imagens médicas com rotulagem parcial.
― 7 min ler
Índice
Na área de imagem médica, o aprendizado profundo mostrou um grande potencial para identificar e segmentar com precisão várias estruturas anatômicas. No entanto, um desafio importante surge do fato de que muitos conjuntos de dados são apenas parcialmente rotulados. Isso significa que, enquanto algumas estruturas estão marcadas em um conjunto de dados, elas podem não estar incluídas em outro. Isso cria uma abordagem fragmentada para o Treinamento de Modelos, já que diferentes instituições apenas anotam as imagens relevantes para sua pesquisa. O objetivo deste trabalho é melhorar a forma como esses modelos podem aprender com dados tão variados e incompletos, mantendo a privacidade do paciente.
Rótulos Parciais
O Desafio dosImagens médicas são frequentemente complexas e requerem uma rotulagem cuidadosa para serem úteis no treinamento de modelos. No entanto, devido a restrições de recursos e regulamentos de privacidade, muitas instituições rotulam apenas as estruturas específicas que estão interessadas. Como resultado, os conjuntos de dados podem ter rótulos muito diferentes, o que torna difícil criar um modelo unificado que consiga reconhecer todas as estruturas relevantes.
Por exemplo, um hospital pode rotular órgãos como o fígado e o rim, enquanto outro se concentra no baço e na coluna. Quando esses conjuntos de dados são mantidos separados, as informações valiosas de cada um não são totalmente utilizadas. Como resultado, modelos treinados com dados limitados muitas vezes têm um desempenho abaixo do esperado quando aplicados a diferentes conjuntos de dados.
Aprendizado Federado: Uma Solução
O aprendizado federado é um método que permite que várias instituições treinem um modelo de forma colaborativa sem compartilhar seus dados. Em vez de enviar todos os dados dos pacientes para um servidor central, cada instituição retém seus dados e só compartilha as atualizações do modelo aprendido. Essa abordagem ajuda a preservar a privacidade do paciente enquanto ainda permite um treinamento de modelo melhorado.
Neste estudo, propomos um método que combina aprendizado federado com técnicas bayesianas para lidar com o problema de rótulos parciais. Cada instituição treina seu próprio modelo para identificar as estruturas que rotulou, mas também habilitamos os modelos a aprenderem com a Incerteza associada às suas previsões. Isso significa que mesmo que um modelo não tenha visto um rótulo específico, ele ainda pode coletar informações sobre esse rótulo através de suas estimativas de incerteza.
O Método Proposto
Nossa abordagem envolve a criação de uma estrutura de modelo compartilhada, conhecida como backbone, que é treinada em todas as instituições participantes. Em cada local, uma cabeça de Segmentação única é criada para os rótulos disponíveis naquele local. O backbone aprende características gerais dos dados, que podem ser úteis para reconhecer estruturas mesmo que não tenham sido rotuladas naquele conjunto de dados específico.
Durante a inferência, as previsões de cada cabeça de segmentação são combinadas, levando em conta a incerteza das previsões. Essa incerteza reflete quão confiante o modelo está sobre suas previsões e nos permite melhorar a precisão geral ajustando os pesos de cada previsão com base em quão certo o modelo está sobre estruturas específicas.
Processo de Treinamento e Inferência
No nosso processo de treinamento, cada instituição otimiza sua cabeça de segmentação com base nos rótulos disponíveis localmente. Enquanto isso, o backbone é atualizado em um servidor central através de um processo de média federada. Isso garante que o backbone retenha informações valiosas de todos os conjuntos de dados.
Ao fazer previsões, reunimos todas as cabeças de segmentação e calculamos a média de suas probabilidades softmax. Cada probabilidade é ponderada pelo número de instituições que forneceram aquele rótulo específico. Ao considerar a incerteza das previsões, podemos melhorar a segmentação geral, especialmente para rótulos que estavam sub-representados nos conjuntos de treinamento.
Benefícios da Abordagem Proposta
Nosso método demonstra que é possível aprender efetivamente com conjuntos de dados com rótulos diversos. O uso da incerteza permite que os modelos lidem melhor com situações em que certos rótulos estão completamente ausentes de um conjunto de dados. Isso leva a um desempenho de segmentação melhorado, particularmente para rótulos presentes em menos conjuntos de dados.
Como resultado, nossa abordagem permite a criação de um modelo que se sai tão bem quanto aqueles treinados em conjuntos de dados totalmente rotulados. Isso é significativo na imagem médica, onde dados anotarados de alta qualidade são frequentemente difíceis de encontrar.
Trabalhos Relacionados
Há um crescente interesse em métodos que lidam com conjuntos de dados parcialmente anotados, especialmente no âmbito da segmentação de múltiplos órgãos. Algumas abordagens utilizam as semelhanças na anatomia humana, enquanto outras aproveitam diferentes codificadores para vários conjuntos de dados. No entanto, muitos desses métodos não utilizam completamente os dados não anotados, que podem melhorar a qualidade preditiva.
Nosso método se baseia nessas abordagens existentes, mas foca em aprender em conjunto a partir de todos os dados disponíveis sem descartar a informação potencial de estruturas não anotadas. Ao usar técnicas bayesianas para estimar incerteza, abordamos uma das limitações encontradas em trabalhos anteriores.
Conjuntos de Dados Utilizados
Em nossos experimentos, utilizamos uma coleção de conjuntos de dados publicamente disponíveis para treinar nossos modelos. Esses conjuntos de dados variam em termos do número de imagens, rótulos anotados e os tipos de estruturas presentes. Também incorporamos alguns conjuntos de dados internos para aumentar ainda mais a diversidade dos nossos dados de treinamento.
Os conjuntos de dados incluem coleções bem conhecidas, como a Segmentação de Tumores Hepáticos e outros que fornecem uma ampla gama de estruturas anatômicas. Essa variedade ajuda a simular cenários do mundo real encontrados na imagem médica.
Resultados Experimentais
Nós avaliamos nosso método comparando-o com várias abordagens de base. Nossos modelos foram treinados em conjuntos de dados parciais e seu desempenho foi avaliado em diferentes cenários, incluindo casos intra-cliente e inter-cliente.
Nossos resultados mostram que os modelos treinados com nosso método proposto alcançaram pontuações DICE mais altas, uma métrica comum para avaliar a precisão da segmentação. Em particular, nossa abordagem superou métodos tradicionais, especialmente quando se tratou de rótulos sub-representados.
Além disso, demonstramos que a média ponderada pela incerteza melhorou significativamente o desempenho do modelo em comparação com a média regular. Isso foi particularmente evidente em conjuntos de dados onde o overfitting era uma preocupação.
Conclusão
A pesquisa indica que usar aprendizado federado juntamente com técnicas bayesianas oferece uma solução promissora para os desafios impostos por conjuntos de dados parcialmente rotulados na imagem médica. Ao aproveitar a incerteza preditiva, nossa abordagem melhora o treinamento do modelo e a performance da segmentação, mesmo frente a anotações incompletas.
Este trabalho abre novas avenidas para colaboração entre instituições, permitindo um treinamento de modelos mais robusto e eficaz sem comprometer a privacidade do paciente. Estudos futuros podem explorar refinamentos adicionais à nossa técnica, incluindo aplicações direcionadas da incerteza em cenários específicos para aumentar ainda mais a precisão do modelo.
Título: FUNAvg: Federated Uncertainty Weighted Averaging for Datasets with Diverse Labels
Resumo: Federated learning is one popular paradigm to train a joint model in a distributed, privacy-preserving environment. But partial annotations pose an obstacle meaning that categories of labels are heterogeneous over clients. We propose to learn a joint backbone in a federated manner, while each site receives its own multi-label segmentation head. By using Bayesian techniques we observe that the different segmentation heads although only trained on the individual client's labels also learn information about the other labels not present at the respective site. This information is encoded in their predictive uncertainty. To obtain a final prediction we leverage this uncertainty and perform a weighted averaging of the ensemble of distributed segmentation heads, which allows us to segment "locally unknown" structures. With our method, which we refer to as FUNAvg, we are even on-par with the models trained and tested on the same dataset on average. The code is publicly available at https://github.com/Cardio-AI/FUNAvg.
Autores: Malte Tölle, Fernando Navarro, Sebastian Eble, Ivo Wolf, Bjoern Menze, Sandy Engelhardt
Última atualização: 2024-07-10 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2407.07488
Fonte PDF: https://arxiv.org/pdf/2407.07488
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.