Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões

Melhorando a Classificação de Imagens Médicas com SPLAL

Um novo método melhora a precisão na classificação de imagens médicas usando aprendizado semi-supervisionado.

― 8 min ler


SPLAL: Avançando a ImagemSPLAL: Avançando a ImagemMédicaforma eficaz.classificação de imagens médicas deO SPLAL enfrenta os desafios na
Índice

A classificação de imagens médicas é uma tarefa que envolve identificar e categorizar imagens de fontes médicas, como exames ou fotos de condições de pele. Essa tarefa pode ser difícil devido à quantidade limitada de amostras rotuladas e a um número desigual de imagens para diferentes condições. Felizmente, usar Aprendizado semi-supervisionado (SSL) pode ajudar, permitindo que a gente use tanto dados rotulados quanto não rotulados. No entanto, os métodos de SSL precisam superar dois problemas principais: criar rótulos confiáveis para as imagens não rotuladas e gerenciar as diferenças nos tamanhos das classes.

Nossa Abordagem: SPLAL

Desenvolvemos um novo método chamado Rotulagem Pseudo Baseada em Similaridade com Perda de Alinhamento (SPLAL). O SPLAL lida com esses desafios de forma eficaz. Primeiro, ele utiliza Protótipos de Classe e combina as previsões de vários classificadores para criar rótulos confiáveis para algumas das imagens não rotuladas. Em segundo lugar, introduz uma função de perda que ajuda a reduzir os preconceitos em relação às classes mais comumente representadas.

Para ver como o SPLAL funciona, testamos em dois conjuntos de dados médicos bem conhecidos: o conjunto de dados de lesões de pele (ISIC 2018) e o conjunto de dados de classificação de células sanguíneas (BCCD). Nossos resultados mostram que o SPLAL superou outros métodos líderes de SSL com base em diferentes critérios de avaliação. Em particular, mostrou uma melhoria notável na precisão e na pontuação F1 no conjunto de dados ISIC 2018.

Contexto: Desafios na Classificação de Imagens Médicas

Desequilíbrio de Classe

Um dos principais desafios na classificação de imagens médicas é o desequilíbrio nos tamanhos das classes, o que significa que podemos ter muitas imagens para algumas doenças, mas muito poucas para outras. Isso pode fazer com que o modelo tenha mais chances de prever corretamente as classes mais comuns, enquanto luta com as menos comuns.

Escassez de Rótulos

Conseguir amostras rotuladas de alta qualidade exige tempo e esforço dos especialistas médicos, o que pode ser caro. Consequentemente, não há muitas imagens rotuladas disponíveis para a maioria das condições, o que significa que os modelos podem não aprender de forma eficaz com os dados limitados que têm.

Importância dos Dados Não Rotulados

Ambientes médicos costumam gerar grandes quantidades de imagens não rotuladas. Os métodos de SSL usam essas imagens para melhorar o treinamento dos modelos, reduzindo a necessidade de um grande conjunto de dados rotulados. É aí que nossa abordagem SPLAL pode ser particularmente útil.

Rotulagem Pseudo em SSL

A rotulagem pseudo é uma técnica usada em SSL que envolve criar rótulos temporários para dados não rotulados com base nas previsões do modelo. A ideia é treinar o modelo com esses rótulos pseudo junto com os rótulos verdadeiros do conjunto de dados rotulado. No entanto, se um modelo depender completamente de suas previsões para rotulagem pseudo, ele pode se tornar tendencioso, resultando em um desempenho ruim.

Visão Geral do SPLAL

Seleção de Amostras Confiáveis

O SPLAL começa selecionando amostras não rotuladas confiáveis. Nós determinamos a confiabilidade de uma amostra não rotulada com base em sua similaridade com os protótipos de classe, que são representações médias de cada classe. Isso ajuda a escolher apenas as amostras que são representativas de suas respectivas classes.

Previsão de Rótulos Pseudo

Após identificar amostras confiáveis, o SPLAL usa três classificadores diferentes: um classificador de similaridade, um classificador K-Vizinhos Mais Próximos (KNN) e um classificador linear. Ao combinar suas previsões, o SPLAL pode criar rótulos pseudo mais precisos para as amostras não rotuladas.

Perda de Alinhamento

Para lidar com o problema do desequilíbrio de classe, o SPLAL inclui uma perda de alinhamento. Essa função de perda incentiva previsões consistentes para as ampliações da mesma imagem. Usando formas mais fracas e mais fortes da mesma imagem, o modelo aprende a fazer previsões consistentes, o que ajuda as classes minoritárias.

Experimentos e Resultados

Conjuntos de Dados

A eficácia do SPLAL foi testada em dois conjuntos de dados disponíveis publicamente:

  1. ISIC 2018: Este conjunto de dados inclui 10.015 imagens de lesões de pele, divididas em sete tipos. Para nossos testes, usamos um conjunto menor de imagens rotuladas e avaliamos o desempenho do modelo com base em vários critérios, como precisão e pontuação F1.

  2. BCCD: O conjunto de dados de classificação de células sanguíneas contém 12.442 imagens divididas em quatro tipos. Este conjunto de dados é mais equilibrado, permitindo diferentes tipos de comparações com o conjunto de dados ISIC 2018.

Configuração Experimental

Usamos um modelo de aprendizado profundo para nossos experimentos, com configurações específicas, como um modelo de backbone pré-treinado em um grande conjunto de dados (ImageNet). O treinamento foi feito ao longo de várias épocas, focando em imagens rotuladas e pseudo-rotuladas. Também usamos várias técnicas para aumentar as imagens para melhorar o processo de treinamento.

Métricas de Avaliação

Para avaliar o desempenho do SPLAL, nos baseamos em métricas como precisão, sensibilidade, especificidade, precisão e pontuação F1. Essas métricas ajudam a fornecer uma visão abrangente de como o modelo está se saindo nas classes.

Comparação com Outros Métodos

Comparávamos o SPLAL com vários métodos contemporâneos de SSL, incluindo abordagens de auto-treinamento e aprendizado adversarial. Na maioria dos casos, o SPLAL mostrou melhorias significativas, especialmente em como lidou com classes minoritárias.

Estudos de Ablação

Realizamos testes adicionais para ver como cada componente do SPLAL contribuiu para seu sucesso. Alterando diferentes parâmetros e avaliando seu impacto, identificamos fatores-chave que melhoram o desempenho geral do modelo.

Discussão

Geração de Protótipos de Classe

Para criar protótipos de classe, usamos um sistema de fila de memória. Isso garante que os protótipos reflitam as amostras de treinamento mais recentes sem apresentar preconceitos devido a desequilíbrios de classe. Ao fazer a média dos vetores de características das amostras mais relevantes, ajudamos a manter a integridade das previsões do modelo.

Impacto da Perda de Alinhamento

Nossos estudos demonstraram claramente que incorporar a perda de alinhamento melhora significativamente o desempenho do modelo, especialmente em casos com poucos exemplos de certas classes. Essa perda ajuda o modelo a fazer previsões consistentes, levando a uma classificação geral melhor.

Importância da Combinação de Classificadores

Usar uma combinação ponderada de diferentes classificadores permitiu que o SPLAL superasse preconceitos que poderiam surgir ao depender apenas de um classificador. Ao considerar previsões de várias fontes, o modelo pôde criar um sistema de classificação mais equilibrado e eficaz.

Conclusão

Neste trabalho, introduzimos um novo método, SPLAL, que melhora significativamente as tarefas de classificação de imagens médicas que enfrentam desafios como dados rotulados limitados e desequilíbrio de classes. Ao focar na seleção de amostras confiáveis, rotulagem pseudo eficaz e aproveitando a perda de alinhamento, o SPLAL melhora o desempenho do modelo em vários conjuntos de dados.

No final das contas, o SPLAL mostra grande potencial para melhorar a precisão da classificação de imagens médicas, o que pode levar a melhores ferramentas de diagnóstico em ambientes de saúde. Ao usar de forma eficaz dados rotulados e não rotulados, podemos avançar em direção a modelos mais robustos e confiáveis que ajudem em aplicações médicas do mundo real.

Trabalhos Futuros

Olhando para o futuro, há várias áreas para possível aprimoramento e exploração:

  1. Conjuntos de Dados Adicionais: Testar o SPLAL em conjuntos de dados mais diversos poderia ajudar a validar sua eficácia em uma faixa mais ampla de tarefas de imagem médica.

  2. Aplicações do Mundo Real: Implantar o SPLAL em ambientes clínicos poderia fornecer insights sobre como ele se sai sob restrições e variações de qualidade de dados no mundo real.

  3. Ajuste de Parâmetros: Explorar as configurações ideais para os pesos usados nos vários classificadores e o impacto da perda de alinhamento poderia trazer ainda melhor desempenho.

  4. Investigação de Métodos de Aprendizado Alternativos: Enquanto o SPLAL foca em SSL, combiná-lo com outros paradigmas de aprendizado, como aprendizado não supervisionado ou transferência, pode aprimorar ainda mais as capacidades do modelo.

  5. Design Centrado no Usuário: Engajar-se com profissionais médicos para entender suas necessidades e preferências poderia levar a modificações que tornem o SPLAL ainda mais amigável na prática.

Ao seguir essas direções, podemos refinar melhor o SPLAL e contribuir para avanços na classificação de imagens médicas que têm o potencial de fazer a diferença no cuidado ao paciente.

Fonte original

Título: SPLAL: Similarity-based pseudo-labeling with alignment loss for semi-supervised medical image classification

Resumo: Medical image classification is a challenging task due to the scarcity of labeled samples and class imbalance caused by the high variance in disease prevalence. Semi-supervised learning (SSL) methods can mitigate these challenges by leveraging both labeled and unlabeled data. However, SSL methods for medical image classification need to address two key challenges: (1) estimating reliable pseudo-labels for the images in the unlabeled dataset and (2) reducing biases caused by class imbalance. In this paper, we propose a novel SSL approach, SPLAL, that effectively addresses these challenges. SPLAL leverages class prototypes and a weighted combination of classifiers to predict reliable pseudo-labels over a subset of unlabeled images. Additionally, we introduce alignment loss to mitigate model biases toward majority classes. To evaluate the performance of our proposed approach, we conduct experiments on two publicly available medical image classification benchmark datasets: the skin lesion classification (ISIC 2018) and the blood cell classification dataset (BCCD). The experimental results empirically demonstrate that our approach outperforms several state-of-the-art SSL methods over various evaluation metrics. Specifically, our proposed approach achieves a significant improvement over the state-of-the-art approach on the ISIC 2018 dataset in both Accuracy and F1 score, with relative margins of 2.24\% and 11.40\%, respectively. Finally, we conduct extensive ablation experiments to examine the contribution of different components of our approach, validating its effectiveness.

Autores: Md Junaid Mahmood, Pranaw Raj, Divyansh Agarwal, Suruchi Kumari, Pravendra Singh

Última atualização: 2023-07-10 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2307.04610

Fonte PDF: https://arxiv.org/pdf/2307.04610

Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes