Abordando o Desbalanceamento de Classe na Descoberta de Novas Classes
Novo método melhora o aprendizado com conjuntos de dados desbalanceados pra uma melhor reconhecimento de classes.
― 7 min ler
Índice
O campo da descoberta de novas classes (NCD) tá ficando cada vez mais importante pra tarefas de reconhecimento de imagem. O objetivo do NCD é aprender sobre novas classes a partir de dados que não têm rótulos, usando informações de classes que já conhecemos. Muitos métodos que existem funcionam bem quando as classes são relativamente equilibradas em tamanho. Mas, na vida real, isso geralmente não acontece, e a gente se depara com uma Distribuição de Cauda Longa, onde algumas classes têm muitos exemplos e outras têm bem poucos. Isso pode causar problemas na hora de reconhecer novas classes, já que métodos que funcionam bem em dados equilibrados podem não se sair tão bem em conjuntos de dados desbalanceados.
Neste artigo, vamos analisar mais de perto como resolver essa questão das distribuições de classes desbalanceadas na descoberta de novas classes. Vamos discutir uma nova abordagem que busca aprender tanto com classes conhecidas quanto desconhecidas de uma forma mais realista. Essa abordagem envolve criar um sistema para gerar pseudo-rótulos de alta qualidade para novas classes com base em dados existentes.
Declaração do Problema
A descoberta de novas classes tem como objetivo aprender novas classes a partir de dados não rotulados enquanto temos acesso a classes conhecidas. A maioria dos métodos existentes assume que as classes estão distribuídas de maneira uniforme, o que não reflete muitas situações práticas. Em cenários da vida real, frequentemente encontramos distribuições de classes de cauda longa, onde algumas classes estão bem representadas no conjunto de dados e outras não. Esse desbalanceamento pode dificultar bastante o desempenho dos métodos de NCD, tornando difícil aprender características úteis para as classes menos comuns.
Um dos principais desafios que surgem nessas situações é aprender a reconhecer novas classes sem ser enganado pelo viés em relação às classes conhecidas. Quando algumas classes dominam o conjunto de dados, isso pode levar a suposições erradas sobre as relações entre as classes, resultando em um desempenho ruim nas novas classes.
Método Proposto
Pra enfrentar os problemas associados às distribuições de cauda longa, propomos um novo método que introduz uma estratégia de auto-rotulação adaptativa. A ideia central é gerar pseudo-rótulos para novas classes com base em uma representação das classes existentes. Esse sistema vai ajudar a equilibrar o processo de aprendizado e reduzir os viéses que surgem de dados desbalanceados.
Estratégia de Auto-Rotulação Adaptativa
A estrutura de auto-rotulação adaptativa foca em gerar pseudo-rótulos de alta qualidade para classes não vistas. O método envolve dois passos principais:
Gerando Pseudo-Rótulos: Criamos um sistema pra gerar pseudo-rótulos com base nas classes conhecidas. Isso envolve usar um problema de transporte ótimo, que ajuda a atribuir rótulos para as novas classes de uma forma que reflita suas relações com as classes conhecidas.
Aprendendo Representações de Classe: Usando uma representação de protótipo equiangular, conseguimos aprender sistematicamente as relações entre as classes sem sermos fortemente influenciados pela quantidade de exemplos disponíveis. Isso ajuda a reconhecer tanto classes principais (classes bem representadas) quanto classes secundárias (menos representadas) de forma eficaz.
Visão Geral da Estrutura
A estrutura geral é composta por três componentes principais:
Representação de Classe: Usamos protótipos equiangulares pra representar classes conhecidas e novas. Isso ajuda a reduzir o viés e permite uma abordagem de aprendizado mais equilibrada.
Geração de Pseudo-Rótulos: Os pseudo-rótulos para as novas classes são gerados com base em uma abordagem de transporte ótimo regularizada. Isso ajuda a fazer estimativas precisas sobre as classes, apesar da sua natureza desbalanceada.
Algoritmo de Aprendizado Iterativo: O sistema alterna entre gerar pseudo-rótulos e refinar as representações aprendidas pra melhorar o desempenho geral da classificação.
Configuração Experimental
Pra validar nosso método, vamos testá-lo em vários conjuntos de dados que refletem diferentes níveis de desbalanceamento de classe. Esses conjuntos de dados incluem o CIFAR100 e o ImageNet100, que são bem conhecidos no campo da visão computacional. Além disso, vamos explorar conjuntos de dados que apresentam desequilíbrios mais naturais, como o Herbarium19 e o iNaturalist18.
Conjuntos de Dados
CIFAR100: Esse conjunto de dados contém 100 classes de imagens, com uma mistura de classes bem representadas e mal representadas.
ImageNet100: Semelhante ao CIFAR100, mas com imagens mais complexas e uma gama mais ampla de categorias.
Herbarium19: Um conjunto de dados usado pra classificação de plantas, que apresenta distribuições naturais de cauda longa.
iNaturalist18: Um conjunto de dados maior contendo várias espécies, usado pra testar as capacidades de reconhecimento em um cenário mais desafiador.
Métricas de Avaliação
Pra avaliar o desempenho do método proposto, vamos medir a precisão média entre todas as classes. Vamos também olhar especificamente como o modelo reconhece novas classes em comparação com as classes conhecidas. Isso vai ajudar a entender a eficácia da abordagem, especialmente em relação ao equilíbrio entre classes principais e secundárias.
Resultados e Discussão
Em nossos experimentos, conseguimos resultados promissores que demonstram a eficácia da nossa estratégia de auto-rotulação adaptativa.
Desempenho em Diferentes Conjuntos de Dados
CIFAR100: Nosso método mostrou melhorias significativas no reconhecimento tanto de classes conhecidas quanto novas, especialmente em testes com conjuntos de dados com desbalanceamento de classes significativo.
ImageNet100: Os resultados destacaram a capacidade do nosso método de superar métodos tradicionais, alcançando maior precisão para classes conhecidas e novas.
Herbarium19 e iNaturalist18: Os ganhos de desempenho foram particularmente notáveis nesses conjuntos de dados, mostrando a robustez da nossa abordagem em cenários do mundo real com distribuições de cauda longa.
Análise dos Resultados
Uma análise dos resultados revela as seguintes percepções chave:
A estratégia de auto-rotulação adaptativa aborda efetivamente os desbalanceamentos presentes nos conjuntos de dados, permitindo que o modelo aprenda características mais representativas tanto para classes principais quanto secundárias.
A combinação de protótipos equiangulares e geração de pseudo-rótulos contribui significativamente pra reduzir o viés durante o processo de aprendizado, melhorando a capacidade geral de reconhecimento.
Nosso método demonstra resiliência contra o desbalanceamento de classes, permitindo que o modelo consiga um desempenho melhor em várias distribuições de dados.
Conclusão
Em resumo, nosso trabalho apresenta uma solução pras dificuldades impostas pelas distribuições de cauda longa na descoberta de novas classes. Ao introduzir uma estrutura de auto-rotulação adaptativa, conseguimos um aprendizado melhor tanto de classes conhecidas quanto novas, mesmo quando os dados estão desbalanceados. Nossa validação experimental em vários conjuntos de dados confirma a eficácia do método proposto, abrindo caminho pra futuras melhorias no campo do reconhecimento de imagem.
As inovações nesta abordagem não apenas melhoram os resultados de classificação, mas também fornecem uma base sólida pra enfrentar tarefas de reconhecimento do mundo real, onde dados desbalanceados são uma questão comum. Esta pesquisa serve como um ponto de partida pra mais exploração de métodos de aprendizado adaptativos e suas aplicações em vários domínios.
À medida que avançamos, encorajamos outros no campo a construir sobre essas descobertas e explorar novas avenidas pra aprimorar a robustez dos sistemas de descoberta de novas classes, garantindo que eles possam atender às demandas de conjuntos de dados cada vez mais complexos e variados.
Título: Novel Class Discovery for Long-tailed Recognition
Resumo: While the novel class discovery has recently made great progress, existing methods typically focus on improving algorithms on class-balanced benchmarks. However, in real-world recognition tasks, the class distributions of their corresponding datasets are often imbalanced, which leads to serious performance degeneration of those methods. In this paper, we consider a more realistic setting for novel class discovery where the distributions of novel and known classes are long-tailed. One main challenge of this new problem is to discover imbalanced novel classes with the help of long-tailed known classes. To tackle this problem, we propose an adaptive self-labeling strategy based on an equiangular prototype representation of classes. Our method infers high-quality pseudo-labels for the novel classes by solving a relaxed optimal transport problem and effectively mitigates the class biases in learning the known and novel classes. We perform extensive experiments on CIFAR100, ImageNet100, Herbarium19 and large-scale iNaturalist18 datasets, and the results demonstrate the superiority of our method. Our code is available at https://github.com/kleinzcy/NCDLR.
Autores: Chuyu Zhang, Ruijie Xu, Xuming He
Última atualização: 2023-08-25 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2308.02989
Fonte PDF: https://arxiv.org/pdf/2308.02989
Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.