Simple Science

Ciência de ponta explicada de forma simples

O que significa "Dados Aumentados Contrafactuais"?

Índice

Dados Aumentados Contrafactuais (CAD) é um método usado pra criar novos exemplos pra treinar modelos de aprendizado de máquina. Funciona fazendo pequenas mudanças nos dados existentes, que podem mudar o rótulo ou a categoria desses dados. Por exemplo, se tem uma imagem de um gato rotulada como "gato", uma edição leve pode fazer com que pareça mais com um cachorro, e agora o rótulo poderia virar "cachorro".

Propósito do CAD

O objetivo do CAD é ajudar os modelos a aprenderem melhor mostrando exemplos que são parecidos, mas diferentes. Isso ajuda os modelos a evitarem erros baseados em características que não importam, que poderiam ligar errado a um rótulo. Espalhando as relações entre diferentes classes, os modelos podem ficar mais robustos e precisos.

Desafios com o CAD

Embora o CAD possa melhorar o aprendizado, ele também tem alguns pontos negativos. Às vezes, os modelos podem focar demais nas mudanças feitas nos dados e ignorar outros detalhes importantes. Isso pode causar problemas quando os modelos encontram dados novos, que eles não foram treinados.

Melhorando com Aprendizado Contrastivo

Pra lidar com esses desafios, os pesquisadores usam uma técnica chamada aprendizado contrastivo. Esse método incentiva os modelos a olharem pra uma gama mais ampla de características, não apenas aquelas que foram atualizadas. Ele ajuda a equilibrar o foco, permitindo que os modelos se saiam melhor ao lidar com dados novos ou diferentes.

Artigos mais recentes para Dados Aumentados Contrafactuais