O que significa "Amostras fora da distribuição (OOD)"?
Índice
A amostra fora da distribuição (OOD) se refere a dados que são diferentes do que um modelo foi treinado. Essas amostras podem causar problemas para modelos de aprendizado de máquina, que podem ter dificuldade em fazer previsões corretas quando encontram dados desconhecidos.
Por que as amostras OOD são importantes
Com a tecnologia melhorando e as tarefas ficando mais complexas, é importante identificar quando um modelo está classificando dados de forma errada. Reconhecer amostras OOD pode ajudar os desenvolvedores a entenderem as fraquezas dos seus modelos e melhorar o desempenho geral.
Como lidar com amostras OOD
Uma abordagem para lidar com amostras OOD é usar técnicas que ajudam a estimar o quão certo um modelo está sobre suas previsões. Avaliando o nível de confiança da saída de um modelo, os desenvolvedores podem filtrar previsões pouco confiáveis e focar nas que são mais precisas.
Outro método envolve adaptar o modelo durante sua operação. Isso pode ser feito usando prompts visuais que ajustam como o modelo interpreta os dados que chegam. No entanto, usar esses prompts geralmente requer dados rotulados, o que pode trazer problemas como o overfitting.
Para enfrentar esses desafios, novas estratégias que reduzem a necessidade de dados rotulados e limitam o overfitting estão sendo desenvolvidas. Essas melhorias visam tornar os modelos mais robustos, especialmente quando enfrentam amostras que diferem dos dados de treinamento.