Analisando como os transformers de visão entendem as relações entre objetos em imagens.
― 7 min ler
Ciência de ponta explicada de forma simples
Analisando como os transformers de visão entendem as relações entre objetos em imagens.
― 7 min ler
Um estudo revela diferenças chave em como humanos e IA representam imagens.
― 7 min ler
Um estudo sobre como os VAEs se saem em diferentes grupos demográficos sob ataque.
― 7 min ler
HEML melhora a classificação de imagens ao focar em segmentos importantes para explicações melhores.
― 7 min ler
O FALIP melhora a compreensão de imagem e texto do CLIP sem mudar os originais.
― 6 min ler
Esse projeto tem o objetivo de classificar espécies de cobras usando técnicas de análise de imagem.
― 7 min ler
Novos métodos melhoram a detecção de objetos angulados em imagens aéreas.
― 6 min ler
Uma nova medida de avaliação melhora o desempenho do modelo em tarefas de classificação multi-label.
― 8 min ler
Uma ferramenta pra analisar e melhorar os erros de reconhecimento de imagem em computadores.
― 7 min ler
A SPIN oferece anotações detalhadas de subpartes pra melhorar o reconhecimento de imagem.
― 10 min ler
O NOVIC apresenta capacidades de vocabulário aberto para identificar objetos não vistos em imagens.
― 9 min ler
Novos métodos de atenção melhoram os modelos de transformadores em eficiência e desempenho.
― 6 min ler
Um programa melhora a detecção de objetos por robôs em ambientes que mudam.
― 5 min ler
Um novo método melhora a clareza nas tarefas de reconhecimento de imagem.
― 7 min ler
Uma olhada nos pontos fortes e fracos dos KANs e MLPs em aprendizado de máquina.
― 6 min ler
O PEEKABOO ajuda máquinas a localizar objetos sem dados rotulados através de mascaramento de imagem.
― 6 min ler
Novos métodos deixam os modelos de reconhecimento de imagem menores e mais eficientes.
― 6 min ler
MALT melhora a eficiência e o sucesso de ataques adversariais em modelos de classificação de imagem.
― 6 min ler
Uma nova abordagem melhora o desempenho de adaptação de domínio em machine learning.
― 6 min ler
O MoMa melhora a eficiência em processar imagens e texto junto.
― 8 min ler
Um estudo sobre os desafios e soluções para alucinações em MLLMs.
― 5 min ler
Este artigo explora o impacto do barulho nas saídas softmax e na precisão da classificação.
― 7 min ler
Este artigo analisa a eficácia do YOLOv8 em identificar a maturação dos morangos.
― 7 min ler
Self-TPT simplifica o ajuste de prompts para modelos de visão-linguagem, melhorando a velocidade e eficiência.
― 9 min ler
Um novo método melhora o reconhecimento de texto em cenas naturais usando técnicas inovadoras.
― 6 min ler
Uma nova abordagem busca melhorar a resiliência da aprendizagem ativa contra ataques.
― 10 min ler
Um novo método melhora o reconhecimento de combinações de atributos e objetos que o modelo nunca viu.
― 8 min ler
Pesquisas mostram que a exposição repetida melhora o reconhecimento de imagens no cérebro.
― 8 min ler
Um novo framework melhora a adaptabilidade do aprendizado de máquina em ambientes visuais diversos.
― 7 min ler
Esse artigo explora o impacto dos ataques em modelos de aprendizado de máquina e as estratégias de defesa.
― 7 min ler
Aprenda como as simetrias de grupos podem melhorar modelos de classificação em aprendizado de máquina.
― 7 min ler
Um novo método tem como objetivo reduzir o viés em modelos de aprendizado de máquina pra melhorar a equidade.
― 6 min ler
Um novo método melhora a clareza no diálogo usando expressões de referência eficazes.
― 7 min ler
Essa pesquisa tem o objetivo de criar CAPTCHAs que confundem máquinas, mas são claros para os humanos.
― 6 min ler
O conjunto de dados MIP-GAF ajuda a analisar a dinâmica social em imagens.
― 6 min ler
A pesquisa apresenta um método pra melhorar o reconhecimento de imagens usando menos exemplos.
― 7 min ler
Novo método melhora agrupamento para grandes conjuntos de dados usando Quantização Estocástica.
― 6 min ler
Este artigo avalia o sentimento e o significado nas legendas de imagens.
― 4 min ler
Pesquisas mostram que há falhas em modelos de classificação de imagem quando os objetos estão parcialmente escondidos.
― 7 min ler
O LPT++ melhora o reconhecimento de objetos em classes com poucos exemplos usando técnicas avançadas.
― 8 min ler