Um novo método oferece várias razões para classificações de imagens, melhorando a compreensão e a confiança.
― 6 min ler
Ciência de ponta explicada de forma simples
Um novo método oferece várias razões para classificações de imagens, melhorando a compreensão e a confiança.
― 6 min ler
SINCERE melhora o aprendizado contrastivo supervisionado com uma separação e representação de classes melhores.
― 7 min ler
Avaliando grandes modelos em tarefas visuais de baixo nível através do Q-Bench.
― 6 min ler
O AsymFormer melhora a compreensão do ambiente pelos robôs com processamento RGB-D eficiente.
― 5 min ler
Estratégias pra melhorar a interpretabilidade em sistemas de IA pra entender melhor.
― 7 min ler
Esse artigo examina o papel dos modelos de linguagem em responder perguntas a partir de documentos.
― 8 min ler
Um novo conjunto de dados voltado pra melhorar o reconhecimento de objetos durante o corte.
― 8 min ler
Um novo método permite que modelos reconheçam tanto objetos conhecidos quanto desconhecidos.
― 8 min ler
Um novo método gera rótulos detalhados para segmentação semântica usando dados sintéticos.
― 12 min ler
Novos métodos melhoram a avaliação de desempenho de pequenos objetos em WSSS.
― 7 min ler
O método BoIR melhora o rastreamento de várias pessoas em imagens, aumentando a precisão em cenas cheias.
― 6 min ler
Um novo método melhora o aprendizado de objetos 3D sem precisar de dados rotulados.
― 7 min ler
Um novo método melhora a colocação das câmeras para gerar imagens 3D de alta qualidade.
― 7 min ler
Novos métodos melhoram a eficiência de memória e a precisão na segmentação de objetos em vídeo.
― 8 min ler
Um novo método melhora a estimativa de pose 3D a partir de imagens 2D de várias pessoas.
― 6 min ler
Uma nova abordagem simplifica a adaptação para detecção de objetos em diferentes ambientes.
― 9 min ler
O M 3D melhora a compreensão das máquinas sobre dados visuais usando imagens e informações de profundidade.
― 6 min ler
Um novo método melhora o ajuste fino dos transformadores de visão, reduzindo as necessidades de computação.
― 6 min ler
ObVi-SLAM melhora a localização do robô ao combinar características visuais e detecção de objetos.
― 10 min ler
Um método pra transformar rostos em cartoon mantendo as características únicas.
― 7 min ler
Uma nova abordagem traduz descrições de texto em sequências de vídeo.
― 6 min ler
Uma nova abordagem simplifica o design de modelos para dispositivos com poder de computação limitado.
― 7 min ler
Melhorando o NAS Zero-Shot usando correção de viés pra um desempenho melhor do modelo.
― 5 min ler
Mask4D melhora o rastreamento e reconhecimento de objetos em ambientes dinâmicos usando dados de LiDAR.
― 6 min ler
Apresentando um método de aprendizado ativo que combina incerteza e diversidade pra melhorar a eficiência de rotulação.
― 9 min ler
Combinar pontos e linhas melhora a precisão na estimativa das relações de imagem.
― 5 min ler
Apresentando o Q-REG, um método que otimiza o registro de nuvens de pontos 3D através de um treinamento de ponta a ponta.
― 8 min ler
Novos métodos melhoram o desempenho do VideoQA usando dados de treinamento mínimos.
― 6 min ler
STRPCA melhora a subtração de fundo pra uma detecção de objeto melhor em vídeos.
― 6 min ler
Um método novo pra criar imagens rapidão com base nas posições da câmera em espaços reais.
― 9 min ler
Novo conjunto de dados e método melhoram a precisão e eficiência da análise de fachadas.
― 7 min ler
Combinar modelos de linguagem e visão melhora a resposta a perguntas sobre imagens sem precisar de muito treinamento.
― 7 min ler
Estudo mostra que o Aprendizado Contrastivo Supervisionado melhora o desempenho do modelo em diferentes conjuntos de dados.
― 6 min ler
Saiba sobre novas técnicas que melhoram a orientação da câmera na reconstrução de cenas em 3D.
― 6 min ler
Um novo modelo melhora o reconhecimento de imagem se adaptando a transformações de um jeito único.
― 7 min ler
Apresentando o MetaCLIP pra melhorar a coleta de dados de imagem e texto.
― 9 min ler
O Model2Scene usa modelos CAD e linguagem pra melhorar o aprendizado de cenas 3D.
― 5 min ler
Um novo método melhora o rastreamento e o processamento na análise de vídeo.
― 7 min ler
Novo método reduz tokens de visão para um treinamento mais econômico.
― 5 min ler
Aprenda sobre métodos para lidar de forma eficiente com dados multidimensionais usando recuperação de tensor.
― 9 min ler