GMSF traz uma nova maneira de estimar movimento em 3D.
― 7 min ler
Ciência de ponta explicada de forma simples
GMSF traz uma nova maneira de estimar movimento em 3D.
― 7 min ler
Novos métodos melhoram a reconstrução 3D de superfícies reflexivas usando técnicas de renderização neural.
― 8 min ler
Esse artigo investiga a necessidade do componente de consulta nos modelos de transformer.
― 4 min ler
Um novo modelo melhora a geração de dados a partir de vários tipos de entrada.
― 7 min ler
O T2FNorm melhora a habilidade das redes neurais de detectar dados desconhecidos.
― 8 min ler
Aprenda sobre o YOLO para detecção de objetos em tempo real.
― 6 min ler
Aprenda a criar um sistema que identifica rodas de veículos em diferentes condições.
― 8 min ler
Pesquisadores usam imagens pra ensinar os robôs a interagir com o mundo.
― 6 min ler
Novo framework melhora a precisão da localização de objetos 3D usando uma única câmera.
― 6 min ler
Este estudo analisa como modelos de deep learning interpretam lógica em diagramas usando ilusões visuais.
― 8 min ler
Novo conjunto de dados melhora a capacidade de perguntas sobre imagens no processamento da língua Hausa.
― 7 min ler
Caterpillar é uma nova arquitetura MLP pra captar detalhes locais de imagem.
― 8 min ler
Uma nova abordagem para rodar modelos X3D em FPGAs para análise de vídeo eficiente.
― 8 min ler
Um framework pra melhorar modelos generativos usando modelos de difusão pré-treinados.
― 8 min ler
Uma nova abordagem integra métodos de kernel com aprendizado profundo pra um desempenho melhor.
― 7 min ler
Um novo método melhora modelos de visão-linguagem com feedback em tempo real pra ter um desempenho melhor.
― 7 min ler
O LayoutMask melhora a interação com texto e layout pra uma compreensão melhor dos documentos.
― 6 min ler
Uma nova abordagem pra melhorar a geração de grafos de cena pra uma melhor compreensão visual.
― 12 min ler
PaLI-X combina habilidades de visão e linguagem, se destacando em várias tarefas.
― 7 min ler
Este estudo avalia diferentes técnicas para detectar formas 3D em rotação.
― 9 min ler
Novas redes neurais aprendem transformações direto dos dados, melhorando a eficiência e a compreensão das simetrias.
― 8 min ler
SlimFit reduz o uso de memória para modelos transformer durante o ajuste fino.
― 6 min ler
Esse método melhora modelos de visão e linguagem sem precisar de imagens rotuladas.
― 7 min ler
Novo método melhora a capacidade dos modelos de IA de detectar objetos usando contexto.
― 7 min ler
Um método pra melhorar a eficiência em transformers de visão sem perder desempenho.
― 5 min ler
Nova abordagem melhora como a IA reconhece combinações únicas de atributos e objetos.
― 5 min ler
ReSup melhora o reconhecimento de emoções ao lidar de forma eficaz com rótulos ruidosos.
― 6 min ler
Novo framework melhora a correspondência de imagens para diversas aplicações em visão computacional.
― 7 min ler
Occ-BEV melhora a percepção do veículo por meio de modelagem 3D com várias câmeras e integração de dados.
― 7 min ler
Uma análise de Transformers de Visão menores que são adequados para aplicativos móveis.
― 6 min ler
Um novo método melhora como a gente processa dados complexos, reconhecendo simetrias.
― 6 min ler
Um novo método combina NeRF e MDE pra melhorar a modelagem 3D com poucas imagens.
― 9 min ler
Métodos inovadores revelam vulnerabilidades em modelos de reconhecimento de imagem.
― 9 min ler
DisCLIP melhora a precisão das descrições de imagem usando modelos visuais-linguísticos avançados.
― 9 min ler
Apresentando um modelo que integra vários tipos de dados para tarefas complexas.
― 6 min ler
Um novo método melhora a precisão de Respostas a Perguntas Visuais usando conhecimento externo.
― 6 min ler
Um novo método melhora a precisão na estimativa de poses humanas a partir de vídeo.
― 6 min ler
Um novo método melhora a precisão ao reconhecer classes menos comuns em conjuntos de dados desbalanceados.
― 7 min ler
Um novo modelo enfrenta os desafios da adaptação de domínio para aprendizado de máquina.
― 7 min ler
Um novo método melhora a precisão do reconhecimento de escrita à mão em Bangla.
― 6 min ler