SpotlessSplats melhora a reconstrução 3D filtrando distrações em tempo real.
― 7 min ler
Ciência de ponta explicada de forma simples
SpotlessSplats melhora a reconstrução 3D filtrando distrações em tempo real.
― 7 min ler
Uma análise da codificação por wavelets e dos modelos de transformadores para a criação de imagens.
― 6 min ler
Melhorando como as máquinas respondem a perguntas visuais por meio de raciocínio estruturado.
― 7 min ler
MM-Instruct melhora a capacidade de grandes modelos multimodais de seguir instruções diversas.
― 6 min ler
OfCaM melhora a precisão em rastrear movimentos humanos usando gravações de vídeo.
― 6 min ler
Um novo método melhora o rastreamento de objetos usando integração de dados 3D.
― 6 min ler
Uma nova abordagem baseada em difusão lida com várias tarefas de visão computacional de forma eficaz.
― 6 min ler
Apresentando o BADM pra treinos mais rápidos e precisos em modelos de deep learning.
― 5 min ler
DeepMoveSORT melhora a eficiência do rastreamento de objetos, especialmente em cenários de movimento complexo.
― 5 min ler
Um novo modelo melhora como os modelos geram imagens a partir de textos complexos.
― 6 min ler
Novos modelos produzem descrições de vídeo de alta qualidade de forma eficiente.
― 5 min ler
Os robôs conseguem aprender de forma mais eficiente usando seu próprio formato na tomada de decisão.
― 7 min ler
ESGNN melhora a geração de grafos de cena a partir de nuvens de pontos 3D mantendo a simetria.
― 5 min ler
Uma nova abordagem para melhorar a performance de UDA usando CLIP e orientação de linguagem.
― 7 min ler
Um novo método pra melhorar modelos generativos usando contexto de forma eficaz.
― 8 min ler
Esse sistema resolve os desafios de ângulo nas buscas por imagens em esboço.
― 9 min ler
Um olhar sobre como melhorar modelos de deep learning pra eficiência em processamento de imagem.
― 6 min ler
ReGround3D melhora a compreensão das instruções humanas em ambientes 3D.
― 5 min ler
O FastCLIP permite treinar modelos CLIP de forma eficaz com menos recursos.
― 6 min ler
Novo método melhora o aprendizado em modelos de imagem-texto usando exemplos compostos.
― 7 min ler
Novo método melhora modelagem 3D sem conhecimento prévio do objeto.
― 6 min ler
AdaDistill melhora o reconhecimento facial otimizando a transferência de conhecimento entre modelos.
― 7 min ler
Um novo método melhora a performance do modelo em reconhecer classes sub-representadas.
― 7 min ler
RoDyn-SLAM melhora o mapeamento e rastreamento em ambientes com objetos em movimento.
― 7 min ler
Um novo método melhora o aprendizado de robôs com dados rotulados limitados.
― 14 min ler
Analisando a necessidade de verificação formal na tecnologia de detecção de objetos.
― 7 min ler
O MARS ajuda os robôs a perceberem e interagirem melhor com objetos articulados.
― 6 min ler
CPT melhora a performance de modelos de caixa-preta sem acesso direto aos parâmetros internos.
― 7 min ler
M IST melhora a interação entre modelos visuais e de linguagem pra um desempenho melhor.
― 7 min ler
Uma nova ferramenta pra melhorar a análise de formas na ciência e tecnologia.
― 8 min ler
LatentDEM resolve direitinho problemas inversos cegos em visão computacional e gráficos.
― 7 min ler
Novos métodos melhoram a geração de imagens alinhando os resultados com descrições de texto específicas.
― 9 min ler
Uma rede leve para estimativa de pose em tempo real em dispositivos móveis.
― 7 min ler
A gente propõe um jeito de melhorar a eficiência dos transformers de visão em dispositivos edge.
― 7 min ler
Aprenda a comparar medidas de probabilidade em estruturas de dados complexas.
― 8 min ler
Um novo método melhora a capacidade dos robôs de encontrar objetos em ambientes abertos.
― 9 min ler
Novos métodos melhoram a detecção de objetos pequenos na visão computacional.
― 8 min ler
Um novo método reduz a necessidade de dados rotulados em tarefas de visão computacional.
― 6 min ler
O modelo GCF melhora a precisão do reconhecimento de expressões faciais usando técnicas inovadoras de deep learning.
― 6 min ler
Uma nova estrutura tem como objetivo detectar e corrigir erros nos resultados de LVLM.
― 8 min ler