Dynamic Mobile-Former melhora a eficiência e desempenho da visão computacional com convolução dinâmica.
― 7 min ler
Ciência de ponta explicada de forma simples
Dynamic Mobile-Former melhora a eficiência e desempenho da visão computacional com convolução dinâmica.
― 7 min ler
Uma abordagem inovadora pra alinhar vídeos sem exemplos ou treinamento anteriores.
― 5 min ler
Uma nova abordagem alinha nuvens de pontos 3D sem dados rotulados.
― 7 min ler
KD-DLGAN melhora a qualidade da geração de imagens usando destilação de conhecimento.
― 6 min ler
Explorando novas maneiras de melhorar o aprendizado com dados limitados.
― 6 min ler
O benchmark RoboBEV avalia sistemas BEV em relação a desafios do mundo real.
― 9 min ler
SpectFormer combina camadas espectrais e de atenção para melhorar a análise de imagens.
― 6 min ler
Esse framework usa adaptação no tempo de teste pra melhorar as previsões dos movimentos humanos.
― 7 min ler
Um novo método identifica ações em vídeos sem precisar de dados previamente rotulados.
― 6 min ler
Promptagem Hierárquica melhora a precisão e eficiência na classificação de imagens com rotulagem estruturada.
― 8 min ler
Novas técnicas melhoram a previsão de profundidade a partir de imagens únicas.
― 7 min ler
A pesquisa tem como objetivo melhorar a representação de dados usando métodos não lineares e estruturas temporais.
― 7 min ler
EWT combina transformadas wavelet e Transformers pra melhorar a clareza e a eficiência das imagens.
― 7 min ler
Uma nova abordagem pra categorizar imagens sem rótulo de forma eficaz.
― 6 min ler
Um novo método melhora a precisão do VPR gerando imagens de referência adicionais.
― 6 min ler
Um novo método melhora o reconhecimento de ações usando dados parcialmente rotulados.
― 6 min ler
Aprenda como a Smooth IoU Loss melhora a precisão da detecção de objetos.
― 6 min ler
O PARFormer melhora o reconhecimento de pedestres usando redes transformer pra ter mais precisão.
― 7 min ler
Esse método melhora a estimativa de fluxo óptico sem depender de dados rotulados.
― 7 min ler
Um sistema que combina imagens com significados de palavras usando contexto.
― 7 min ler
Uma competição recente mostrou o progresso em medir profundidade usando imagens únicas.
― 6 min ler
Combinar LIDAR com imagens em escala de cinza aumenta a precisão e economiza energia.
― 6 min ler
Um método novo combina luz visível e imagens térmicas pra melhorar a precisão da classificação.
― 7 min ler
Um novo método melhora a precisão da detecção de objetos ao resolver problemas de confiança nas previsões.
― 6 min ler
Um novo framework melhora o reconhecimento em ambientes cheios, mesmo com visões bloqueadas.
― 5 min ler
Uma nova abordagem para melhorar a reconstrução de objetos atrás de superfícies reflexivas.
― 6 min ler
Um novo método melhora a resposta a perguntas em vídeos usando hipergráfos de situação.
― 8 min ler
ProPanDL melhora a segmentação panóptica ao incorporar incerteza na detecção de objetos.
― 6 min ler
Um novo método melhora a precisão da estimativa do layout de ambientes para paredes distantes.
― 6 min ler
Analisando como dados sintéticos melhoram a precisão da classificação de imagens no ImageNet.
― 6 min ler
Uma nova maneira de criar imagens realistas usando apenas duas fotos.
― 6 min ler
Apresentando o EVAD, um método pra detectar ações em vídeos de forma mais rápida e precisa.
― 7 min ler
Um novo rastreador identifica e acompanha vários objetos em vídeos de forma eficiente.
― 8 min ler
Explorando os avanços em deep learning na tecnologia de câmeras omnidirecionais para várias aplicações.
― 7 min ler
Novas abordagens para detectar poses humanas usando imagens omnidirecionais mostram resultados promissores.
― 6 min ler
Um novo método melhora a precisão da inspeção de PCBs usando múltiplos ângulos.
― 7 min ler
Um novo método melhora o rastreamento da posição da câmera durante procedimentos cirúrgicos difíceis.
― 7 min ler
Um novo método melhora a aprendizagem a partir de imagens não centradas em objetos através da sensibilidade geométrica.
― 7 min ler
Um estudo que examina a confiabilidade das explicações visuais em redes neurais.
― 7 min ler
Analisando como sistemas de deep learning identificam objetos usando visões limitadas.
― 8 min ler