Um novo método melhora a modelagem 3D a partir de vídeos de uma única câmera.
― 5 min ler
Ciência de ponta explicada de forma simples
Um novo método melhora a modelagem 3D a partir de vídeos de uma única câmera.
― 5 min ler
Apresentando um novo método para melhorar a generalização de domínio em aprendizado de máquina.
― 9 min ler
Um novo conjunto de dados ajuda a prever traços individuais a partir de imagens de corpo inteiro.
― 6 min ler
Um novo método ajuda os robôs a enxergar bem o que tá ao redor sem precisar de ajuda humana.
― 6 min ler
Essa pesquisa analisa como problemas visuais afetam modelos de Resposta a Perguntas Visuais.
― 8 min ler
Novos métodos de normalização melhoram a capacidade do Slot Attention de reconhecer objetos em imagens.
― 7 min ler
Um novo método melhora a estimativa de profundidade usando imagens de múltiplas câmeras.
― 5 min ler
Método de conjunto inovador melhora a precisão de modelos de linguagem e visuais.
― 8 min ler
Descubra como os modelos de difusão melhoram a augmentação de dados de imagem em machine learning.
― 9 min ler
Um novo método baseado em pontos melhora a compreensão de cenas para veículos autônomos.
― 6 min ler
Novo método melhora a precisão da segmentação de imagem usando classificação baseada em patch.
― 7 min ler
CLIP-CITE melhora os modelos CLIP para tarefas específicas, mantendo a flexibilidade.
― 7 min ler
TrackPGD testa os limites do rastreamento de objetos através de ataques adversariais avançados.
― 6 min ler
Um novo método para captar imagens inspirado na visão humana.
― 8 min ler
O PANet revoluciona o reconhecimento de objetos 3D focando nas partes ao invés das views.
― 6 min ler
O VA-Count melhora a precisão e a flexibilidade na contagem de objetos invisíveis.
― 10 min ler
Descubra como a quantização dinâmica adaptativa melhora os modelos VQ-VAE para uma representação de dados mais maneira.
― 6 min ler
Este estudo melhora o aprendizado por transferência otimizando as taxas de aprendizado para cada camada.
― 8 min ler
HEML melhora a classificação de imagens ao focar em segmentos importantes para explicações melhores.
― 7 min ler
Varifolds neurais melhoram a análise de nuvens de pontos 3D para várias aplicações.
― 8 min ler
Um novo método melhora o reconhecimento de dados de nuvem de pontos para veículos autônomos.
― 6 min ler
Um método pra aumentar a eficiência do modelo em aprendizado de máquina com estratégias de poda eficazes.
― 5 min ler
Uma nova estrutura melhora a adaptação dos modelos de visão-linguagem através de um processamento de dados inteligente.
― 7 min ler
Um novo método melhora a descoberta de partes em imagens usando transformers.
― 8 min ler
Um novo framework aumenta o desempenho do modelo com dados limitados.
― 4 min ler
Uma nova maneira de melhorar a modelagem de nuvem de pontos foi proposta.
― 6 min ler
STAformer melhora a previsão de ações em vídeos usando técnicas baseadas em atenção.
― 6 min ler
Um novo método melhora o rastreamento de objetos gerenciando a memória de forma eficiente.
― 7 min ler
Um novo modelo melhora a segmentação de paisagens 3D complexas, aumentando a precisão e a eficiência.
― 7 min ler
Analisando como a invariância impacta o desempenho do modelo em aprendizado por transferência.
― 6 min ler
Um novo método baseado em gráfico melhora a precisão e eficiência do rastreamento de múltiplos objetos.
― 7 min ler
Câmeras baseadas em eventos melhoram a detecção de pedestres em veículos autônomos e ambientes urbanos.
― 8 min ler
Descubra métodos para identificar e representar formas em imagens.
― 5 min ler
O LongSync melhora a precisão de modelos 3D usando ciclos mais longos para a sincronização da câmera.
― 8 min ler
As máquinas melhoram em responder perguntas sobre imagens com um treinamento estruturado.
― 5 min ler
O FeatureSORT melhora a precisão e a flexibilidade do rastreamento em ambientes dinâmicos.
― 8 min ler
Um novo método melhora a precisão de rastreamento 3D usando dados de nuvem de pontos.
― 6 min ler
Uma nova abordagem melhora a clareza das perguntas geradas a partir de imagens.
― 7 min ler
Novo framework melhora a eficiência dos Vision Transformers mantendo a precisão.
― 7 min ler
O FALIP melhora a compreensão de imagem e texto do CLIP sem mudar os originais.
― 6 min ler