Aprenda como as máquinas estimam profundidade e se adaptam a diferentes ambientes.
― 5 min ler
Ciência de ponta explicada de forma simples
Aprenda como as máquinas estimam profundidade e se adaptam a diferentes ambientes.
― 5 min ler
Um novo método acelera o reconhecimento de ações em vídeos com menos dados.
― 6 min ler
O Free-Mask automatiza a rotulagem de imagens, aumentando a eficiência da segmentação semântica.
― 8 min ler
Um olhar sobre como as máquinas aprendem a reconhecer objetos sem rótulos.
― 9 min ler
Um novo método promete uma síntese de imagem melhor a partir de entradas limitadas.
― 6 min ler
Este estudo investiga como o aprendizado contrastivo melhora a agrupação de dados através de GMMs.
― 6 min ler
Um modelo melhora a identificação de anormalidades em exames de ressonância magnética do cérebro.
― 6 min ler
Explorando ajuste fino eficiente em parâmetros para precisão e incerteza na estimativa de profundidade.
― 5 min ler
Revolucionando a forma como a gente cria avatares 3D realistas em tempo real.
― 8 min ler
Explorando uma nova maneira de melhorar a segmentação semântica usando princípios de compressão.
― 7 min ler
OLAF melhora a análise de cenas pra um reconhecimento de objetos mais eficiente em imagens.
― 5 min ler
Aprenda como os drones usam fluxo óptico para evitar obstáculos e voar suave.
― 10 min ler
A LidaRefer melhora o reconhecimento de objetos externos para veículos autônomos.
― 6 min ler
Pesquisas destacam problemas de segurança em diferentes camadas nos modelos de visão-linguagem.
― 6 min ler
Câmeras de eventos aumentam a velocidade e a eficiência na tecnologia de processamento visual.
― 6 min ler
Uma olhada em novos métodos para identificar pessoas em diferentes configurações de câmeras.
― 6 min ler
Harmformer melhora o reconhecimento de imagens ao lidar bem com rotações e translações.
― 6 min ler
Novo framework combina geração e entendimento de imagem usando modelos de difusão.
― 4 min ler
SaSR-Net conecta sons e visuais pra responder direitinho perguntas sobre vídeos.
― 8 min ler
O VideoGLaMM melhora a compreensão de vídeos através de conexões visuais e textuais detalhadas.
― 7 min ler
Uma nova abordagem melhora a identificação de partes de edifícios para um planejamento urbano mais inteligente.
― 8 min ler
SimCLR melhora o treinamento de modelos usando dados não rotulados em tarefas de visão.
― 8 min ler
Um olhar sobre a fragmentação da rede e seu impacto no desempenho do modelo.
― 8 min ler
Uma nova abordagem melhora a precisão na estimativa de pose 3D para máquinas.
― 8 min ler
Pesquisadores estão investigando as habilidades de raciocínio espacial de Grandes Modelos Multimodais.
― 7 min ler
Um novo método melhora o aprendizado de imagens, mesmo com ruído nos rótulos.
― 4 min ler
Um olhar sobre como o VLM melhora as tarefas de navegação dos robôs.
― 9 min ler
R-JEPA aprende a processar imagens como nossos cérebros, melhorando a visão computacional.
― 7 min ler
Uma nova abordagem melhora o aprendizado do modelo a partir de dados de imagem variados.
― 7 min ler
Esse artigo fala sobre o papel dos gráficos no aprendizado incremental de classe com poucos exemplos.
― 5 min ler
Aprenda como a segmentação de superpixels facilita a análise de imagens para máquinas.
― 6 min ler
O D2Net oferece um jeito novo de melhorar imagens em UHD de forma eficaz.
― 6 min ler
O PKF melhora a precisão do rastreamento de objetos em ambientes complexos.
― 6 min ler
Uma nova versão do Xception que funciona de boa em dispositivos limitados.
― 8 min ler
Um novo método melhora a estimativa de profundidade para robótica e visão computacional.
― 5 min ler
Um novo método ajuda robôs a aprender ações a partir de vídeos sem precisar de muitos dados.
― 7 min ler
Um novo sistema melhora a identificação gerando imagens variadas de roupas.
― 7 min ler
Modelos de difusão melhoram a visão máquina para detecção de profundidade, movimento e objetos escondidos.
― 6 min ler
O CP-Mix melhora o reconhecimento de imagem para classes raras usando métodos de emparelhamento de confusão.
― 5 min ler
UniHOI avança o estudo da interação entre humanos e objetos em vídeos.
― 6 min ler