Um novo método melhora os Transformers de Visão para uma melhor compreensão de imagens com menos recursos.
― 6 min ler
Ciência de ponta explicada de forma simples
Um novo método melhora os Transformers de Visão para uma melhor compreensão de imagens com menos recursos.
― 6 min ler
Uma abordagem estruturada para o posicionamento eficaz de sensores em tarefas de visão robótica.
― 6 min ler
Um novo método melhora o realismo das imagens através do controle de forma 3D em modelos de difusão.
― 7 min ler
O sistema AVIS melhora a resposta a perguntas visuais com fluxos de trabalho estruturados e grafos de transição.
― 7 min ler
Explorando o potencial das câmeras de evento pra melhorar a detecção de pedestres em veículos autônomos.
― 6 min ler
Um referencial pra avaliar a semelhança de imagens com base em condições definidas pelo usuário.
― 7 min ler
Novo método melhora a estimativa de profundidade usando sensores de dual-pixel em vários dispositivos de imagem.
― 7 min ler
Um jeito de criar formas 3D realistas só com dados 2D.
― 7 min ler
Um novo método melhora as técnicas de remoção de texto em imagens.
― 4 min ler
Exemplos adversariais podem confundir sistemas de detecção de objetos, revelando brechas de segurança.
― 6 min ler
Um novo modelo melhora a velocidade e a precisão na detecção de ações em análises de vídeo em tempo real.
― 8 min ler
A anisotropia afeta o desempenho dos modelos Transformer em vários tipos de dados.
― 6 min ler
Um novo método melhora como os modelos entendem as relações entre imagem e texto.
― 7 min ler
OCAtari foca em objetos de jogo pra melhorar o aprendizado de máquina.
― 7 min ler
Um novo método usa busca de arquitetura neural pra melhorar a detecção de falsificações faciais.
― 8 min ler
Um novo modelo melhora a conexão entre imagens e suas descrições em texto.
― 6 min ler
Um novo método cria avatares 3D super realistas a partir de só uma foto.
― 7 min ler
Novos métodos melhoram a qualidade e a velocidade nos modelos de texto para imagem.
― 8 min ler
Este estudo explora como a IA pode aprender palavras ligando elas a imagens.
― 9 min ler
Um novo método prevê formas 3D a partir de imagens RGB únicas usando dados de profundidade.
― 6 min ler
TomoSAM facilita a segmentação de imagens 3D, melhorando a eficiência e a precisão para os pesquisadores.
― 6 min ler
A pesquisa melhora o reconhecimento de esboços para uma combinação melhor de formas 3D.
― 6 min ler
P2D melhora a detecção de objetos 3D em carros autônomos usando previsão de movimento.
― 7 min ler
Novos métodos melhoram a qualidade da imagem usando dados de campo de luz do mundo real.
― 7 min ler
Ground-VIO melhora a estimativa de pose do veículo usando relações câmera-solo.
― 8 min ler
Um novo modelo melhora como as máquinas reconhecem imagens ao misturar características globais e locais.
― 7 min ler
Uma nova estratégia garante a representação igualitária dos tipos de dados em aprendizado de máquina.
― 7 min ler
Uma nova abordagem pra aumentar a confiança na detecção de objetos por meio de técnicas de calibração confiáveis.
― 7 min ler
Um novo método revela como as reflexões dos olhos podem reconstruir ambientes 3D.
― 7 min ler
MaskDiT melhora a eficiência do treinamento de modelos de difusão sem perder a qualidade da imagem.
― 8 min ler
Um estudo sobre o desempenho de Modelos de Fundação Visuais sob distorções do mundo real em tarefas de segmentação.
― 10 min ler
DiffAug melhora sistemas de reconhecimento de imagem com técnicas de ruído inovadoras.
― 7 min ler
Apresentando o CANN, um método pra localizar visualmente com precisão usando recursos locais.
― 8 min ler
Um novo método melhora a geração de imagens a partir de texto, ligando corretamente entidades e modificadores.
― 6 min ler
Novos métodos melhoram a segmentação de instrumentos cirúrgicos pra operações robóticas mais eficientes.
― 8 min ler
Um novo método melhora a análise de imagens para aplicações biomédicas.
― 7 min ler
O FETNet melhora os métodos de remoção de texto em cenas pra uma privacidade e restauração de imagem melhores.
― 7 min ler
Uma olhada no Desafio de Topologia OpenLane e seus métodos inovadores.
― 7 min ler
Um novo framework melhora a segmentação de nuvens de pontos usando modelos de visão.
― 6 min ler
Pesquisas mostram que neurônios comuns ajudam na compreensão em vários modelos de IA.
― 6 min ler