O CMDFusion junta dados 2D e 3D pra melhorar a detecção de objetos em carros autônomos.
― 7 min ler
Ciência de ponta explicada de forma simples
O CMDFusion junta dados 2D e 3D pra melhorar a detecção de objetos em carros autônomos.
― 7 min ler
Um método pra melhorar a qualidade da imagem usando técnicas da arquitetura Vision Transformer.
― 7 min ler
Estudo analisa como modelos de imagem lidam com várias transformações.
― 6 min ler
CTFN melhora a precisão da detecção de bordas usando recursos em múltiplas escalas e funções de perda dinâmicas.
― 6 min ler
Uma nova abordagem pra melhorar a precisão da segmentação de imagens e reduzir erros.
― 8 min ler
Métodos inovadores melhoram a separação de fundo e objetos em movimento em vídeos.
― 6 min ler
Um novo modelo melhora os sistemas de percepção para uma direção autônoma mais segura.
― 6 min ler
Analisando como modelos superparametrizados conseguem aprender e generalizar em configurações multiclasse.
― 7 min ler
O FODVid inova a segmentação de objetos em vídeo reduzindo a necessidade de input humano por meio da análise de movimento e aparência.
― 6 min ler
Um novo método avalia a qualidade da imagem em modelos de Texto para Imagem.
― 9 min ler
Pesquisa sobre como melhorar modelos de reconhecimento de escrita à mão para diferentes estilos de escrita.
― 7 min ler
MoP-CLIP melhora modelos de aprendizado em ambientes de dados em mudança.
― 10 min ler
Um novo método melhora o aprendizado para classes de imagem raras.
― 6 min ler
Um novo método automatiza os ajustes de forma em máscaras de segmentação semântica para síntese de imagem.
― 5 min ler
Apresentando o LWALM para reconhecimento eficaz de atributos de pedestres em dispositivos com recursos limitados.
― 6 min ler
Um novo método melhora a precisão na compreensão de relações dentro das imagens.
― 8 min ler
Um estudo sobre a habilidade dos VLMs de identificar tempo e lugar a partir de imagens.
― 10 min ler
Descubra como adicionar barulho melhora o desempenho das CNNs em tarefas de reconhecimento de imagem.
― 6 min ler
Este estudo avalia como as CNNs lidam com mudanças de cor na classificação de imagens.
― 8 min ler
Novas técnicas melhoram a detecção de anomalias em imagens e a compreensão de modelos.
― 6 min ler
Novos métodos melhoram a reconstrução de imagens e vídeos sem perder os detalhes locais.
― 6 min ler
Método inovador melhora a precisão da estimativa de pose de ângulos diversos.
― 7 min ler
Uma nova abordagem melhora como a IA conecta imagens e texto.
― 6 min ler
Novo método ajuda modelos de IA a manter flexibilidade enquanto se concentram em tarefas específicas.
― 7 min ler
Novos métodos melhoram a precisão de detecção de faixas para carros autônomos.
― 8 min ler
Novo método melhora ataques adversariais em redes neurais profundas usando mudanças semânticas.
― 8 min ler
Reduzindo a complexidade no aprendizado métrico profundo através de novas funções de perda.
― 6 min ler
Um novo método melhora a qualidade do preenchimento de imagem ao combinar informações de frequência e espaciais.
― 6 min ler
Novo framework reduz a necessidade de dados rotulados em tarefas de imagem de IA.
― 7 min ler
Essa pesquisa foca em reconhecer ações de forma eficiente usando só os frames de vídeo.
― 9 min ler
Usando visão computacional pra melhorar a classificação de defeitos na fabricação aditiva.
― 6 min ler
Apresentando um método pra melhorar a confiabilidade na busca de imagens pra aplicações críticas.
― 7 min ler
Novo método combina imagem multiespectral e hiperespectral pra melhorar a qualidade das imagens.
― 6 min ler
Uma nova abordagem melhora a detecção de eventos incomuns em vídeos.
― 7 min ler
Uma olhada em como os carros aprendem com dados de vídeo sem entradas rotuladas.
― 5 min ler
RayMVSNet e sua atualização melhoram a precisão da modelagem 3D a partir de imagens 2D.
― 7 min ler
Explore o funcionamento e as melhorias dos Transformers em várias tarefas de processamento de dados.
― 5 min ler
Apresentando um novo método para animação suave de poses humanas em vídeos.
― 7 min ler
ReSample usa modelos de difusão latente pra melhorar a reconstrução de imagens em várias aplicações.
― 9 min ler
Como modelos pré-treinados impactam o desempenho em novos dados.
― 5 min ler