O MIBench testa o desempenho de modelos multimodais em várias imagens.
― 7 min ler
Ciência de ponta explicada de forma simples
O MIBench testa o desempenho de modelos multimodais em várias imagens.
― 7 min ler
Esse estudo destaca a importância da granularidade dos conjuntos de dados para melhorar os sistemas de recuperação de imagem e texto.
― 7 min ler
Um novo método pra criar avatares digitais super realistas a partir de vídeos.
― 5 min ler
Novos métodos usando câmeras panorâmicas têm como objetivo aumentar a segurança dos ciclistas nas ruas urbanas.
― 11 min ler
Novos métodos melhoram o desempenho do CLIP em diferentes domínios visuais.
― 7 min ler
Apresentando uma maneira eficiente de avaliar a qualidade das amostras geradas usando pontuações de densidade latente.
― 10 min ler
Um novo método melhora a precisão dos laudos radiológicos usando o histórico do paciente.
― 9 min ler
Um novo método melhora a detecção de objetos em imagens de sensoriamento remoto.
― 7 min ler
O framework X-Fake melhora a qualidade das imagens SAR simuladas pra deixar os aplicativos de deep learning melhores.
― 8 min ler
Uma nova abordagem pra melhorar a classificação de imagens médicas sem comprometer a privacidade dos pacientes.
― 6 min ler
Novo modelo cria de forma eficiente representações realistas de cabeças humanas em 3D.
― 8 min ler
Um novo framework pra criar imagens de alta qualidade com base em layouts específicos.
― 6 min ler
Padronizar critérios pode melhorar as ferramentas de IA para detectar carcinoma basocelular.
― 7 min ler
O IVISIT ajuda os usuários a simular e visualizar vários sistemas de forma eficiente.
― 7 min ler
Esse estudo analisa métodos de amostragem de quadros pra melhorar a busca de conteúdo em vídeo.
― 7 min ler
Uma olhada profunda no conjunto de dados InLUT3D de nuvens de pontos internas para pesquisa.
― 7 min ler
Este estudo revela como os atacantes podem enganar sistemas de detecção de objetos usando obfuscação de intenção.
― 6 min ler
Pesquisadores desenvolveram PAV para criar avatares digitais realistas a partir de clipes de vídeo.
― 6 min ler
Este estudo apresenta o Score Médio de Opinião pra avaliar os métodos de explicação de IA.
― 7 min ler
Nova arquitetura melhora a análise de vídeo em dispositivos pequenos usando múltiplos quadros.
― 5 min ler
Novos métodos melhoram a identificação de pessoas conhecidas e desconhecidas em biometria.
― 6 min ler
Novas técnicas melhoram a estimativa de profundidade em condições desafiadoras usando LiDAR de fóton único.
― 6 min ler
Um novo método melhora a segmentação semântica 3D integrando técnicas 2D.
― 8 min ler
Uma nova ferramenta facilita a criação de clipes de destaque específicos para jogadores a partir de vídeos de futebol.
― 7 min ler
Um método de duas fases melhora a precisão na análise de imagens do coração.
― 6 min ler
Apresentando um método pra avaliar modelos de IA em dados que nunca viram de forma mais eficaz.
― 7 min ler
Um novo método melhora como os modelos de visão-linguagem se adaptam durante os testes.
― 9 min ler
O AutoAD-Zero usa prompts visuais pra descrições de áudio mais rápidas e eficazes.
― 8 min ler
Um novo método melhora a qualidade da imagem 3D e reduz o tempo de treinamento.
― 7 min ler
Este estudo revela novos métodos para reconstruir dados de treinamento a partir de imagens de alta resolução.
― 10 min ler
Um método integra previsão de forma da mão com ajustes de câmera para modelos 3D.
― 8 min ler
Novo método melhora a tomada de decisão em carros autônomos através de representações focadas em objetos.
― 9 min ler
Um método pra acelerar o treino de modelos de linguagem multimodais grandes enquanto melhora o desempenho.
― 6 min ler
Explore técnicas econômicas para treinar modelos generativos de texto para imagem.
― 5 min ler
Um novo conjunto de dados tem como objetivo melhorar a precisão do reconhecimento facial para populações diversas.
― 8 min ler
Um grande conjunto de dados ajuda na comunicação para usuários surdos com smartphones.
― 6 min ler
Um novo método melhora a precisão na visão computacional em diferentes iluminações e ambientes.
― 8 min ler
Um método novo pra detectar objetos invisíveis usando aprendizado auto-supervisionado.
― 5 min ler
Um novo benchmark melhora a compreensão dos modelos sobre vídeos longos e linguagem.
― 6 min ler
Um novo método melhora a detecção de objetos desconhecidos em imagens variadas.
― 8 min ler