Um novo método melhora como os modelos de visão-linguagem se adaptam durante os testes.
― 9 min ler
Ciência de ponta explicada de forma simples
Um novo método melhora como os modelos de visão-linguagem se adaptam durante os testes.
― 9 min ler
O AutoAD-Zero usa prompts visuais pra descrições de áudio mais rápidas e eficazes.
― 8 min ler
Um novo método melhora a qualidade da imagem 3D e reduz o tempo de treinamento.
― 7 min ler
Este estudo revela novos métodos para reconstruir dados de treinamento a partir de imagens de alta resolução.
― 10 min ler
Um método integra previsão de forma da mão com ajustes de câmera para modelos 3D.
― 8 min ler
Novo método melhora a tomada de decisão em carros autônomos através de representações focadas em objetos.
― 9 min ler
Um método pra acelerar o treino de modelos de linguagem multimodais grandes enquanto melhora o desempenho.
― 6 min ler
Explore técnicas econômicas para treinar modelos generativos de texto para imagem.
― 5 min ler
Um novo conjunto de dados tem como objetivo melhorar a precisão do reconhecimento facial para populações diversas.
― 8 min ler
Um grande conjunto de dados ajuda na comunicação para usuários surdos com smartphones.
― 6 min ler
Um novo método melhora a precisão na visão computacional em diferentes iluminações e ambientes.
― 8 min ler
Um método novo pra detectar objetos invisíveis usando aprendizado auto-supervisionado.
― 5 min ler
Um novo benchmark melhora a compreensão dos modelos sobre vídeos longos e linguagem.
― 6 min ler
Um novo método melhora a detecção de objetos desconhecidos em imagens variadas.
― 8 min ler
Uma nova abordagem pra avaliar o desempenho do modelo e a retenção de conhecimento.
― 6 min ler
Explorando como a diversidade dos dados afeta o desempenho de modelos de aprendizado profundo.
― 8 min ler
Uma nova abordagem melhora a consistência nas imagens de ressonância magnética de diferentes fontes.
― 8 min ler
Uma nova técnica otimiza formas usando formas geométricas simples pra ter mais detalhes.
― 7 min ler
O HaloQuest resolve problemas de alucinação em modelos de visão-linguagem com um novo conjunto de dados.
― 12 min ler
Esse estudo aprimora a medição da cabeça fetal por ultrassom usando técnicas de deep learning.
― 6 min ler
O SLVideo ajuda a galera a encontrar momentos específicos em vídeos de linguagem de sinais de forma fácil.
― 7 min ler
Explorando jeitos de melhorar o reconhecimento de lugares usando diferentes dados de sensores.
― 7 min ler
Esse estudo analisa como o desfoque gaussiano afeta a detecção de objetos em ambientes simulados.
― 7 min ler
O framework Norface enfrenta desafios em entender as emoções humanas através das expressões faciais.
― 7 min ler
Novas técnicas automáticas melhoram a precisão e a rapidez do diagnóstico de doenças da tireoide.
― 8 min ler
Este estudo melhora o reconhecimento de atividades usando modelos base e diferentes ângulos de câmera.
― 7 min ler
Este estudo avalia representações centradas em objetos em comparação com modelos base para tarefas de VQA.
― 6 min ler
O DNMap oferece uma nova forma de armazenar mapas 3D de maneira eficiente.
― 6 min ler
Um novo método melhora o uso de memória na localização de câmeras sem perder a precisão.
― 7 min ler
Este artigo explora a Reciclagem do Conhecimento para melhorar o treinamento de dados sintéticos em classificadores.
― 9 min ler
Novos métodos visam simplificar o cálculo do score SYNTAX para avaliação de doenças cardíacas.
― 6 min ler
Pesquisadores desenvolvem novos métodos pra melhorar a precisão dos modelos, mesmo sem dados de sensores.
― 6 min ler
Um novo método melhora a velocidade e a qualidade na criação de imagens panorâmicas.
― 6 min ler
Um novo método melhora a detecção de imagens geradas por IA focando nas áreas texturizadas.
― 7 min ler
DiffX cria imagens detalhadas combinando visuais padrões e dados extras.
― 6 min ler
Este artigo fala sobre maneiras de melhorar como os robôs identificam os usos dos objetos.
― 6 min ler
Novos métodos melhoram a imagem multispectral para agricultura e monitoramento ambiental.
― 7 min ler
Uma nova abordagem melhora a precisão da estimativa de pose humana em pouca luz.
― 7 min ler
Um método pra colocar as pessoas de forma realista em diferentes cenários usando modelos avançados.
― 6 min ler
Um novo método melhora a precisão e a eficiência do rastreamento de pontos na processaçao de vídeo.
― 6 min ler