Um novo método para gerar gestos que combinam com a fala de forma eficaz.
― 8 min ler
Ciência de ponta explicada de forma simples
Um novo método para gerar gestos que combinam com a fala de forma eficaz.
― 8 min ler
Detectar a subjetividade nas notícias é crucial pra ter informações precisas.
― 7 min ler
VEATIC oferece um conjunto de dados mais rico para estudar as emoções humanas no contexto.
― 8 min ler
Avaliando o realismo e a qualidade dos vídeos gerados a partir de texto.
― 8 min ler
Um novo método melhora a compressão de imagens para diferentes tipos de imagem.
― 8 min ler
Este artigo fala sobre o viés do tamanho do quadro na busca de texto-vídeo e uma nova abordagem para resolver isso.
― 7 min ler
Um novo método melhora a forma como a tecnologia detecta o comportamento humano em grupos.
― 6 min ler
Aprenda como o LP-CLIP melhora a robustez de modelos multimodais como o CLIP.
― 6 min ler
Um conjunto de dados inovador ajuda no estudo da tradução de letras de K-pop.
― 9 min ler
A AVMIT dá pros pesquisadores umas ideias de como o som e a visão se relacionam no reconhecimento de ações.
― 7 min ler
Um novo método melhora a detecção de áudio falso em sistemas de reconhecimento de voz.
― 8 min ler
Este estudo analisa como o corte de vídeo pode melhorar a lembrança, focando na saliência visual.
― 6 min ler
Avaliando grandes modelos em tarefas visuais de baixo nível através do Q-Bench.
― 6 min ler
Um novo método melhora gravações de áudio usando pistas visuais.
― 7 min ler
Explorando o impacto do conteúdo gerado por IA na arte de contar histórias.
― 9 min ler
Um novo sistema conecta imagens emocionais à música pra melhorar a descoberta.
― 7 min ler
MFTR aumenta a precisão da previsão de viewport para experiências de vídeo imersivas.
― 7 min ler
Um sistema pra tornar o controle remoto de UAVs mais seguro e confiável usando Gêmeo Digital.
― 7 min ler
Uma nova estrutura identifica e mede o viés em sistemas de geração de imagens.
― 9 min ler
Explore como os Modelos de Difusão melhoram a super-resolução em várias áreas.
― 6 min ler
Um novo modelo melhora vídeos de baixa qualidade enquanto diminui a carga de processamento.
― 9 min ler
SAMA melhora a avaliação de qualidade de imagem e vídeo com técnicas de amostragem eficazes.
― 6 min ler
Esse estudo analisa as dificuldades de usar aprendizado contrastivo pra entender vídeo musical.
― 7 min ler
Um novo método simplifica o design dos olhos de personagens animados.
― 7 min ler
Um novo método melhora a compressão de imagem focando nas bandas de frequência.
― 7 min ler
Vlogger simplifica o vídeo blog, deixando mais rápido e fácil pra galera que cria conteúdo.
― 7 min ler
Analisando o uso de energia e o impacto do streaming de vídeo no meio ambiente.
― 8 min ler
Uma abordagem unificada pra avaliar a alimentação dos peixes usando dados de áudio e vídeo.
― 6 min ler
Descubra como a IA tá mudando a criação e o streaming de vídeo.
― 7 min ler
Um conjunto de dados feito pra testar a qualidade de vídeo em situações de conferência.
― 6 min ler
Pesquisadores desenvolvem uma estrutura pra entender melhor vídeo e texto.
― 6 min ler
Um novo método melhora a segmentação áudio-visual sem precisar de rótulos detalhados.
― 6 min ler
A PIAVE ajuda máquinas a captar vozes com clareza, mesmo quando as pessoas viram a cabeça.
― 7 min ler
Um novo sistema que liga música e linguagem pra entender melhor.
― 7 min ler
Aprenda a criar pôsteres que transmitam mensagens de forma clara e atraente.
― 6 min ler
Um novo conjunto de dados melhora a capacidade da IA de interpretar o comportamento humano em vídeos.
― 8 min ler
A Spica melhora o acesso a vídeos para usuários cegos e com baixa visão através da interatividade.
― 5 min ler
Explorando métodos pra melhorar o desempenho de robôs em ambientes imprevisíveis.
― 6 min ler
Novo método transforma vozes usando características faciais para várias aplicações.
― 10 min ler
AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.
― 6 min ler