Uma nova abordagem melhora a detecção de memes prejudiciais usando perguntas direcionadas.
― 9 min ler
Ciência de ponta explicada de forma simples
Uma nova abordagem melhora a detecção de memes prejudiciais usando perguntas direcionadas.
― 9 min ler
Explore os laços emocionais entre música e imagens com o dataset EMID.
― 6 min ler
Essa pesquisa conecta a atividade cerebral à percepção visual ao reconstruir imagens a partir dos sinais de EEG.
― 8 min ler
Descubra o impacto do ancoramento visual nas interações entre linguagem e imagem.
― 8 min ler
Um novo método aumenta a eficiência no reconhecimento de vídeo usando dados de áudio e visuais.
― 6 min ler
Um novo agente de IA melhora a eficiência e a qualidade dos testes de jogos.
― 7 min ler
A Dronevision tá revolucionando o multimedia 3D com um display do tamanho de uma mesa usando drones voadores.
― 8 min ler
Um estudo sobre sensores essenciais para o desempenho de novos drones.
― 5 min ler
Um novo framework melhora as sugestões de itens usando diferentes tipos de dados.
― 6 min ler
Descubra a EVE, um modelo que melhora a compreensão de imagens e texto.
― 7 min ler
A pesquisa foca em melhorar modelos que ligam visuais e texto através da compreensão de linguagem.
― 7 min ler
Novo modelo melhora a geração de gestos para interações mais parecidas com humanas.
― 6 min ler
Um novo método melhora a correspondência de áudio usando imagens, aumentando o realismo em ambientes de áudio.
― 8 min ler
Analisando preocupações com dados ocultos em modelos de machine learning e suas implicações de segurança.
― 8 min ler
Um conjunto de dados liga emoções a músicas MIDI analisando as letras das canções.
― 8 min ler
Uma nova abordagem melhora a precisão ao responder perguntas sobre textos em imagens.
― 6 min ler
O PROOFREAD melhora a resposta a perguntas visuais usando conhecimento de grandes modelos de linguagem.
― 7 min ler
Usando LLMs pra criar um dataset gigante pra legendagem de música.
― 7 min ler
A Rede de Difusão de Terreno melhora a criação de paisagens realistas com a participação dos usuários.
― 6 min ler
HierVST transforma vozes de forma suave, melhorando a qualidade do áudio sem precisar de muitos dados.
― 6 min ler
Uma nova abordagem transforma fotos de rostos em desenhos parecidos com humanos usando técnicas avançadas.
― 7 min ler
A pesquisa desenvolve um modelo pra medir com precisão o engajamento em conversas.
― 7 min ler
Uma nova maneira de proteger imagens RAW de manipulação.
― 5 min ler
Novo conjunto de dados e métodos melhoram a precisão na resposta de perguntas sobre vídeos.
― 7 min ler
A estrutura da UniSA unifica tarefas na análise de sentimentos pra uma melhor reconhecimento das emoções.
― 6 min ler
Um método que usa movimentos de cabeça engana com sucesso sistemas de detecção de deepfake.
― 6 min ler
Uma estrutura pra adaptação eficiente de modelos de linguagem grandes multimodais.
― 5 min ler
Usando protótipos pra melhorar a comparação de datasets em visão computacional.
― 9 min ler
Um programa que gera tipografia visualmente atraente, adaptada ao contexto.
― 5 min ler
MusicLDM transforma texto em música original, oferecendo novas maneiras de ser criativo.
― 8 min ler
Novos métodos melhoram a precisão de extrair melodias cantadas de áudios mistos.
― 8 min ler
Novos métodos buscam melhorar a legendagem de áudio pra ter mais precisão e eficiência.
― 6 min ler
Novas técnicas melhoram a avaliação da qualidade da legendagem de áudio através da detecção automática de erros.
― 6 min ler
Este estudo explora métodos de classificação de qualidade de voz e sua importância na comunicação.
― 5 min ler
A esteganálise ajuda a detectar mensagens escondidas em multimídia, garantindo uma comunicação segura.
― 5 min ler
Transformando gestos para agentes virtuais sem perder o significado.
― 6 min ler
Um método que usa áudio e vídeo pra detectar deepfakes melhor.
― 5 min ler
Um novo método cria gestos realistas a partir de áudio de fala bruto.
― 5 min ler
Um novo método para gerar gestos que combinam com a fala de forma eficaz.
― 8 min ler
Detectar a subjetividade nas notícias é crucial pra ter informações precisas.
― 7 min ler