Um novo sistema que liga música e linguagem pra entender melhor.
― 7 min ler
Ciência de ponta explicada de forma simples
Um novo sistema que liga música e linguagem pra entender melhor.
― 7 min ler
Artigos mais recentes
AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.
― 6 min ler
Um novo método simplifica a busca de vídeos ao combinar vários tipos de informação.
― 7 min ler
Desenvolvendo máquinas que respondem com base em emoções pra melhorar a interação humano-computador.
― 6 min ler
Nova metodologia melhora a velocidade e eficiência na geração de Texto para Áudio.
― 5 min ler
Melhorando a forma como identificamos fontes de som usando dados áudio-visuais.
― 7 min ler
Um método pra visualizar e prever sons em vários ambientes usando tecnologia avançada.
― 6 min ler
Uma nova abordagem pra melhorar a qualidade do streaming de vídeo ao vivo no celular e a eficiência energética.
― 10 min ler
O ChatDiet junta dados pessoais e conhecimento da população pra dar conselhos de comida melhores.
― 10 min ler
Uma análise de viés e falta de civismo em debates na televisão indiana.
― 7 min ler
Novo framework melhora a eficiência e qualidade da compressão de vídeo.
― 7 min ler
Esse artigo analisa como as imagens impactaram a opinião pública durante o conflito Rússia-Ucrânia.
― 5 min ler
Um novo método melhora a qualidade da imagem durante a transmissão sem fio em canais barulhentos.
― 6 min ler
O MemeCraft cria memes legais pra promover causas sociais de um jeito seguro.
― 12 min ler
Um novo método melhora o aprendizado de máquina de dados áudio-visuais.
― 6 min ler
Pesquisas mostram maneiras mais amplas de dar direções usando conhecimento espacial.
― 9 min ler
Juntando áudio, vídeo e texto pra melhorar as avaliações de saúde mental.
― 6 min ler
Novo framework melhora a sincronia labial e a qualidade visual em vídeos de rostos falando.
― 6 min ler
Um novo método gera amostras defeituosas falsas pra melhorar a detecção de anomalias na fabricação.
― 7 min ler
Novo método melhora a verificação de falantes ao combinar dados de áudio e visuais.
― 6 min ler
Um novo método melhora o rastreamento de falantes usando dados de áudio e vídeo.
― 7 min ler
MusicAOG simplifica a criação e a compreensão da música através de uma representação gráfica inovadora.
― 7 min ler
Analisar estresse e depressão pode melhorar nossa compreensão da saúde mental.
― 7 min ler
Um novo modelo identifica momentos engraçados em vídeos usando dados visuais, de áudio e de texto.
― 7 min ler
AesopAgent permite que os usuários criem vídeos a partir de histórias usando ferramentas de IA avançadas.
― 6 min ler
Analisando como as imagens impactam o aprendizado em artigos da Wikipedia.
― 6 min ler
Um método pra reduzir redundância em representações de dados multi-visão.
― 7 min ler
CoAVT integra dados de áudio, vídeo e texto pra uma compreensão melhor.
― 8 min ler
Crie vídeos com avatares falantes de forma fácil com o sistema inovador da Virbo.
― 8 min ler
O conjunto de dados WiMANS permite rastrear as atividades de vários usuários usando sinais de WiFi.
― 8 min ler
Uma nova estrutura facilita as tarefas de edição de vídeo usando ferramentas de edição de imagem.
― 10 min ler
BDoG melhora o raciocínio da IA integrando vários tipos de dados de forma eficaz.
― 8 min ler
Heracles combina transformadores e modelos de espaço de estados pra melhorar o processamento de dados.
― 7 min ler
Um novo método integra informações acústicas nos modelos de linguagem pra melhorar o reconhecimento de fala.
― 10 min ler
Usar música pra explicar câncer pode ajudar a entender melhor e deixar a galera mais envolvida.
― 8 min ler
Um novo framework melhora a conclusão de gráficos de conhecimento com tipos de dados diversos.
― 9 min ler
Uma nova maneira de animar retratos com expressões e ângulos que mudam.
― 8 min ler
Novo método melhora a compressão de dados 3D enquanto mantém a qualidade.
― 10 min ler
CIRP melhora a representação dos produtos pra fazer combos online melhores.
― 10 min ler
Explorando como o IoS pode transformar nossas experiências digitais ao envolver todos os sentidos.
― 12 min ler
DIBS melhora a legendagem de eventos em vídeo refinando as bordas usando dados não rotulados.
― 9 min ler