Novos métodos buscam proteger a privacidade da fala em sistemas de monitoramento de áudio.
― 6 min ler
Ciência de ponta explicada de forma simples
Novos métodos buscam proteger a privacidade da fala em sistemas de monitoramento de áudio.
― 6 min ler
Um método que usa áudio e vídeo pra detectar deepfakes melhor.
― 5 min ler
Um novo modelo de IA melhora a previsão das pontuações de qualidade de áudio.
― 6 min ler
A pesquisa explora o deep learning pra criar áudio que combine com conteúdo de vídeo silencioso.
― 8 min ler
Um novo método melhora gravações de áudio usando pistas visuais.
― 7 min ler
Explorando o impacto do conteúdo gerado por IA na arte de contar histórias.
― 9 min ler
Um novo sistema melhora gravações de áudio pra uma experiência de escuta melhor.
― 7 min ler
Esse estudo analisa as dificuldades de usar aprendizado contrastivo pra entender vídeo musical.
― 7 min ler
Uma abordagem unificada pra avaliar a alimentação dos peixes usando dados de áudio e vídeo.
― 6 min ler
Esse artigo explora avanços na diarização de falantes usando modelos de linguagem pra ter mais precisão.
― 5 min ler
Pesquisadores estão explorando a tecnologia de detecção de áudio para melhorar a identificação de pedestres em áreas urbanas.
― 6 min ler
Técnicas avançadas pra garantir a autenticidade do áudio na era da clonagem de voz.
― 6 min ler
Uma nova abordagem melhora a geração de áudio ao alinhar o áudio com as descrições em texto.
― 6 min ler
Novos métodos estão melhorando nossa habilidade de detectar discursos falsos de forma eficaz.
― 6 min ler
Novos métodos melhoram o desempenho de vocoder com dados de áudio limitados.
― 6 min ler
Este estudo explora estratégias de treinamento pra melhorar a detecção de áudio falso.
― 6 min ler
Uma maneira firme de identificar anomalias de áudio e combater a falsificação de voz.
― 6 min ler
Novos métodos combinam áudio e metadados pra melhorar o reconhecimento de idiomas.
― 7 min ler
Um novo método melhora a geração de música ao adicionar contexto de performance.
― 7 min ler
Uma nova abordagem usa aprendizado auto-supervisionado pra conectar áudio e partituras.
― 6 min ler
Um novo método melhora a combinação de áudio e partituras.
― 6 min ler
Um método novo pra marcar áudio criado por modelos de difusão pra proteger a propriedade.
― 7 min ler
AVI-Talking cria rostos 3D super realistas que expressam emoções através do áudio.
― 7 min ler
Juntando áudio, vídeo e texto pra melhorar as avaliações de saúde mental.
― 6 min ler
Novos métodos melhoram o realismo em humanos digitais e avatares.
― 5 min ler
Novo método melhora a verificação de falantes ao combinar dados de áudio e visuais.
― 6 min ler
Um novo modelo identifica momentos engraçados em vídeos usando dados visuais, de áudio e de texto.
― 7 min ler
CoAVT integra dados de áudio, vídeo e texto pra uma compreensão melhor.
― 8 min ler
O Audio Flamingo manda bem em ouvir, conversar e se adaptar a novas tarefas de áudio.
― 6 min ler
Um novo modelo gera movimentos realistas em conversas, melhorando a compreensão da interação.
― 6 min ler
Um novo modelo melhora a detecção de quebra de diálogo para sistemas de IA.
― 9 min ler
Um novo método pra criar e editar imagens usando sinais de áudio.
― 8 min ler
O CLaM-TTS melhora a síntese de fala usando técnicas avançadas pra mais eficiência e qualidade.
― 7 min ler
CoCoGesture cria gestos realistas que combinam com as palavras faladas, melhorando a interação.
― 6 min ler
Um novo framework converte sinais de MEG em texto significativo, ajudando na tecnologia de comunicação.
― 12 min ler
Uma nova abordagem para legendagem de áudio reduz a dependência de dados pareados.
― 6 min ler
Este estudo analisa métodos de áudio para rastrear o movimento de pedestres em áreas urbanas.
― 8 min ler
Um novo sistema ajuda a separar a fala do barulho pra uma comunicação mais clara.
― 7 min ler
Um novo sistema ajuda robôs a aprender tarefas usando áudio de demonstrações da vida real.
― 8 min ler
Um estudo sobre como usar dados de texto e áudio pra melhorar o reconhecimento de emoções.
― 7 min ler