FlexiAST permite que modelos se adaptem a tamanhos de áudio variados de forma eficiente.
― 6 min ler
Ciência de ponta explicada de forma simples
FlexiAST permite que modelos se adaptem a tamanhos de áudio variados de forma eficiente.
― 6 min ler
Melhorando a forma como identificamos fontes de som usando dados áudio-visuais.
― 7 min ler
Um novo método melhora a verificação de falantes gerenciando a variabilidade das sessões de forma eficaz.
― 7 min ler
Esse artigo fala sobre um método automatizado pra gerar trailers de filmes de forma eficiente.
― 8 min ler
Novos métodos melhoram a sumarização de vídeos usando grandes conjuntos de dados e modelos avançados.
― 8 min ler
ElasticAST permite processar áudio de comprimento variável de forma eficiente sem perder detalhes importantes.
― 6 min ler
Um estudo sobre como melhorar a localização de fontes sonoras aproveitando melhor as informações audiovisuais.
― 8 min ler
Uma visão geral dos avanços no reconhecimento de fala através do VoxCeleb Challenge.
― 5 min ler