Uma maneira nova de medir o desempenho do reconhecimento de fala sem precisar de transcrição manual.
― 6 min ler
Ciência de ponta explicada de forma simples
Uma maneira nova de medir o desempenho do reconhecimento de fala sem precisar de transcrição manual.
― 6 min ler
Artigos mais recentes
Artigos mais recentes
Analisando o uso de conjuntos de dados em biometria vocal, aparecem preocupações sérias sobre viés e privacidade.
― 8 min ler
Um novo método melhora os sistemas de verificação de voz para vozes sobrepostas.
― 6 min ler
Métodos inovadores para representação eficaz de segmentos de fala em tarefas de processamento.
― 7 min ler
Melhorando sistemas de TTS pra contar histórias de maneira mais legal com pausas bem colocadas.
― 5 min ler
AffectMachine-Clássico gera música clássica em tempo real pra ajudar a lidar com as emoções.
― 8 min ler
Este estudo analisa como diferentes sistemas de TTS melhoram o desempenho do modelo S2ST.
― 7 min ler
Pesquisas mostram como os backchannels melhoram a comunicação das máquinas.
― 5 min ler
Pesquisas mostram novas maneiras de manipular som usando redes neurais na produção musical.
― 6 min ler
Pesquisas usam filmes dublados pra melhorar a conexão entre visão e som em machine learning.
― 6 min ler
Apresentando absement, um jeito de medir sons de fala dinamicamente ao longo do tempo.
― 6 min ler
Uma nova forma de transcrever com precisão as notas e letras das músicas usando tecnologia.
― 6 min ler
Modelo Hierárquico de Atenção Cruzada melhora a compreensão emocional em diversas formas de comunicação.
― 6 min ler
Novos métodos melhoram a marcação e recuperação de músicas usando menos intervenção humana.
― 6 min ler
Este estudo analisa como o comprimento do sinal afeta o desempenho na separação de fala.
― 7 min ler
Novo método estima distâncias usando o barulho do motor de drone.
― 5 min ler
Essa pesquisa destaca um novo modelo pra melhorar o reconhecimento de emoções usando dados de áudio e visual.
― 6 min ler
Este estudo analisa como a IA avalia e descreve sons em comparação com os humanos.
― 7 min ler
FSB-LSTM melhora a clareza da fala em ambientes barulhentos com baixa latência e baixa complexidade.
― 6 min ler
Pesquisas mostram como melhorar sistemas de reconhecimento de palavras-chave enquanto reduzem o consumo de energia.
― 6 min ler
Prak simplifica o alinhamento fonético para pesquisas na língua tcheca.
― 5 min ler
DAS-N2N usa aprendizado de máquina pra melhorar a coleta de dados sísmicos reduzindo o barulho.
― 8 min ler
Novas técnicas melhoram a precisão no reconhecimento de fala em tempo real e fora dele.
― 6 min ler
Este estudo destaca como a tokenização de subpalavras melhora a qualidade e a eficiência da geração de música.
― 7 min ler
Analisando como ataques adversariais impactam sistemas de reconhecimento de fala e métodos pra melhorar a transferibilidade.
― 7 min ler
CB-Conformer melhora o reconhecimento de fala para palavras tendenciosas com técnicas inovadoras.
― 6 min ler
Explore os desafios de segurança e privacidade da tecnologia de assistentes de voz.
― 7 min ler
Melhorando modelos de reconhecimento de fala para o suíço-alemão usando técnicas avançadas e conjuntos de dados.
― 6 min ler
Estudo explora como dados móveis ajudam a entender alucinações auditivas verbais.
― 9 min ler
Um novo método melhora as defesas contra ataques adversariais de áudio em sistemas de reconhecimento de fala.
― 7 min ler
A pesquisa foca em modelos eficientes para reconhecimento de palavras-chave usando redes ajustáveis.
― 5 min ler
CLaMP combina música e linguagem pra classificação e busca automática de músicas.
― 7 min ler
Um método matemático pra avaliar a beleza das performances musicais.
― 5 min ler
Um novo modelo combina dados de áudio e texto pra melhorar a precisão do reconhecimento de fala.
― 6 min ler
Um novo método melhora a transformação de textura de áudio para design sonoro criativo.
― 6 min ler
Um novo método gera áudio a partir de texto usando modelos modernos.
― 6 min ler
Uma competição pra melhorar a criação automática de sons Foley pra multimídia.
― 6 min ler
Este estudo explora como usar playlists pra melhorar a classificação e similaridade de músicas.
― 5 min ler
Como o Aprendizado de Transferência Profundo transforma as tecnologias de Reconhecimento Automático de Fala.
― 7 min ler
Tecnologia inovadora separa vozes musicais usando técnicas avançadas de rastreamento.
― 7 min ler
Agricultores agora conseguem acompanhar o comportamento das vacas com precisão, mesmo com o barulho de fundo.
― 7 min ler