Um novo conjunto de dados destaca os preconceitos em modelos de fala baseados em gênero e idade.
― 8 min ler
Ciência de ponta explicada de forma simples
Um novo conjunto de dados destaca os preconceitos em modelos de fala baseados em gênero e idade.
― 8 min ler
Pesquisas mostram como fazer modelos de fala menores e mais eficientes.
― 6 min ler
O treinamento adversarial melhora a precisão na detecção de palavras-chave em fala sintética e real.
― 6 min ler
Um novo padrão melhora a avaliação de sistemas de reconhecimento de emoção na fala em diferentes idiomas e emoções.
― 7 min ler
Novos métodos melhoram modelos de ASR para várias línguas, preservando o conhecimento passado.
― 6 min ler
Uma nova abordagem melhora o reconhecimento de frases com troca de código na fala bilíngue.
― 6 min ler
Um novo método pra lidar melhor com sequências de dados longas.
― 5 min ler
Analisando como os padrões de voz afetam o significado e o desempenho da tecnologia.
― 5 min ler
Um olhar sobre as complicações de identificar faixas de áudio misturadas.
― 7 min ler
O-HuBERT melhora o reconhecimento de fala ao separar a informação do conteúdo e a informação expressiva.
― 6 min ler
Um novo método melhora o reconhecimento de fala em Hindi usando técnicas de pseudo-rotulagem.
― 5 min ler
Um sistema pra classificar os dialetos Tamil literário e coloquial usando características sonoras.
― 6 min ler
Novos métodos melhoram a compreensão de fala sussurrada e normal pelos computadores.
― 6 min ler
Uma olhada na separação em micro-lotes e seus benefícios para o treinamento de modelos.
― 6 min ler
Pesquisas mostram como LLMs melhoram o reconhecimento de fala automática em japonês.
― 7 min ler
Esse artigo examina como os modelos reconhecem tom, estresse e acentos de pitch.
― 5 min ler
O SALSA melhora a precisão do reconhecimento de fala para idiomas de baixo recurso, integrando modelos de ASR e de linguagem.
― 6 min ler
Novo método melhora a precisão da ASR usando modelos de linguagem para transcrições melhores.
― 4 min ler
Um novo sistema corrige erros de identificação de fala pra ter transcrições de conversa mais claras.
― 9 min ler
Melhorando a clareza da fala através de filtros híbridos e redes neurais.
― 6 min ler
Um novo modelo melhora o reconhecimento de fala ao combinar de forma eficaz entradas de áudio e visuais.
― 6 min ler
Novos métodos melhoram o reconhecimento de fala em situações desafiadoras com múltiplos falantes.
― 5 min ler
Um novo método melhora o reconhecimento automático de fala preservando a ordem dos sons na transferência de conhecimento.
― 5 min ler
Este estudo analisa como o barulho pode melhorar a resistência do reconhecimento de fala frente a desafios.
― 6 min ler
Transdutor leve e inovador melhora a eficiência e a precisão do reconhecimento de fala.
― 7 min ler
Esse artigo compara representações de fala discretas e contínuas para um reconhecimento de fala eficaz.
― 6 min ler
Pesquisas mostram como os neurônios em modelos de fala reconhecem características-chave do som.
― 8 min ler
Este estudo analisa como a autoatenção afeta o reconhecimento de fala em turco e inglês.
― 6 min ler
Uma abordagem de aprendizado auto supervisionado reduz a necessidade de dados de áudio rotulados.
― 7 min ler
TF-Mamba melhora a localização sonora usando uma abordagem nova que integra dados de tempo e frequência.
― 6 min ler
A pesquisa sobre sistemas ASR modulares tem como objetivo melhorar o desempenho em ambientes barulhentos.
― 5 min ler
Apresentando o DENSE, um método que melhora a extração da fala-alvo usando embeddings dinâmicos.
― 7 min ler
Esse método melhora a precisão de reconhecimento para nomes pouco comuns em saídas de voz.
― 6 min ler
Melhorando a identificação de palavras faladas através de pistas visuais em línguas com poucos recursos.
― 8 min ler
BigCodec melhora a qualidade do som em transmissões de áudio com baixa taxa de bits.
― 6 min ler
Esse artigo fala sobre as vantagens de simplificar modelos de transformer para tarefas de fala.
― 5 min ler
O Sortformer integra diarização de falantes e ASR pra melhorar o processamento de áudio.
― 6 min ler
Novos métodos melhoram a compreensão da linguagem falada através de um conjunto de dados inovador.
― 5 min ler
Novos métodos melhoram a conversa entre humanos e robôs ao deixar a fala mais clara.
― 5 min ler
Analisando os últimos avanços em modelos generativos em várias áreas.
― 6 min ler