Novos métodos melhoram a ASR para idiomas sub-representados usando dados de idiomas semelhantes.
― 6 min ler
Ciência de ponta explicada de forma simples
Novos métodos melhoram a ASR para idiomas sub-representados usando dados de idiomas semelhantes.
― 6 min ler
Esse estudo aborda os desafios de captar termos médicos precisos a partir de áudio ruidoso.
― 9 min ler
Um novo método integra informações acústicas nos modelos de linguagem pra melhorar o reconhecimento de fala.
― 10 min ler
Os LLMs melhoram a precisão nas transcrições médicas, beneficiando o cuidado com os pacientes.
― 8 min ler
Um novo sistema pra avaliar o desempenho de codec de áudio em várias aplicações.
― 8 min ler
Uma visão geral do ASR e seus avanços em aplicações modernas.
― 5 min ler
A IA tá melhorando os implantes cocleares pra uma audição e comunicação melhor em ambientes difíceis.
― 8 min ler
Um novo método melhora a avaliação da fala usando gravações inteiras.
― 8 min ler
Um novo modelo pra avaliar modelos de fundação em tarefas de fala.
― 9 min ler
Um novo método cria legendas diretamente, melhorando a acessibilidade para diferentes públicos.
― 9 min ler
Este estudo avalia o desempenho de sistemas de ASR com pessoas que gaguejam.
― 9 min ler
Um clipe de áudio universal pode silenciar modelos avançados de ASR como o Whisper.
― 7 min ler
O reconhecimento de fala melhorado para salas de aula usando técnicas de treinamento avançadas melhora a aprendizagem.
― 8 min ler
O novo modelo VPIDM melhora a clareza da fala em ambientes barulhentos.
― 7 min ler
Um novo modelo melhora o reconhecimento de fala usando vários métodos de decodificação.
― 8 min ler
mHuBERT-147 processa fala em várias línguas de forma eficiente.
― 5 min ler
Melhorando a precisão na transcrição de apresentações científicas através da integração de fala e visual.
― 10 min ler
Um estudo sobre como traduzir o inglês nigeriano para melhorar a acessibilidade em filmes de Nollywood.
― 7 min ler
Novo modelo melhora a tradução de fala para texto usando grandes modelos de linguagem.
― 7 min ler
Melhorando a tecnologia de anonimização de falantes em nove idiomas pra garantir a privacidade.
― 6 min ler
Novo método melhora o desempenho dos sistemas de ASR com diferentes sotaques através de dicionários especializados.
― 6 min ler
Esse estudo avalia a tecnologia de fala em línguas com poucos recursos, tipo o árabe tunisiano.
― 6 min ler
Mamba mostra potencial contra transformers em tarefas de fala, especialmente para entradas longas.
― 5 min ler
Aprenda como o contexto melhora a precisão do reconhecimento automático de fala e a identificação de palavras.
― 6 min ler
A pesquisa apresenta novos métodos para avaliar sistemas de reconhecimento de fala em polonês.
― 7 min ler
Um estudo sobre como melhorar a precisão da transcrição com um design de prompt melhor.
― 6 min ler
Um novo modelo tem como objetivo melhorar a qualidade da tradução de fala através de sistemas integrados.
― 6 min ler
Novos métodos buscam melhorar o reconhecimento da fala sussurrada em sistemas automáticos.
― 7 min ler
Modelos de IA melhoram a precisão das conversões de fala para texto.
― 6 min ler
A pesquisa melhora os sistemas de ASR usando modelos de linguagem pra ter mais precisão.
― 8 min ler
Um novo sistema melhora o reconhecimento de fala usando palavras-chave contextuais pra ter mais precisão.
― 6 min ler
Novos métodos melhoram modelos de ASR para várias línguas, preservando o conhecimento passado.
― 6 min ler
Examinando o Reconhecimento Automático de Fala nos sistemas judiciais canadenses e seu impacto.
― 8 min ler
Pesquisas mostram como LLMs melhoram o reconhecimento de fala automática em japonês.
― 7 min ler
O SALSA melhora a precisão do reconhecimento de fala para idiomas de baixo recurso, integrando modelos de ASR e de linguagem.
― 6 min ler
Analisando o desempenho do reconhecimento automático de fala para usuários surdos e com deficiência auditiva.
― 13 min ler
Um novo método usa dados de fala pra melhorar as avaliações de autismo.
― 7 min ler
Analisando os últimos avanços em modelos generativos em várias áreas.
― 6 min ler
Um novo modelo junta reconhecimento de fala e reconhecimento de entidades pra ter resultados melhores.
― 6 min ler
Uma nova abordagem melhora os sistemas de ASR pra uma comunicação melhor na sala de aula.
― 6 min ler