Artigos mais recentes para Reconhecimento Automático de Fala

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala para Línguas de Baixos Recursos

Novos métodos melhoram a ASR para idiomas sub-representados usando dados de idiomas semelhantes.

2025-08-26T10:39:15+00:00 ― 6 min ler

Computação e linguagem Aprimorando o Reconhecimento de Entidades em Transcrições Médicas Barulhentas

Esse estudo aborda os desafios de captar termos médicos precisos a partir de áudio ruidoso.

2025-08-26T04:59:30+00:00 ― 9 min ler

Computação e linguagem Aprimorando o Reconhecimento de Fala com Dados Acústicos

Um novo método integra informações acústicas nos modelos de linguagem pra melhorar o reconhecimento de fala.

2025-08-25T02:15:55+00:00 ― 10 min ler

Computação e linguagem Melhorando a Transcrição Médica com IA

Os LLMs melhoram a precisão nas transcrições médicas, beneficiando o cuidado com os pacientes.

2025-08-24T16:32:55+00:00 ― 8 min ler

Processamento de Áudio e Fala Codec-SUPERB: Um Benchmark para Codecs de Som

Um novo sistema pra avaliar o desempenho de codec de áudio em várias aplicações.

2025-08-22T23:15:10+00:00 ― 8 min ler

Som Entendendo a Tecnologia de Reconhecimento Automático de Fala

Uma visão geral do ASR e seus avanços em aplicações modernas.

2025-08-20T15:22:55+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços em Implantes Cocleares com Tecnologias de IA

A IA tá melhorando os implantes cocleares pra uma audição e comunicação melhor em ambientes difíceis.

2025-08-17T13:41:50+00:00 ― 8 min ler

Processamento de Áudio e Fala Avanços na Avaliação Automática da Qualidade da Fala

Um novo método melhora a avaliação da fala usando gravações inteiras.

2025-08-14T06:20:40+00:00 ― 8 min ler

Processamento de Áudio e Fala Avaliação de Modelos de Processamento de Fala com o SUPERB

Um novo modelo pra avaliar modelos de fundação em tarefas de fala.

2025-08-11T09:31:05+00:00 ― 9 min ler

Computação e linguagem Avanços em Sistemas de Legendagem Automática

Um novo método cria legendas diretamente, melhorando a acessibilidade para diferentes públicos.

2025-08-10T07:49:00+00:00 ― 9 min ler

Computação e linguagem Avaliação de Sistemas de ASR para Fala Gaguejada

Este estudo avalia o desempenho de sistemas de ASR com pessoas que gaguejam.

2025-08-07T04:18:10+00:00 ― 9 min ler

Computação e linguagem Novo Método de Ataque Silencia Sistemas de ASR

Um clipe de áudio universal pode silenciar modelos avançados de ASR como o Whisper.

2025-08-07T03:29:35+00:00 ― 7 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala em Sala de Aula com Pré-treinamento Contínuo

O reconhecimento de fala melhorado para salas de aula usando técnicas de treinamento avançadas melhora a aprendizagem.

2025-08-05T19:06:15+00:00 ― 8 min ler

Processamento de Áudio e Fala Avanços em Melhoria de Fala com VPIDM

O novo modelo VPIDM melhora a clareza da fala em ambientes barulhentos.

2025-08-03T16:54:05+00:00 ― 7 min ler

Processamento de Áudio e Fala Apresentando o Modelo 4D em Reconhecimento de Fala

Um novo modelo melhora o reconhecimento de fala usando vários métodos de decodificação.

2025-08-01T01:44:35+00:00 ― 8 min ler

Computação e linguagem Apresentando o mHuBERT-147: Um Modelo de Fala Compacto

mHuBERT-147 processa fala em várias línguas de forma eficiente.

2025-07-30T22:12:45+00:00 ― 5 min ler

Computação e linguagem Avanços no Reconhecimento de Fala Científica Multimodal

Melhorando a precisão na transcrição de apresentações científicas através da integração de fala e visual.

2025-07-28T04:36:24+00:00 ― 10 min ler

Computação e linguagem Desafio Linguístico de Nollywood: Unindo Dialetos

Um estudo sobre como traduzir o inglês nigeriano para melhorar a acessibilidade em filmes de Nollywood.

2025-07-24T04:16:05+00:00 ― 7 min ler

Computação e linguagem Avanços na Tradução de Fala para Texto com LLMs

Novo modelo melhora a tradução de fala para texto usando grandes modelos de linguagem.

2025-07-23T08:01:30+00:00 ― 7 min ler

Computação e linguagem Avanços na Anonimização de Falantes Multilíngues

Melhorando a tecnologia de anonimização de falantes em nove idiomas pra garantir a privacidade.

2025-07-23T03:58:35+00:00 ― 6 min ler

Computação e linguagem Avançando o Reconhecimento de Fala com Códigos Específicos de Acento

Novo método melhora o desempenho dos sistemas de ASR com diferentes sotaques através de dicionários especializados.

2025-07-22T04:29:40+00:00 ― 6 min ler

Computação e linguagem Avanço da Tecnologia de Fala para o Árabe Tunisiano

Esse estudo avalia a tecnologia de fala em línguas com poucos recursos, tipo o árabe tunisiano.

2025-07-21T12:18:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Avaliando a Eficiência da Mamba em Tecnologia de Fala

Mamba mostra potencial contra transformers em tarefas de fala, especialmente para entradas longas.

2025-07-17T13:33:45+00:00 ― 5 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Dicas Contextuais

Aprenda como o contexto melhora a precisão do reconhecimento automático de fala e a identificação de palavras.

2025-07-16T14:53:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala para a Língua Polonesa

A pesquisa apresenta novos métodos para avaliar sistemas de reconhecimento de fala em polonês.

2025-07-14T16:44:10+00:00 ― 7 min ler

Computação e linguagem Otimizando a Correção de Erros do ASR com Modelos de Linguagem

Um estudo sobre como melhorar a precisão da transcrição com um design de prompt melhor.

2025-07-11T15:03:05+00:00 ― 6 min ler

Computação e linguagem Avanços na Tecnologia de Tradução de Fala

Um novo modelo tem como objetivo melhorar a qualidade da tradução de fala através de sistemas integrados.

2025-07-11T02:54:20+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando as Tecnologias de Reconhecimento de Fala Sussurrada

Novos métodos buscam melhorar o reconhecimento da fala sussurrada em sistemas automáticos.

2025-07-08T08:30:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Colaboração de IA

Modelos de IA melhoram a precisão das conversões de fala para texto.

2025-07-07T09:50:10+00:00 ― 6 min ler

Computação e linguagem Melhorando o reconhecimento de voz para termos especializados

A pesquisa melhora os sistemas de ASR usando modelos de linguagem pra ter mais precisão.

2025-07-06T20:41:12+00:00 ― 8 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Palavras-Chave Contextuais

Um novo sistema melhora o reconhecimento de fala usando palavras-chave contextuais pra ter mais precisão.

2025-06-29T22:53:15+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala Multilíngue Sem Dados Originais

Novos métodos melhoram modelos de ASR para várias línguas, preservando o conhecimento passado.

2025-06-27T15:01:00+00:00 ― 6 min ler

Computação e linguagem O Papel da ASR na Transcrição Judicial

Examinando o Reconhecimento Automático de Fala nos sistemas judiciais canadenses e seu impacto.

2025-06-24T14:48:24+00:00 ― 8 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala em Japonês com Técnicas GER

Pesquisas mostram como LLMs melhoram o reconhecimento de fala automática em japonês.

2025-06-23T04:08:00+00:00 ― 7 min ler

Computação e linguagem Apresentando o SALSA: Um Novo Método para Melhorar o ASR

O SALSA melhora a precisão do reconhecimento de fala para idiomas de baixo recurso, integrando modelos de ASR e de linguagem.

2025-06-22T06:16:15+00:00 ― 6 min ler

Computação e linguagem Avaliando a Precisão do ASR para Acessibilidade

Analisando o desempenho do reconhecimento automático de fala para usuários surdos e com deficiência auditiva.

2025-06-22T01:24:45+00:00 ― 13 min ler

Computação e linguagem Usando Dados de Fala para Diagnóstico de Autismo

Um novo método usa dados de fala pra melhorar as avaliações de autismo.

2025-06-19T19:12:12+00:00 ― 7 min ler

Aprendizagem de máquinas Avanços em Modelos Generativos e Suas Aplicações

Analisando os últimos avanços em modelos generativos em várias áreas.

2025-06-14T04:06:48+00:00 ― 6 min ler

Computação e linguagem WhisperNER: Juntando Reconhecimento de Fala e Detecção de Entidades

Um novo modelo junta reconhecimento de fala e reconhecimento de entidades pra ter resultados melhores.

2025-06-13T03:29:30+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala em Sala de Aula com Pré-treinamento Contínuo

Uma nova abordagem melhora os sistemas de ASR pra uma comunicação melhor na sala de aula.

2025-06-12T18:44:20+00:00 ― 6 min ler