Artigos mais recentes para Taxa de Erro de Palavras

Computação e linguagem Avanços na Correção de Erros de Reconhecimento de Fala

Novos métodos melhoram a precisão no reconhecimento de fala ruidosa usando grandes modelos de linguagem.

2025-08-29T01:48:45+00:00 ― 7 min ler

Computação e linguagem Aprimorando o Reconhecimento de Fala com Dados Acústicos

Um novo método integra informações acústicas nos modelos de linguagem pra melhorar o reconhecimento de fala.

2025-08-25T02:15:55+00:00 ― 10 min ler

Computação e linguagem Melhorando a Transcrição Médica com IA

Os LLMs melhoram a precisão nas transcrições médicas, beneficiando o cuidado com os pacientes.

2025-08-24T16:32:55+00:00 ― 8 min ler

Interação Homem-Computador Avanços em Interfaces de Fala Silenciosa

Uma olhada no MONA, um sistema que melhora a comunicação em fala silenciosa.

2025-08-20T16:11:30+00:00 ― 5 min ler

Robótica Melhorando o Reconhecimento de Voz de Robôs em Ambientes Barulhentos

A pesquisa foca em ajudar os robôs a entender melhor a fala em meio ao barulho de fundo.

2025-08-19T22:22:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Avaliação do Reconhecimento de Voz em Ambientes Barulhentos

Um novo padrão avalia o desempenho dos sistemas de reconhecimento de voz em meio a várias interferências.

2025-08-19T14:16:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala para Línguas com Poucos Recursos

Um método pra melhorar a precisão do reconhecimento de fala em Kannada e Telugu.

2025-08-17T15:19:00+00:00 ― 9 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala em Sala de Aula com Pré-treinamento Contínuo

O reconhecimento de fala melhorado para salas de aula usando técnicas de treinamento avançadas melhora a aprendizagem.

2025-08-05T19:06:15+00:00 ― 8 min ler

Aprendizagem de máquinas Avanços em Reconhecimento Automático de Fala com Modelos de Linguagem de Denoise

Modelos de linguagem de desruído melhoram a correção de erros em sistemas de reconhecimento de fala usando dados sintéticos.

2025-08-03T22:34:10+00:00 ― 9 min ler

Computação e linguagem Avançando o Reconhecimento de Fala com Códigos Específicos de Acento

Novo método melhora o desempenho dos sistemas de ASR com diferentes sotaques através de dicionários especializados.

2025-07-22T04:29:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços em Reconhecimento Automático de Fala em Streaming

O modelo XLSR-Transducer manda bem na transcrição em tempo real com pouquíssimos dados.

2025-07-21T18:46:40+00:00 ― 6 min ler

Som Vulnerabilidade em Sistemas de Reconhecimento de Fala Exposta

Pesquisas mostram riscos em modelos de fala multitarefa como o Whisper.

2025-07-21T09:52:15+00:00 ― 5 min ler

Computação e linguagem TokenVerse: Facilitando a Análise de Conversas

TokenVerse simplifica a análise de conversas faladas ao integrar várias tarefas em um único modelo.

2025-07-21T08:15:05+00:00 ― 7 min ler

Computação e linguagem LearnerVoice: Avançando o Reconhecimento de Voz para Aprendizes de Línguas

Novo conjunto de dados visa melhorar o reconhecimento de voz para falantes não nativos de inglês.

2025-07-21T02:35:00+00:00 ― 7 min ler

Inteligência Artificial Adaptando a tecnologia de OCR para reconhecimento de texto em espanhol

Um projeto pra melhorar o reconhecimento de texto em documentos em espanhol usando o TrOCR.

2025-07-16T15:58:30+00:00 ― 7 min ler

Som A Evolução dos Sistemas de Reconhecimento Automático de Fala

Um olhar sobre o progresso nas tecnologias e métodos de reconhecimento de fala.

2025-07-15T11:21:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Formatação de Números em Transcrições de ASR

Este artigo fala sobre maneiras de melhorar a formatação de expressões numéricas em transcrições automáticas.

2025-07-14T15:55:35+00:00 ― 6 min ler

Inteligência Artificial Apresentando o DANIEL: Uma Nova Abordagem para Reconhecimento de Documentos Manuscritos

O DANIEL integra várias técnicas para extrair informações de documentos escritos à mão de forma eficiente.

2025-07-14T08:08:54+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Câmeras de Evento Transformam o Reconhecimento de Linguagem de Sinais

Novas câmeras de evento melhoram a precisão no reconhecimento e tradução de Língua de Sinais, deixando as ferramentas de comunicação mais eficientes.

2025-07-11T18:39:36+00:00 ― 6 min ler

Som A Ascensão da Edição de Fala na Mídia Digital

Explora a importância crescente da edição de áudio para criadores de conteúdo.

2025-07-11T00:28:35+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços em OCR e HWR em árabe com o Qalam

O Qalam oferece um reconhecimento melhorado para texto árabe e caligrafia.

2025-07-11T00:21:30+00:00 ― 8 min ler

Processamento de Áudio e Fala Melhorando as Tecnologias de Reconhecimento de Fala Sussurrada

Novos métodos buscam melhorar o reconhecimento da fala sussurrada em sistemas automáticos.

2025-07-08T08:30:30+00:00 ― 7 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Aprendizado de Representação de Ruído de Contexto

Um método pra melhorar a qualidade do reconhecimento de fala em ambientes barulhentos.

2025-07-01T23:28:15+00:00 ― 7 min ler

Som Avanços na Tecnologia de Conversão de Voz Zero-Shot

Novo modelo melhora a conversão de voz, especialmente para fala sussurrada e aplicações em tempo real.

2025-06-26T17:57:50+00:00 ― 7 min ler

Computação e linguagem O Papel da ASR na Transcrição Judicial

Examinando o Reconhecimento Automático de Fala nos sistemas judiciais canadenses e seu impacto.

2025-06-24T14:48:24+00:00 ― 8 min ler

Som StyleSpeech: O Futuro da Tecnologia de Texto para Fala

O StyleSpeech melhora os sistemas de TTS pegando os detalhes naturais da fala.

2025-06-24T14:08:30+00:00 ― 6 min ler

Computação e linguagem Novo Padrão para Reconhecimento de Fala em Hindi

Pesquisas melhoram o reconhecimento de fala em hindi com sotaques variados.

2025-06-24T05:11:42+00:00 ― 5 min ler

Computação e linguagem Avaliando a Precisão do Reconhecimento Automático de Fala

Um olhar sobre como medir a precisão em sistemas de reconhecimento de fala com novos métodos.

2025-06-22T20:50:45+00:00 ― 6 min ler

Computação e linguagem Avaliando a Precisão do ASR para Acessibilidade

Analisando o desempenho do reconhecimento automático de fala para usuários surdos e com deficiência auditiva.

2025-06-22T01:24:45+00:00 ― 13 min ler

Computação e linguagem Melhorando o Reconhecimento Automático de Fala com Modelos de Linguagem

Novo método melhora a precisão da ASR usando modelos de linguagem para transcrições melhores.

2025-06-21T20:33:15+00:00 ― 4 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Treinamento Aumentado de Ruído

Este estudo analisa como o barulho pode melhorar a resistência do reconhecimento de fala frente a desafios.

2025-06-19T14:18:10+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Síntese de Fala Usando DDSP

Descubra como o DDSP melhora a eficiência e a qualidade da síntese de fala.

2025-06-18T17:15:00+00:00 ― 7 min ler

Computação e linguagem Desafios e Avanços na Tradução de Fala

Uma olhada nas complexidades e melhorias na tecnologia de tradução de fala para fala.

2025-06-18T06:12:18+00:00 ― 7 min ler

Computação e linguagem Como Estilos de Transcrição Afetam a Compreensão do Inglês Afro-Americano

Explorando o impacto dos estilos de transcrição na precisão do inglês afro-americano.

2025-06-17T09:16:12+00:00 ― 5 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Voz para Nomes Raros

Esse método melhora a precisão de reconhecimento para nomes pouco comuns em saídas de voz.

2025-06-16T03:42:40+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala em Sala de Aula com Pré-treinamento Contínuo

Uma nova abordagem melhora os sistemas de ASR pra uma comunicação melhor na sala de aula.

2025-06-12T18:44:20+00:00 ― 6 min ler

Som Avanços na Restauração de Fala: MaskSR2

MaskSR2 melhora a clareza e a qualidade do áudio usando técnicas inovadoras.

2025-06-11T07:06:40+00:00 ― 6 min ler

Som Avanços na Tecnologia de Texto para Fala

Novo método melhora a qualidade e a eficiência da geração de fala.

2025-06-07T10:48:10+00:00 ― 5 min ler

Criptografia e segurança Novo Método Revela Vulnerabilidades dos Sensores de Smartphones

Pesquisas mostram riscos nos sensores de movimento dos smartphones, ressaltando preocupações com a privacidade.

2025-06-07T00:09:24+00:00 ― 7 min ler

Computação e linguagem Avançando a Comunicação Médica com Tecnologia ASR

O projeto MultiMed melhora o reconhecimento de fala automático para uma comunicação na saúde mais eficiente.

2025-06-05T06:10:15+00:00 ― 7 min ler