Artigos mais recentes para Reconhecimento de Fala

Som Avanços na Detecção de Áudio Falso com RAWM

Um novo método melhora a detecção de áudio falso usando modificação de peso adaptativa.

2025-09-29T01:08:15+00:00 ― 6 min ler

Som Avanços no Reconhecimento de Fala de Falantes Específicos

Novo modelo melhora o reconhecimento de fala em ambientes barulhentos ao focar em um único falante.

2025-09-28T08:08:00+00:00 ― 4 min ler

Processamento de Áudio e Fala Avanço no Reconhecimento de Fala Bilingue com Unidades de Grafemas

Aprimorando sistemas ASR híbridos para fala bilíngue usando unidades de grafema.

2025-09-27T03:47:35+00:00 ― 6 min ler

Computação e linguagem Avanços no Aprendizado Conjunto de Fala e Texto

Um novo modelo melhora o alinhamento de fala e texto para um reconhecimento automático melhor.

2025-09-27T02:10:25+00:00 ― 6 min ler

Computação e linguagem Novos Métodos para Avaliar Diarização de Falantes

Apresentando novas métricas pra avaliar a precisão da diarização de falantes em IA conversacional.

2025-09-26T18:04:30+00:00 ― 7 min ler

Computação e linguagem Avanços na Tecnologia de Reconhecimento de Fala

Novos métodos melhoram a precisão e a velocidade nos sistemas de reconhecimento de fala.

2025-09-26T11:35:55+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento Automático de Fala com Injeção de Texto

Um novo método melhora o desempenho da ASR através da integração de dados textuais.

2025-09-26T07:33:00+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Injeção de Texto

A injeção de texto ajuda a reconhecer informações pessoais enquanto mantém a privacidade.

2025-09-26T06:44:25+00:00 ― 6 min ler

Som Avanços no Reconhecimento de Fala com Tecnologia mmWave

Radio2Text usa sinais de mmWave pra reconhecimento de fala em tempo real em ambientes barulhentos.

2025-09-25T22:38:35+00:00 ― 7 min ler

Computação e linguagem Melhorando a Conversão de Grafemas para Fonemas com Novo Método de Amostragem

Este estudo melhora os modelos G2P ao focar nas áreas propensas a erros durante o treinamento.

2025-09-25T05:38:20+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços nas Técnicas de Acompanhamento de Formantes

Descubra métodos que melhoram a precisão no rastreamento de formantes para análise de fala.

2025-09-24T22:21:05+00:00 ― 8 min ler

Computação e linguagem Avanços na Modelagem de Linguagem Falada

Novos métodos melhoram o processamento e a geração de fala em modelos de linguagem.

2025-09-19T16:02:05+00:00 ― 6 min ler

Som Avanços na Tecnologia de Supressão de Ruído

Novas técnicas melhoram a clareza do áudio em ambientes barulhentos.

2025-09-19T15:13:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Avançando o reconhecimento de palavras com poucos exemplos usando dados de fala de leitura

Novos métodos melhoram a identificação de palavras-chave usando dados de fala disponíveis.

2025-09-19T13:36:20+00:00 ― 5 min ler

Processamento de Áudio e Fala Avançando a Estimativa de Confiança em Reconhecimento Automático de Fala

Uma nova abordagem melhora a estimativa de confiança em sistemas de ASR para uma precisão melhor.

2025-09-15T03:14:28+00:00 ― 5 min ler

Aprendizagem de máquinas Desafios em Usar Convnets para Design de Filtros de Áudio

Este estudo explora problemas com o uso de convnets para a criação de filtro de áudio.

2025-09-14T14:34:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Diarização de Falantes com Modelos de Linguagem

Esse artigo explora avanços na diarização de falantes usando modelos de linguagem pra ter mais precisão.

2025-09-14T03:14:25+00:00 ― 5 min ler

Processamento de Áudio e Fala PromptASR: Tecnologia de Reconhecimento de Fala de Outro Nível

Novo sistema melhora o reconhecimento de fala usando prompts que levam em conta o contexto.

2025-09-13T10:14:10+00:00 ― 5 min ler

Som Avanços nos Modelos de Áudio Universal

EnCodecMAE combina aprendizado auto-supervisionado e codecs de áudio pra melhorar o desempenho em tarefas de áudio.

2025-09-13T09:25:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Uma Nova Abordagem para Identificação de Palavras-Chave

Apresentando um método flexível para reconhecer palavras-chave na fala em diferentes idiomas.

2025-09-13T06:11:15+00:00 ― 7 min ler

Som Novo sistema melhora a extração de voz de posições de cabeça instáveis

A PIAVE ajuda máquinas a captar vozes com clareza, mesmo quando as pessoas viram a cabeça.

2025-09-12T19:39:40+00:00 ― 7 min ler

Som Uma Nova Estrutura para Anonimização de Locutores

Apresentando uma estrutura flexível para aprimorar a pesquisa em privacidade de voz.

2025-09-12T05:05:10+00:00 ― 8 min ler

Computação e linguagem Melhorando Explicações para Modelos de Fala

Um novo método facilita a compreensão dos modelos de classificação de fala.

2025-09-12T02:39:25+00:00 ― 7 min ler

Som M-AUDIODEC: Uma Nova Maneira de Comprimir Áudio

M-AUDIODEC comprime áudio multicanal mantendo a posição dos alto-falantes e a qualidade.

2025-09-11T16:56:25+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando a Qualidade do Som em Dispositivos Auditivos

Pesquisas revelam novos modelos para melhorar a clareza da voz em fones de ouvido inteligentes.

2025-09-11T12:04:55+00:00 ― 6 min ler

Inteligência Artificial Melhorando a Compreensão dos Robôs sobre Instruções Humanas

Um novo método melhora a habilidade dos robôs de seguir direções faladas com precisão.

2025-09-11T08:21:18+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando Técnicas de Detecção de Fala Falsa

Novos métodos estão melhorando nossa habilidade de detectar discursos falsos de forma eficaz.

2025-09-11T02:21:55+00:00 ― 6 min ler

Som Melhorando o Reconhecimento de Fala com Técnicas de Personalização

Um novo método melhora os modelos de ASR para usuários individuais usando quantização e adaptação.

2025-09-10T13:24:35+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Fala com Modelos de Saída Precoce

Novos modelos se adaptam pra melhorar a eficiência e a rapidez do reconhecimento de fala.

2025-09-09T21:12:55+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Whisper para Línguas de Baixo Recurso

Melhorando o reconhecimento de fala do Whisper para o vietnamita e outras línguas com poucos recursos.

2025-09-08T03:55:10+00:00 ― 5 min ler

Neurociência Entendendo o Processamento de Fala em Ambientes Difíceis

Esse estudo analisa como a habilidade auditiva afeta a compreensão da fala em ambientes barulhentos.

2025-09-07T04:34:28+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando Conjuntos de Dados de Áudio com K-Means Clustering

Usando agrupamento k-means pra otimizar dados de áudio e treinar o modelo melhor.

2025-09-06T15:28:55+00:00 ― 6 min ler

Processamento de Áudio e Fala Seleção Eficiente de Modelos para Reconhecimento de Fala

Um método pra escolher o melhor modelo de ASR baseado nas características do áudio.

2025-09-05T23:17:15+00:00 ― 6 min ler

Computação e linguagem Meu Projeto de Tutor de Ciências: Uma Nova Maneira de Aprender

MyST tem como objetivo melhorar o aprendizado de ciências das crianças por meio de tutoria virtual.

2025-09-05T09:31:20+00:00 ― 5 min ler

Som Avanços na Tecnologia de Transcrição de Reuniões

Uma olhada no M2MeT 2.0 e seu impacto na transcrição de reuniões.

2025-09-05T03:51:15+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços e Desafios nos Modelos de Reconhecimento de Fala

Este estudo analisa como a compressão de modelos afeta o reconhecimento de fala em ambientes barulhentos.

2025-09-04T19:45:25+00:00 ― 6 min ler

Som Avanços em Modelos de Reconhecimento de Áudio e Fala

Um novo modelo melhora a compreensão da fala e dos sons ao mesmo tempo.

2025-09-04T18:08:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Extração de Fala

Apresentando novos modelos pra melhorar a extração de fala em ambientes barulhentos.

2025-09-04T02:45:10+00:00 ― 6 min ler

Computação e linguagem Enfrentando Desafios no Reconhecimento Automático de Fala de Longo Prazo

A pesquisa foca em melhorar os sistemas de ASR para áudio não segmentado.

2025-09-03T13:47:50+00:00 ― 5 min ler

Computação e linguagem Abordando o preconceito de gênero na tecnologia de reconhecimento de fala

Analisando as diferenças de desempenho no reconhecimento de fala entre os gêneros.

2025-09-03T12:51:42+00:00 ― 6 min ler