Artigos mais recentes para Reconhecimento de Fala

Computação e linguagem Novos Métodos em Processamento de Linguagem Falada

Pesquisadores exploram abordagens sem texto pra entender melhor a linguagem falada.

2025-07-13T18:11:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços em Técnicas de Melhoria de Voz

Um novo modelo melhora a clareza da fala, atacando ruídos e ecos.

2025-07-12T15:20:35+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Análise de Imagens Médicas Baseada em Fala

Um novo conjunto de dados impulsiona a saúde com sistemas de pergunta baseados em fala para imagens médicas.

2025-07-12T04:00:30+00:00 ― 8 min ler

Computação e linguagem Otimizando a Correção de Erros do ASR com Modelos de Linguagem

Um estudo sobre como melhorar a precisão da transcrição com um design de prompt melhor.

2025-07-11T15:03:05+00:00 ― 6 min ler

Som Melhorando o Reconhecimento de Emoções na Fala em Ambientes Barulhentos

Uma nova abordagem melhora os sistemas SER usando descrições do ambiente ruidoso.

2025-07-11T06:08:40+00:00 ― 7 min ler

Som Abordagem Inovadora para Treinamento de Assistentes de Voz

Combinar TTS e dados reais melhora de forma eficaz os sistemas de reconhecimento de voz.

2025-07-10T00:59:40+00:00 ― 5 min ler

Som Avanços nas Interfaces de Fala Silenciosa

Novo método melhora a conversão de fala silenciosa em áudio compreensível.

2025-07-09T22:33:55+00:00 ― 6 min ler

Som Avanços nas Técnicas de Separação de Fala Audiovisual

Um novo método melhora a separação de vozes em ambientes barulhentos com vários falantes.

2025-07-09T16:53:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Um Novo Método para Medir o Significado do Som

Este estudo apresenta um método pra avaliar o significado dos sinais sonoros.

2025-07-09T16:05:15+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando as Tecnologias de Reconhecimento de Fala Sussurrada

Novos métodos buscam melhorar o reconhecimento da fala sussurrada em sistemas automáticos.

2025-07-08T08:30:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Colaboração de IA

Modelos de IA melhoram a precisão das conversões de fala para texto.

2025-07-07T09:50:10+00:00 ― 6 min ler

Processamento de Áudio e Fala Equilibrando Privacidade e Utilidade na Análise de Conversa

Analisando técnicas pra proteger a privacidade enquanto analisa conversas gravadas.

2025-07-07T04:10:05+00:00 ― 6 min ler

Processamento de Áudio e Fala SynesLM: Avançando a Tecnologia de Fala Audiovisual

Um novo modelo integra dados de áudio e visual para reconhecimento de fala e tradução.

2025-07-06T20:04:15+00:00 ― 7 min ler

Som Enfrentando os Desafios do Reconhecimento de Acento na Tecnologia de Fala

Novos métodos melhoram a precisão do reconhecimento de fala para sotaques diversos.

2025-07-05T05:12:15+00:00 ― 5 min ler

Computação e linguagem Novo Framework Transforma Fala em Grafos de Conhecimento

Wav2graph cria gráficos de conhecimento a partir da linguagem falada pra melhorar a compreensão da IA.

2025-07-04T04:06:10+00:00 ― 8 min ler

Som Apresentando MulliVC: Sistema de Conversão de Voz de Nova Geração

MulliVC transforma vozes em várias línguas com uma precisão e clareza impressionantes.

2025-07-03T11:54:30+00:00 ― 6 min ler

Robótica Robôs Aprendem a Ler Emoções Humanas

Novo sistema de navegação de robôs entende comandos falados através das emoções.

2025-07-02T20:42:06+00:00 ― 7 min ler

Computação e linguagem Novo Modelo TOGGL Melhora a Transcrição de Fala

O modelo TOGGL melhora a precisão da transcrição em situações de fala sobreposta.

2025-07-02T03:31:10+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Aprendizado de Representação de Ruído de Contexto

Um método pra melhorar a qualidade do reconhecimento de fala em ambientes barulhentos.

2025-07-01T23:28:15+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Fala com SaSLaW

Pesquisadores desenvolvem o SaSLaW pra melhorar a adaptação da fala das máquinas em diferentes ambientes.

2025-07-01T16:11:00+00:00 ― 5 min ler

Computação e linguagem Avaliando o Viés em Modelos de Linguagem de Fala

Um novo conjunto de dados destaca os preconceitos em modelos de fala baseados em gênero e idade.

2025-06-30T19:07:50+00:00 ― 8 min ler

Computação e linguagem Avanços em Modelos de Fala Através de Técnicas de Poda

Pesquisas mostram como fazer modelos de fala menores e mais eficientes.

2025-06-29T16:24:35+00:00 ― 6 min ler

Som Melhorando a Detecção de Palavras-Chave com Treinamento Adversarial

O treinamento adversarial melhora a precisão na detecção de palavras-chave em fala sintética e real.

2025-06-28T13:41:20+00:00 ― 6 min ler

Computação e linguagem Avaliação de Modelos de Reconhecimento de Emoção na Fala com Novo Referencial

Um novo padrão melhora a avaliação de sistemas de reconhecimento de emoção na fala em diferentes idiomas e emoções.

2025-06-28T04:15:30+00:00 ― 7 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala Multilíngue Sem Dados Originais

Novos métodos melhoram modelos de ASR para várias línguas, preservando o conhecimento passado.

2025-06-27T15:01:00+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala Bilíngue com XCB

Uma nova abordagem melhora o reconhecimento de frases com troca de código na fala bilíngue.

2025-06-27T11:46:40+00:00 ― 6 min ler

Aprendizagem de máquinas Avanços no Processamento de Sequências com MRConv

Um novo método pra lidar melhor com sequências de dados longas.

2025-06-26T07:21:36+00:00 ― 5 min ler

Computação e linguagem O Papel da Prosódia e da Pragmática na Tecnologia de Fala

Analisando como os padrões de voz afetam o significado e o desempenho da tecnologia.

2025-06-25T21:43:15+00:00 ― 5 min ler

Som Desafios em Detectar Sinais de Fala Parcialmente Falsos

Um olhar sobre as complicações de identificar faixas de áudio misturadas.

2025-06-25T06:20:10+00:00 ― 7 min ler

Computação e linguagem O-HuBERT: Um Passo à Frente no Reconhecimento de Fala

O-HuBERT melhora o reconhecimento de fala ao separar a informação do conteúdo e a informação expressiva.

2025-06-24T20:04:24+00:00 ― 6 min ler

Computação e linguagem Aprimorando o reconhecimento de fala em hindi com pseudo-etiquetagem

Um novo método melhora o reconhecimento de fala em Hindi usando técnicas de pseudo-rotulagem.

2025-06-24T06:02:40+00:00 ― 5 min ler

Processamento de Áudio e Fala Preservando Dialetos Tâmiles Através da Tecnologia

Um sistema pra classificar os dialetos Tamil literário e coloquial usando características sonoras.

2025-06-23T13:51:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala: Sussurrado vs. Normal

Novos métodos melhoram a compreensão de fala sussurrada e normal pelos computadores.

2025-06-23T08:59:30+00:00 ― 6 min ler

Aprendizagem de máquinas Entendendo o Clipping de Micro-lotes em Aprendizado de Máquina

Uma olhada na separação em micro-lotes e seus benefícios para o treinamento de modelos.

2025-06-23T05:45:10+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala em Japonês com Técnicas GER

Pesquisas mostram como LLMs melhoram o reconhecimento de fala automática em japonês.

2025-06-23T04:08:00+00:00 ― 7 min ler

Computação e linguagem Como os Modelos de Fala Aprendem Suprassegmentais

Esse artigo examina como os modelos reconhecem tom, estresse e acentos de pitch.

2025-06-22T21:19:54+00:00 ― 5 min ler

Computação e linguagem Apresentando o SALSA: Um Novo Método para Melhorar o ASR

O SALSA melhora a precisão do reconhecimento de fala para idiomas de baixo recurso, integrando modelos de ASR e de linguagem.

2025-06-22T06:16:15+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento Automático de Fala com Modelos de Linguagem

Novo método melhora a precisão da ASR usando modelos de linguagem para transcrições melhores.

2025-06-21T20:33:15+00:00 ― 4 min ler

Computação e linguagem Melhorando a Precisão da Identificação de Falantes em Conversas

Um novo sistema corrige erros de identificação de fala pra ter transcrições de conversa mais claras.

2025-06-21T18:56:05+00:00 ― 9 min ler

Som Avanços nas Técnicas de Melhoria de Voz

Melhorando a clareza da fala através de filtros híbridos e redes neurais.

2025-06-21T17:18:55+00:00 ― 6 min ler