Artigos mais recentes para Tecnologia de Fala

Som Avanços em Sistemas de Contra-medidas de Fala

Pesquisadores melhoram a detecção de fala gerada por máquinas usando ajustes nas informações de fase.

2025-10-26T17:55:10+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Fala Não Supervisionado

Um novo framework melhora o estudo de sistemas de reconhecimento de fala não supervisionados.

2025-10-25T13:34:45+00:00 ― 8 min ler

Som LinDiff: Um Salto à Frente na Síntese de Fala

Novo modelo LinDiff melhora a velocidade e a qualidade da síntese de fala.

2025-10-25T00:37:25+00:00 ― 5 min ler

Som Avanços Inovadores na Tecnologia de Fala Eletrolaríngea

Pesquisadores misturam recursos visuais e sonoros pra melhorar a fala de quem usa eletrólitos.

2025-10-24T12:28:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Modelos de Linguagem Grandes

Essa pesquisa mostra como LLMs melhoram a compreensão da fala em vídeos longos.

2025-10-23T22:42:45+00:00 ― 5 min ler

Processamento de Áudio e Fala Gestão Eficiente de Grandes Modelos de Fala

Um novo método otimiza modelos de fala pra melhor desempenho com menos recursos.

2025-10-23T21:54:10+00:00 ― 6 min ler

Aprendizagem de máquinas EM-Network: Uma Nova Abordagem em Aprendizado de Sequências

O EM-Network melhora o aprendizado de sequências em tarefas de processamento de fala e língua.

2025-10-23T07:19:40+00:00 ― 6 min ler

Som Avaliando a Qualidade da Fala com Modelos de Aprendizado de Máquina

Este estudo avalia vários modelos para prever a qualidade da fala sintetizada.

2025-10-21T16:27:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Conjuntos Baseados em Confiança

Esse artigo fala sobre como melhorar o reconhecimento de fala usando métodos de ensemble baseados em confiança.

2025-10-16T18:14:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando no Texto para Fala: Modelo GenerTTS Explicado

O GenerTTS melhora a tecnologia de texto-para-fala para aplicativos multilíngues.

2025-10-16T15:48:45+00:00 ― 6 min ler

Som Avançando a Tecnologia de Isolamento de Voz

Um novo modelo melhora a extração de fala de fundos barulhentos usando aprendizado profundo.

2025-10-16T02:02:50+00:00 ― 5 min ler

Som Avanços na Síntese de Fala Articulatória

Um estudo sobre como melhorar a reprodução do som vocal usando técnicas de síntese avançadas.

2025-10-11T02:12:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços nas Técnicas de Anonimização de Fala

Novos métodos buscam esconder a identidade dos falantes mantendo a clareza na fala.

2025-10-08T01:20:00+00:00 ― 6 min ler

Som Avanços na Melhoria de Voz Usando Redes Neurais com Pulsos

Um novo método pra melhorar a qualidade do áudio usando redes eficientes em energia.

2025-10-03T21:44:15+00:00 ― 6 min ler

Inteligência Artificial Medindo Emoções na Fala: Uma Nova Abordagem

Pesquisadores analisam como as emoções são compartilhadas pela fala usando dados diversos.

2025-10-03T09:07:42+00:00 ― 7 min ler

Computação e linguagem Avanços na tecnologia de conversão de texto em fala

Novos métodos melhoram a qualidade da fala sintetizada usando aprendizado auto-supervisionado.

2025-09-30T17:37:25+00:00 ― 6 min ler

Som Avançando o Reconhecimento de Fala com Aprendizado Federado

Aprendizado Federado melhora o reconhecimento de fala enquanto mantém os dados dos usuários privados.

2025-09-30T08:43:00+00:00 ― 6 min ler

Computação e linguagem EmoDistill: Avançando o Reconhecimento de Emoção na Fala

Um novo método melhora a detecção de emoções na fala usando só áudio.

2025-09-28T23:55:36+00:00 ― 5 min ler

Aprendizagem de máquinas O-1: Uma Nova Fronteira no Treinamento de Reconhecimento de Voz

O-1 melhora o reconhecimento de fala otimizando métodos de auto-treinamento.

2025-09-26T09:10:10+00:00 ― 6 min ler

Som Novo Estudo sobre Como Detectar Fala Gerada por IA

A pesquisa destaca métodos de detecção em tempo real para áudios falsos criados por IA.

2025-09-21T19:02:50+00:00 ― 6 min ler

Som Melhorando a Sintetização de Voz com Técnicas de Poda

Novos métodos de poda melhoram o desempenho de modelos de texto-para-fala de múltiplos falantes em zero-shot.

2025-09-20T15:31:00+00:00 ― 8 min ler

Processamento de Áudio e Fala Avanços em Aprendizado Auto-Supervisionado para Reconhecimento de Fala

Novos métodos para selecionar dados de fala minimizam a rotulagem enquanto melhoram a precisão do reconhecimento.

2025-09-20T13:53:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Avaliação da Qualidade da Fala com Pontuações de Preferência

Um novo método melhora a classificação da qualidade de fala usando as notas de preferência dos ouvintes.

2025-09-20T07:25:10+00:00 ― 6 min ler

Som Melhorando o Reconhecimento de Fala para Pessoas com Gagueira

Um método pra melhorar os sistemas de reconhecimento de voz pra usuários que gaguejam.

2025-09-20T06:36:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços no Rastreamento de Formantes para Processamento de Fala

Novos métodos de um único passo melhoram a precisão no acompanhamento de formantes para sons de fala.

2025-09-19T02:16:10+00:00 ― 5 min ler

Computação e linguagem Conectando Fala com Modelos de Linguagem: O Método BLSP

Uma nova abordagem melhora a integração da fala com modelos de linguagem.

2025-09-18T15:44:35+00:00 ― 7 min ler

Computação e linguagem O Papel dos Modelos de Linguagem Pré-treinados em TTS

Analisando como modelos de linguagem pré-treinados melhoram a qualidade do texto-para-fala.

2025-09-17T20:18:35+00:00 ― 6 min ler

Processamento de Áudio e Fala MuLanTTS: Uma Nova Fronteira em Texto para Fala

O MuLanTTS da Microsoft oferece capacidades de texto-para-fala em francês de forma natural e expressiva.

2025-09-15T22:57:55+00:00 ― 5 min ler

Computação e linguagem Avanços em Aprendizado Auto-Supervisionado para Tecnologias de Fala em Francês

Um projeto tem como objetivo melhorar o processamento de fala em francês usando aprendizado auto-supervisionado.

2025-09-14T12:57:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Anotação Automática de Prosódia

Novos métodos melhoram como as máquinas reconhecem o ritmo da fala e a emoção.

2025-09-14T12:08:50+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Fala para Crianças

Esse estudo melhora a capacidade dos sistemas de ASR em reconhecer a fala das crianças.

2025-09-14T02:25:50+00:00 ― 7 min ler

Processamento de Áudio e Fala VoxtLM: Uma Abordagem Unificada para Fala e Texto

VoxtLM combina reconhecimento de fala, síntese, geração de texto e continuação em um só modelo.

2025-09-13T11:02:45+00:00 ― 5 min ler

Processamento de Áudio e Fala Libriheavy: Um Novo Conjunto de Dados para Reconhecimento de Fala

A Libriheavy oferece 50.000 horas de inglês falado pra melhorar a tecnologia de reconhecimento de fala.

2025-09-12T18:51:05+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Clareza da Fala com a Tecnologia AV2Wav

O AV2Wav melhora a qualidade da fala usando dicas sonoras e visuais.

2025-09-12T17:13:55+00:00 ― 6 min ler

Som Otimizando Texto para Fala com Seleção de Core-Set

A seleção de core-set melhora os modelos de texto-para-fala ao focar em dados diversos.

2025-09-12T08:19:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Emo-StarGAN: Avançando a Tecnologia de Conversão de Voz

Novo método preserva o tom emocional na conversão de voz pra uma melhor interação humano-computador.

2025-09-11T23:25:05+00:00 ― 6 min ler

Som Desafios Emocionais Afetam Modelos de Separação de Fala

Pesquisas mostram que a fala emocional afeta o desempenho do modelo em tarefas de separação de fala.

2025-09-11T18:33:35+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando a Inversão de Fala através de Aprendizado Auto-Supervisionado

A pesquisa combina aprendizado auto-supervisionado e novas técnicas de medição pra melhorar a inversão de fala.

2025-09-10T01:15:50+00:00 ― 6 min ler

Som Melhorando a Clareza na Fala com Electrolaringeal

Pesquisadores desenvolvem uma nova estrutura pra melhorar a clareza da fala pra usuários de eletrolaringe.

2025-09-09T22:50:05+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando Sistemas de ASR com Dados Sintéticos

Um novo método usa dados sintéticos pra melhorar sistemas de ASR em áreas desconhecidas.

2025-09-09T15:32:50+00:00 ― 7 min ler