Artigos mais recentes para Reconhecimento de Fala

Processamento de Áudio e Fala Melhorando a Detecção de Falantes com Dados de Áudio e Visuais

Um sistema combina áudio e vídeo pra melhorar a precisão na detecção de falantes.

2025-07-25T10:13:40+00:00 ― 6 min ler

Computação e linguagem Avanços em Sistemas de Diálogo Falado

Um novo método melhora o diálogo da máquina através de dados pseudo-estéreo.

2025-07-25T08:36:30+00:00 ― 7 min ler

Computação e linguagem Melhorando o reconhecimento de fala em chinês através da regularização de pinyin

Este estudo apresenta um conjunto de dados e um método pra melhorar a precisão do ASR chinês usando Pinyin.

2025-07-25T07:47:55+00:00 ― 8 min ler

Som Desvendando Técnicas de Detecção de Áudio Deepfake

Este estudo foca em melhorar a detecção de áudio deepfake usando métodos avançados.

2025-07-25T02:56:25+00:00 ― 5 min ler

Som A Importância de Medir a Incerteza no Reconhecimento de Emoções na Fala

Entender a incerteza aumenta a precisão do reconhecimento de emoções em situações do dia a dia.

2025-07-24T17:13:25+00:00 ― 7 min ler

Processamento de Áudio e Fala Nova Abordagem para Diarização de Falantes

Um sistema pra reconhecimento de falantes em áudio multilíngue sem precisar de muitos dados.

2025-07-24T01:01:45+00:00 ― 6 min ler

Computação e linguagem Avanços na Anonimização de Falantes Multilíngues

Melhorando a tecnologia de anonimização de falantes em nove idiomas pra garantir a privacidade.

2025-07-23T03:58:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços em Reconhecimento de Fala Audiovisual

Pesquisas mostram como o vídeo ajuda a melhorar o reconhecimento de fala em ambientes barulhentos.

2025-07-22T20:41:20+00:00 ― 6 min ler

Som Avanços no Reconhecimento de Fala de Várias Pessoas

Um novo método melhora a precisão em reconhecer fala de vários falantes.

2025-07-22T10:58:20+00:00 ― 6 min ler

Neurociência Entendendo Como Nossos Cérebros Processam Som

Explore como o córtex auditivo integra som ao longo do tempo.

2025-07-22T08:05:26+00:00 ― 7 min ler

Som Avanços na Tecnologia de Aprimoramento de Voz

Um novo método melhora a clareza da fala em ambientes barulhentos usando redes neurais duplas.

2025-07-22T06:55:25+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços em Reconhecimento Automático de Fala em Streaming

O modelo XLSR-Transducer manda bem na transcrição em tempo real com pouquíssimos dados.

2025-07-21T18:46:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Seed-ASR: Avançando a Tecnologia de Reconhecimento de Fala

Um novo modelo melhora a precisão nas capacidades de fala para texto em várias línguas.

2025-07-21T14:43:45+00:00 ― 6 min ler

Som Vulnerabilidade em Sistemas de Reconhecimento de Fala Exposta

Pesquisas mostram riscos em modelos de fala multitarefa como o Whisper.

2025-07-21T09:52:15+00:00 ― 5 min ler

Computação e linguagem TokenVerse: Facilitando a Análise de Conversas

TokenVerse simplifica a análise de conversas faladas ao integrar várias tarefas em um único modelo.

2025-07-21T08:15:05+00:00 ― 7 min ler

Som Avançando o Reconhecimento de Palavras-Chave com Mix-Treino

Este estudo analisa o Mix-Training para reconhecimento de palavras-chave em condições de fala barulhenta.

2025-07-19T16:39:18+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando o Reconhecimento de Fala para Línguas com Poucos Recursos

Melhorando sistemas de reconhecimento de fala para línguas com dados online limitados.

2025-07-19T04:25:45+00:00 ― 6 min ler

Processamento de Áudio e Fala Espectrogramas e Redes Neurais no Reconhecimento de Fala

Este estudo analisa como redes neurais interpretam a fala usando espectrogramas.

2025-07-18T22:45:40+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Dicas Contextuais

Aprenda como o contexto melhora a precisão do reconhecimento automático de fala e a identificação de palavras.

2025-07-16T14:53:25+00:00 ― 6 min ler

Computação e linguagem Analisando a Harmonia Vocálica no Assamês com fiwGAN

Esse estudo usa fiwGAN pra explorar os padrões de harmonia vocálica na língua assamesa.

2025-07-16T07:17:06+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando ASR de Code-Switching com Destilação de Conhecimento

Um novo framework melhora a performance de ASR usando dados e recursos limitados.

2025-07-15T22:41:45+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Formatação de Números em Transcrições de ASR

Este artigo fala sobre maneiras de melhorar a formatação de expressões numéricas em transcrições automáticas.

2025-07-14T15:55:35+00:00 ― 6 min ler

Computação e linguagem Novos Métodos em Processamento de Linguagem Falada

Pesquisadores exploram abordagens sem texto pra entender melhor a linguagem falada.

2025-07-13T18:11:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços em Técnicas de Melhoria de Voz

Um novo modelo melhora a clareza da fala, atacando ruídos e ecos.

2025-07-12T15:20:35+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Análise de Imagens Médicas Baseada em Fala

Um novo conjunto de dados impulsiona a saúde com sistemas de pergunta baseados em fala para imagens médicas.

2025-07-12T04:00:30+00:00 ― 8 min ler

Computação e linguagem Otimizando a Correção de Erros do ASR com Modelos de Linguagem

Um estudo sobre como melhorar a precisão da transcrição com um design de prompt melhor.

2025-07-11T15:03:05+00:00 ― 6 min ler

Som Melhorando o Reconhecimento de Emoções na Fala em Ambientes Barulhentos

Uma nova abordagem melhora os sistemas SER usando descrições do ambiente ruidoso.

2025-07-11T06:08:40+00:00 ― 7 min ler

Som Abordagem Inovadora para Treinamento de Assistentes de Voz

Combinar TTS e dados reais melhora de forma eficaz os sistemas de reconhecimento de voz.

2025-07-10T00:59:40+00:00 ― 5 min ler

Som Avanços nas Interfaces de Fala Silenciosa

Novo método melhora a conversão de fala silenciosa em áudio compreensível.

2025-07-09T22:33:55+00:00 ― 6 min ler

Som Avanços nas Técnicas de Separação de Fala Audiovisual

Um novo método melhora a separação de vozes em ambientes barulhentos com vários falantes.

2025-07-09T16:53:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Um Novo Método para Medir o Significado do Som

Este estudo apresenta um método pra avaliar o significado dos sinais sonoros.

2025-07-09T16:05:15+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando as Tecnologias de Reconhecimento de Fala Sussurrada

Novos métodos buscam melhorar o reconhecimento da fala sussurrada em sistemas automáticos.

2025-07-08T08:30:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Colaboração de IA

Modelos de IA melhoram a precisão das conversões de fala para texto.

2025-07-07T09:50:10+00:00 ― 6 min ler

Processamento de Áudio e Fala Equilibrando Privacidade e Utilidade na Análise de Conversa

Analisando técnicas pra proteger a privacidade enquanto analisa conversas gravadas.

2025-07-07T04:10:05+00:00 ― 6 min ler

Processamento de Áudio e Fala SynesLM: Avançando a Tecnologia de Fala Audiovisual

Um novo modelo integra dados de áudio e visual para reconhecimento de fala e tradução.

2025-07-06T20:04:15+00:00 ― 7 min ler

Som Enfrentando os Desafios do Reconhecimento de Acento na Tecnologia de Fala

Novos métodos melhoram a precisão do reconhecimento de fala para sotaques diversos.

2025-07-05T05:12:15+00:00 ― 5 min ler

Computação e linguagem Novo Framework Transforma Fala em Grafos de Conhecimento

Wav2graph cria gráficos de conhecimento a partir da linguagem falada pra melhorar a compreensão da IA.

2025-07-04T04:06:10+00:00 ― 8 min ler

Som Apresentando MulliVC: Sistema de Conversão de Voz de Nova Geração

MulliVC transforma vozes em várias línguas com uma precisão e clareza impressionantes.

2025-07-03T11:54:30+00:00 ― 6 min ler

Robótica Robôs Aprendem a Ler Emoções Humanas

Novo sistema de navegação de robôs entende comandos falados através das emoções.

2025-07-02T20:42:06+00:00 ― 7 min ler

Computação e linguagem Novo Modelo TOGGL Melhora a Transcrição de Fala

O modelo TOGGL melhora a precisão da transcrição em situações de fala sobreposta.

2025-07-02T03:31:10+00:00 ― 6 min ler