Informática - Som

RSS

Som Tagueamento de Áudio Eficiente com E-PANNs

Descubra como os E-PANNs melhoram a eficiência do reconhecimento de som.

2025-11-01T04:17:05+00:00 ― 6 min ler

Computação e linguagem Analisando Dialetos Através do Processamento de Áudio

Essa pesquisa analisa dialetos usando gravações de áudio pra mostrar as semelhanças entre eles.

2025-11-01T02:39:55+00:00 ― 6 min ler

Som Avanços nas Técnicas de Classificação de Áudio

Um novo método melhora a classificação de áudio aprendendo sons novos de forma eficiente.

2025-10-31T22:37:00+00:00 ― 5 min ler

Som Avanços na Tecnologia de Adaptação de Texto para Fala

Novo método melhora a adaptação de TTS com requisitos mínimos de dados.

2025-10-31T21:48:25+00:00 ― 6 min ler

Computação e linguagem Entendendo AI Explicável em Sistemas de Reconhecimento de Fala

Uma visão geral dos métodos de IA explicável em reconhecimento automático de fala.

2025-10-31T20:11:15+00:00 ― 7 min ler

Som Avançando a Resposta a Perguntas em Áudio com o Modelo MWAFM

Um novo modelo melhora como as máquinas entendem e respondem a perguntas em áudio.

2025-10-31T18:34:05+00:00 ― 6 min ler

Processamento de Áudio e Fala Avaliando a Troca de Turnos em Sistemas de Texto para Fala

Pesquisas mostram que precisa melhorar a troca de turno na tecnologia de TTS.

2025-10-31T17:45:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Otimização da Fala Sintética para Melhor Treinamento de ASR

Um novo método melhora a seleção de fala sintética para aumentar a precisão dos sistemas de reconhecimento de fala.

2025-10-31T08:51:05+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando o Alinhamento de Transtornos de Fala com Novas Técnicas

Um novo método alinha fala com gagueira com texto de forma eficiente.

2025-10-31T08:02:30+00:00 ― 6 min ler

Som Avanços em Interfaces de Fala Silenciosa

Melhorando sistemas de reconhecimento de fala silenciosa com novas técnicas.

2025-10-31T07:13:55+00:00 ― 6 min ler

Computação e linguagem Melhorando a Precisão do ASR com Viés Contextual

Novos métodos melhoram o reconhecimento automático de fala para palavras raras usando contexto.

2025-10-31T02:22:25+00:00 ― 7 min ler

Som Avanços na Detecção de Palavras com Supervisão Fraca

Um novo método para treinar modelos de detecção de palavras-chave usando supervisão fraca em ambientes barulhentos.

2025-10-31T01:33:50+00:00 ― 7 min ler

Computação e linguagem Avançando a Tradução de Fala para Línguas de Baixos Recursos

Métodos pra melhorar sistemas de tradução de fala pra línguas sub-representadas.

2025-10-31T00:45:15+00:00 ― 5 min ler

Som MERT: Um Modelo Auto-Supervisionado para Entendimento Musical

MERT enfrenta os desafios de modelagem musical com técnicas de aprendizado auto-supervisionado inovadoras.

2025-10-30T23:56:40+00:00 ― 7 min ler

Som Melhorando Modelos RNN-T com Aprendizado por Reforço

Uma nova abordagem melhora o desempenho do RNN-T no reconhecimento automático de fala.

2025-10-30T19:53:45+00:00 ― 8 min ler

Processamento de Áudio e Fala AVLIT: Avançando a Separação de Voz em Ruído

O modelo AVLIT combina som e vídeo pra melhorar a clareza da fala em lugares barulhentos.

2025-10-30T18:16:35+00:00 ― 6 min ler

Aprendizagem de máquinas Abordando o Aprendizado de Atalhos em Sistemas de Reconhecimento de Voz

Analisando o impacto de dados tendenciosos em tecnologias de detecção de áudio.

2025-10-30T17:28:00+00:00 ― 7 min ler

Som Melhorando a Separação de Vozes com Vários Microfones

Um novo método melhora a separação de vozes usando vários microfones sem dados rotulados.

2025-10-30T15:50:50+00:00 ― 4 min ler

Som Avanços nas Técnicas de Anti-Spoofing de Áudio

Um estudo melhora os modelos de verificação de fala pra proteger melhor a identidade.

2025-10-30T15:02:15+00:00 ― 7 min ler

Computação e linguagem Avanços nos Sistemas de Perguntas e Respostas em Áudio

Novos modelos melhoram a forma como as máquinas respondem a perguntas baseadas em áudio.

2025-10-30T13:25:05+00:00 ― 5 min ler

Computação e linguagem Avanços na Síntese de Fala em Alemão Suíço

Novos métodos melhoram a síntese de fala para o suíço-alemão a partir de texto em alemão padrão.

2025-10-30T10:59:20+00:00 ― 6 min ler

Som Avançando a Detecção de Atividade Vocal com SVVAD

Descubra como o SVVAD melhora a detecção de atividade de voz pra uma verificação de falante melhor.

2025-10-30T09:22:10+00:00 ― 6 min ler

Som Avanços na Avaliação Automática de Pronúncia

Um novo método melhora o feedback de pronúncia para quem aprende línguas.

2025-10-30T08:33:35+00:00 ― 7 min ler

Computação e linguagem Medindo a Adaptabilidade em Modelos de Reconhecimento de Fala

Um novo modelo avalia como os modelos de fala se adaptam a tarefas específicas.

2025-10-30T06:56:25+00:00 ― 7 min ler

Som Avançando o Processamento de Fala com HuBERT

Modelos HuBERT melhoram tarefas de fala usando múltiplas resoluções pra ter um desempenho melhor.

2025-10-29T22:02:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Identificação de Voz

Novas técnicas melhoram a precisão em reconhecer falantes e detectar impostores.

2025-10-29T20:24:50+00:00 ― 5 min ler

Som Melhorando Efeitos de Áudio Analógicos Virtuais com Deep Learning

Uma nova abordagem melhora a resposta de fase em efeitos de áudio virtuais usando deep learning.

2025-10-29T18:47:40+00:00 ― 6 min ler

Som Atraso no Reconhecimento de Fala: Um Olhar Mais Próximo no SlothSpeech

SlothSpeech mostra fraquezas nos sistemas de reconhecimento de voz, deixando eles bem mais lentos.

2025-10-29T17:10:30+00:00 ― 5 min ler

Som UnDiff: Uma Nova Abordagem pra Clareza de Áudio

UnDiff melhora a qualidade do áudio usando técnicas inovadoras de restauração de fala.

2025-10-29T16:21:55+00:00 ― 7 min ler

Som Avanços na Tecnologia de Detecção de Gagueira

Novos métodos em aprendizado de máquina melhoram as capacidades de detecção de gagueira.

2025-10-29T14:44:45+00:00 ― 6 min ler

Som EmoMix: Avançando a Sintetização de Fala Emocional

EmoMix permite criar falas que expressam emoções mistas com intensidade certa.

2025-10-29T13:56:10+00:00 ― 6 min ler

Som MW-MAE: Uma Nova Abordagem para Aprendizado de Áudio

Descubra o método inovador de Autoencoder Máscara de Múltiplas Janelas para aprimorar o processamento de áudio.

2025-10-29T11:30:25+00:00 ― 6 min ler

Som Melhorando a Restauração de Áudio com Dicas Visuais

Um método novo combina dados de áudio e visuais pra consertar fala que tá faltando.

2025-10-29T10:41:50+00:00 ― 7 min ler

Computação e linguagem Abordando o Discurso de Ódio em Línguas de Baixos Recursos

Explorando métodos para detectar discurso de ódio em transmissões de áudio de línguas com poucos recursos.

2025-10-29T09:04:40+00:00 ― 5 min ler

Processamento de Áudio e Fala Revitalizando o Som: O Método BABE para Restauração de Áudio

Um novo método restaura as altas frequências perdidas em gravações históricas.

2025-10-29T06:38:55+00:00 ― 8 min ler

Som Avanço na Simulação de Som com o BEDRF

Um novo modelo melhora a difração de som em ambientes virtuais.

2025-10-29T01:47:25+00:00 ― 8 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Viés Contextual

O viés contextual melhora os sistemas de reconhecimento de fala, aumentando a precisão em tarefas específicas.

2025-10-29T00:58:50+00:00 ― 6 min ler

Som Novo Método para Melhorar a Detecção da Pronúncia em Línguas

Esse estudo apresenta um novo sistema pra detectar erros de pronúncia em quem tá aprendendo língua.

2025-10-28T21:44:30+00:00 ― 7 min ler

Som Uma Nova Abordagem para Reorganização Musical

O sistema de Q A usa aprendizado auto-supervisionado pra rearranjar músicas de um jeito inovador.

2025-10-28T20:07:20+00:00 ― 6 min ler

Som Melhorando a Síntese de Fala Expressiva com TVC-GMM

Um novo método melhora a qualidade da conversão de texto em fala e a expressão emocional.

2025-10-28T18:30:10+00:00 ― 5 min ler