Um estudo sobre síntese de som e sua avaliação em ambientes controlados.

2025-08-27T16:36:50+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços nas Técnicas de Localização de Fontes Sonoras

Um novo método melhora a precisão na localização de fontes sonoras em movimento usando arrays de microfones.

2025-08-27T01:13:45+00:00 ― 7 min ler

Processamento de Áudio e Fala Uma Nova Abordagem para Avaliação da Qualidade de Áudio com PAM

A PAM oferece um jeito novo de medir a qualidade do áudio sem precisar de gravações de referência.

2025-08-26T21:10:50+00:00 ― 8 min ler

Som Audio Flamingo: Um Novo Modelo para Entender Som

O Audio Flamingo manda bem em ouvir, conversar e se adaptar a novas tarefas de áudio.

2025-08-26T16:19:20+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando o Raciocínio Espacial Sonoro em Máquinas

Um novo modelo melhora a compreensão de áudio espacial pelas máquinas.

2025-08-26T15:30:45+00:00 ― 5 min ler

Computação e linguagem Aprimorando Sistemas de Reconhecimento de Fala em Tempo Real

Um novo modelo melhora a eficiência de reconhecimento de fala em tempo real.

2025-08-26T11:27:50+00:00 ― 7 min ler

Computação e linguagem Reavaliando o Papel dos Sons nas Relações Linguísticas

Esse estudo avalia sons versus palavras na reconstrução das árvores genealógicas das línguas.

2025-08-26T03:22:00+00:00 ― 7 min ler

Aprendizagem de máquinas Avanços na Geração de Música com IA

Novo modelo melhora a criação de música usando o feedback dos usuários.

2025-08-25T21:41:55+00:00 ― 9 min ler

Processamento de Áudio e Fala Renascido: Uma Nova Era em ASR Não Supervisionado

Reborn oferece soluções inovadoras para reconhecimento automático de fala sem dados rotulados.

2025-08-25T19:16:10+00:00 ― 7 min ler

Processamento de Áudio e Fala Transformando Sons: A Ferramenta Ouvir, Conversar e Editar

Uma nova ferramenta ajuda os usuários a modificar sons facilmente através de instruções de texto simples.

2025-08-25T17:39:00+00:00 ― 10 min ler

Computação e linguagem Avanços na Tecnologia de Linguagem

Um novo modelo junta a língua falada e escrita pra melhorar a comunicação.

2025-08-25T03:53:05+00:00 ― 6 min ler

Computação e linguagem Avanços na Tecnologia de Diálogo Falado

Um olhar sobre novos modelos para respostas faladas naturais.

2025-08-25T03:04:30+00:00 ― 7 min ler

Computação e linguagem Aprimorando o Reconhecimento de Fala com Dados Acústicos

Um novo método integra informações acústicas nos modelos de linguagem pra melhorar o reconhecimento de fala.

2025-08-25T02:15:55+00:00 ― 10 min ler

Interação Homem-Computador Transformando a Compreensão do Câncer Através da Música

Usar música pra explicar câncer pode ajudar a entender melhor e deixar a galera mais envolvida.

2025-08-25T01:27:20+00:00 ― 8 min ler

Som Entendendo as Técnicas de Localização de Fonte de Som

Aprenda como a localização do som identifica a fonte dos sons usando técnicas avançadas.

2025-08-25T00:38:45+00:00 ― 5 min ler

Som Capturando o Ritmo da Fala: Um Novo Método

Uma nova abordagem pra sintetizar vozes com precisão rítmica melhorada.

2025-08-24T23:50:10+00:00 ― 10 min ler

Computação e linguagem Melhorando a Transcrição Médica com IA

Os LLMs melhoram a precisão nas transcrições médicas, beneficiando o cuidado com os pacientes.

2025-08-24T16:32:55+00:00 ― 8 min ler

Processamento de Áudio e Fala Adaptando extração de melodia pra diversos estilos musicais

Um método pra melhorar a extração de melodia em diferentes estilos musicais com o mínimo esforço humano.

2025-08-24T15:44:20+00:00 ― 9 min ler

Processamento de Áudio e Fala Melhorando a Diarização de Falantes com Abordagens de Múltiplos Microfones

Novos métodos melhoram a detecção de atividade de voz e sobreposição na diarização de falantes.

2025-08-24T13:18:35+00:00 ― 8 min ler

Processamento de Áudio e Fala Melhorando a Detecção de Depressão com Análise de Fala

Novo método integra sinais de fala para melhorar a detecção de depressão.

2025-08-23T18:41:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Criando Campos Sonoros Uniformes: Técnicas e Ideias

Esse artigo fala sobre métodos pra criar campos de som imersivos usando várias arrumações.

2025-08-23T17:04:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Qualidade da Reverberação Artificial

Um novo método reduz o som metálico indesejado na reverberação de áudio.

2025-08-23T15:26:50+00:00 ― 6 min ler

Processamento de Sinal Chirp MFCC: Uma Nova Abordagem em Processamento de Áudio

Chirp MFCC melhora a representação do sinal de áudio pra uma classificação e reconhecimento melhor.

2025-08-23T08:58:10+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Reconhecimento de Emoções na Fala

O projeto EMO-SUPERB melhora o reconhecimento de emoção na fala com técnicas aprimoradas e colaboração da comunidade.

2025-08-23T00:52:20+00:00 ― 8 min ler

Processamento de Áudio e Fala Codec-SUPERB: Um Benchmark para Codecs de Som

Um novo sistema pra avaliar o desempenho de codec de áudio em várias aplicações.

2025-08-22T23:15:10+00:00 ― 8 min ler

Som Efeitos do Tamanho do Lote no Treinamento de Modelos de Fala

Esse estudo revisa como o tamanho do lote influencia o desempenho e o treinamento do modelo de fala.

2025-08-22T20:00:50+00:00 ― 8 min ler

Som O Futuro da Geração de Música com IA

Descubra como a IA tá transformando a criação musical através da colaboração com humanos.

2025-08-22T10:17:50+00:00 ― 8 min ler

Processamento de Áudio e Fala Melhorando a Verificação de Voz para Crianças

Melhorando os sistemas de ASV pra reconhecer a voz das crianças de forma precisa.

2025-08-22T09:29:15+00:00 ― 10 min ler

Aprendizagem de máquinas Avanços na Análise de Sons Pulmonares com IA

Nova tecnologia melhora a precisão do diagnóstico de doenças pulmonares através da análise de sons.

2025-08-22T01:58:42+00:00 ― 8 min ler

Interação Homem-Computador A Fusão de Som e Visão na Representação de Dados

Analisando como o som e a visão juntos melhoram a compreensão de dados.

2025-08-21T17:17:35+00:00 ― 7 min ler

Som Avanços na Legenda Automática de Áudio

Novos métodos melhoram a acessibilidade e a precisão na legendagem de áudio.

2025-08-21T14:03:15+00:00 ― 7 min ler

Som Detectando Chamadas de Áudio Deepfake: Uma Nova Abordagem

Aprenda a identificar chamadas de áudio falsas com técnicas inovadoras de desafio-resposta.

2025-08-21T07:34:35+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões CustomListener: Uma Nova Era em Interações Virtuais

O CustomListener cria avatares realistas que respondem às conversas de forma dinâmica.

2025-08-21T05:08:50+00:00 ― 7 min ler

Som Avanços nas Técnicas de Diarização Automática de Fala

Pesquisas mostram que o tempo é mais importante do que características específicas dos falantes em modelos de diarização.

2025-08-21T00:17:20+00:00 ― 6 min ler

Multimédia Avanços na Tecnologia de Lábios para Fala

Novo método melhora a síntese de fala para pessoas que não conseguem falar.

2025-08-20T20:14:25+00:00 ― 8 min ler

Interação Homem-Computador Avanços em Interfaces de Fala Silenciosa

Uma olhada no MONA, um sistema que melhora a comunicação em fala silenciosa.

2025-08-20T16:11:30+00:00 ― 5 min ler

Som Entendendo a Tecnologia de Reconhecimento Automático de Fala

Uma visão geral do ASR e seus avanços em aplicações modernas.

2025-08-20T15:22:55+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Emoções na Fala com o Banco de Dados EMOVOME

Explorando novos métodos pra melhorar o reconhecimento de emoção na fala usando dados naturais.

2025-08-20T01:37:00+00:00 ― 6 min ler

Robótica Melhorando o Reconhecimento de Voz de Robôs em Ambientes Barulhentos

A pesquisa foca em ajudar os robôs a entender melhor a fala em meio ao barulho de fundo.

2025-08-19T22:22:40+00:00 ― 6 min ler

Som Automatizando a Avaliação da Dificuldade da Música Usando Análise de Áudio

Esse estudo avança a educação musical automatizando a avaliação da dificuldade das peças de piano.

2025-08-19T21:34:05+00:00 ― 7 min ler

Informática - Som