Informática - Som

RSS

Som Avanços na Tecnologia de Texto-Para-Fala Emocional

O novo modelo ZET-Speech melhora a síntese de fala emocional para oradores diversos.

2025-11-03T23:29:30+00:00 ― 6 min ler

Som Avanços na Transcrição de Música de Piano e Violino

Estudo descobre que novas técnicas de mixagem melhoram a precisão da transcrição musical.

2025-11-03T21:52:20+00:00 ― 5 min ler

Som Avançando a Interação Humano-Máquina com Diálogo Empático

Um novo método melhora as respostas das máquinas através de uma melhor compreensão emocional.

2025-11-03T21:03:45+00:00 ― 7 min ler

Som Avançando o Reconhecimento de Fala em Configurações com Vários Falantes

Um novo método melhora a precisão no reconhecimento automático de voz em reuniões.

2025-11-03T20:15:10+00:00 ― 6 min ler

Som Desenvolvendo Assistentes de Voz Empáticos com CALLS

O CALLS tem como objetivo melhorar a capacidade dos assistentes de voz em lidar com interações com os clientes.

2025-11-03T19:26:35+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Preenchimento de Áudio

Novos métodos melhoram a restauração de áudio e a qualidade de produção.

2025-11-03T17:49:25+00:00 ― 6 min ler

Som Revolucionando a Medição de Qualidade de Áudio com PLCMOS

A PLCMOS oferece um jeito novo de avaliar a qualidade do som sem ouvintes humanos.

2025-11-03T10:32:10+00:00 ― 7 min ler

Interação Homem-Computador LoopBoxes: Uma Nova Maneira de Fazer Música

LoopBoxes ajuda as crianças a fazer música de um jeito fácil e colaborativo.

2025-11-03T08:55:00+00:00 ― 7 min ler

Som Síntese de Som Inovadora Usando Redes Neurais

Um novo método pra criar sons de impacto realistas usando redes neurais.

2025-11-03T08:06:25+00:00 ― 5 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala para Falantes Não Nativos

Nova técnica melhora sistemas de ASR para reconhecer melhor sotaques não nativos.

2025-11-03T02:26:20+00:00 ― 7 min ler

Processamento de Áudio e Fala Avançando o Reconhecimento de Fala com Aprendizado Fraco Supervisionado

Novos métodos aproveitam a identidade do falante pra melhorar o desempenho do reconhecimento de fala.

2025-11-03T01:37:45+00:00 ― 5 min ler

Som Melhorando o Reconhecimento de Fala com a Abordagem Sidecar

Um novo método combina reconhecimento de fala e identificação de falantes para fala sobreposta.

2025-11-03T00:49:10+00:00 ― 6 min ler

Computação e linguagem Avançando a Tradução Simultânea de fala com DiSeg

Um novo método melhora a qualidade e a eficiência da tradução em tempo real.

2025-11-03T00:00:35+00:00 ― 5 min ler

Som Estimando Respostas ao Impulso de Ambientes com Múltiplas Fontes Sonoras

Um novo método para estimar as respostas de sala em ambientes sonoros complexos.

2025-11-02T21:34:50+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Conversão de Voz

Um novo método de conversão de voz melhora a clareza e a adaptação.

2025-11-02T19:57:40+00:00 ― 7 min ler

Som Apresentando o MeLoDy: Geração de Música Rápida Revelada

MeLoDy gera rapidamente música de alta qualidade a partir de prompts de texto.

2025-11-02T17:31:55+00:00 ― 6 min ler

Som Abordando Ameaças de Segurança em Sistemas de Reconhecimento de Voz

Novos métodos estão surgindo para proteger o reconhecimento de voz contra ataques adversariais.

2025-11-02T16:43:20+00:00 ― 6 min ler

Som Novo método revela riscos de privacidade em modelos de difusão

Uma técnica nova verifica a exposição dos dados de treino em modelos de difusão.

2025-11-02T13:29:00+00:00 ― 6 min ler

Som Avanços na Separação de Voz com S4M

Um novo modelo melhora a isolação de voz em ambientes barulhentos.

2025-11-02T10:14:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Reproduzindo o som da fita magnética com ferramentas digitais

Esse artigo fala sobre como recriar o som de fita magnética usando tecnologia digital.

2025-11-02T09:26:05+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando a Verificação de Fala com o Método OS-KDFT

Um novo método melhora a verificação de locutores ao combinar destilação de conhecimento e ajuste fino.

2025-11-01T22:05:55+00:00 ― 8 min ler

Processamento de Áudio e Fala DeCoR: Um Novo Método para Aprendizado de Áudio

DeCoR ajuda as máquinas a aprender novos sons sem esquecer os antigos.

2025-11-01T21:17:20+00:00 ― 6 min ler

Som Avanços na Marcação de Áudio em Tempo Real

Transformadores de áudio em streaming melhoram a velocidade e a eficiência nos sistemas de tagueamento de áudio.

2025-11-01T20:28:45+00:00 ― 7 min ler

Computação e linguagem Avanços nos Métodos de Transcrição de Fala

Novas técnicas melhoram a precisão e a velocidade na conversão de fala em texto.

2025-11-01T16:25:50+00:00 ― 6 min ler

Som Avaliando a Fala Disártrica: Novos Métodos para Clareza

Essa pesquisa apresenta avaliações melhoradas para uma comunicação mais clara em pessoas com disartria.

2025-11-01T15:37:15+00:00 ― 6 min ler

Som Abordando Desafios no Reconhecimento de Fala com Palavras Enarmônicas

Um novo método melhora o reconhecimento de voz para nomes que soam parecidos.

2025-11-01T14:48:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Diversidade de Fala em Sistemas TTS

Um novo método melhora a naturalidade e a variedade da saída de texto para fala.

2025-11-01T13:11:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Classificação de Áudio com o Adapter Treff

O adaptador Treff melhora a classificação de áudio com dados rotulados limitados.

2025-11-01T12:22:55+00:00 ― 6 min ler

Aprendizagem de máquinas Avanços em Aprendizado Auto-Supervisionado Multi-Tarefa

Novos métodos melhoram a flexibilidade e o desempenho do modelo em tarefas de áudio.

2025-11-01T08:20:00+00:00 ― 5 min ler

Som Tagueamento de Áudio Eficiente com E-PANNs

Descubra como os E-PANNs melhoram a eficiência do reconhecimento de som.

2025-11-01T04:17:05+00:00 ― 6 min ler

Computação e linguagem Analisando Dialetos Através do Processamento de Áudio

Essa pesquisa analisa dialetos usando gravações de áudio pra mostrar as semelhanças entre eles.

2025-11-01T02:39:55+00:00 ― 6 min ler

Som Avanços nas Técnicas de Classificação de Áudio

Um novo método melhora a classificação de áudio aprendendo sons novos de forma eficiente.

2025-10-31T22:37:00+00:00 ― 5 min ler

Som Avanços na Tecnologia de Adaptação de Texto para Fala

Novo método melhora a adaptação de TTS com requisitos mínimos de dados.

2025-10-31T21:48:25+00:00 ― 6 min ler

Computação e linguagem Entendendo AI Explicável em Sistemas de Reconhecimento de Fala

Uma visão geral dos métodos de IA explicável em reconhecimento automático de fala.

2025-10-31T20:11:15+00:00 ― 7 min ler

Som Avançando a Resposta a Perguntas em Áudio com o Modelo MWAFM

Um novo modelo melhora como as máquinas entendem e respondem a perguntas em áudio.

2025-10-31T18:34:05+00:00 ― 6 min ler

Processamento de Áudio e Fala Avaliando a Troca de Turnos em Sistemas de Texto para Fala

Pesquisas mostram que precisa melhorar a troca de turno na tecnologia de TTS.

2025-10-31T17:45:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Otimização da Fala Sintética para Melhor Treinamento de ASR

Um novo método melhora a seleção de fala sintética para aumentar a precisão dos sistemas de reconhecimento de fala.

2025-10-31T08:51:05+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando o Alinhamento de Transtornos de Fala com Novas Técnicas

Um novo método alinha fala com gagueira com texto de forma eficiente.

2025-10-31T08:02:30+00:00 ― 6 min ler

Som Avanços em Interfaces de Fala Silenciosa

Melhorando sistemas de reconhecimento de fala silenciosa com novas técnicas.

2025-10-31T07:13:55+00:00 ― 6 min ler

Computação e linguagem Melhorando a Precisão do ASR com Viés Contextual

Novos métodos melhoram o reconhecimento automático de fala para palavras raras usando contexto.

2025-10-31T02:22:25+00:00 ― 7 min ler