Informática - Som

RSS

Som Avanços na Tecnologia de Texto para Fala

Uma olhada no novo sistema TTS de estágio único que tá melhorando a geração de fala.

2025-06-08T09:28:30+00:00 ― 7 min ler

Computação e linguagem Melhorando Modelos de Linguagem de Áudio para Tailandês e Inglês

Este estudo fala sobre os desafios em modelos de linguagem áudio para línguas com poucos recursos.

2025-06-08T08:39:55+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Emoções em Línguas de Baixo Recurso

Este estudo melhora os sistemas de reconhecimento de emoções para línguas menos comuns usando dados de alta qualidade.

2025-06-08T07:51:20+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Fala Multilíngue

Um modelo melhora tarefas de fala em ambientes multilíngues, enfrentando os desafios da troca de códigos.

2025-06-08T06:14:10+00:00 ― 6 min ler

Processamento de Áudio e Fala DeFT-Mamba: Avançando Técnicas de Separação de Som

DeFT-Mamba melhora a separação e classificação de sons em ambientes barulhentos.

2025-06-08T01:22:40+00:00 ― 6 min ler

Som Avançando o Reconhecimento Automático de Fala com CADA-GAN

CADA-GAN melhora o desempenho dos sistemas de ASR em vários ambientes de gravação.

2025-06-07T23:45:30+00:00 ― 7 min ler

Processamento de Áudio e Fala EVA: Uma Nova Era no Reconhecimento de Fala Audiovisual

A EVA combina sinais de áudio e visuais pra melhorar a precisão do reconhecimento de fala.

2025-06-07T22:08:20+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Fala para Cenários com Várias Pessoas falando

Um novo framework simplifica o reconhecimento de fala em ambientes movimentados.

2025-06-07T20:31:10+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços no Reconhecimento de Fala Audiovisual

Llama-AVSR junta áudio e vídeo pra melhorar a precisão do reconhecimento de fala.

2025-06-07T18:05:25+00:00 ― 8 min ler

Som Fortalecendo a Segurança de Áudio com WMCodec

WMCodec melhora a marca d'água de áudio pra mais segurança e autenticidade.

2025-06-07T14:02:30+00:00 ― 6 min ler

Som Avançando na Classificação de Cena Acústica no Desafio DCASE 2024

Novos modelos enfrentam a classificação de som com dados de treinamento limitados.

2025-06-07T12:25:20+00:00 ― 6 min ler

Som Avanços nos Métodos de Detecção de Áudio Falso

Uma nova abordagem melhora a detecção de áudio falso usando modelos pré-treinados.

2025-06-07T11:36:45+00:00 ― 6 min ler

Som Avanços na Tecnologia de Texto para Fala

Novo método melhora a qualidade e a eficiência da geração de fala.

2025-06-07T10:48:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Melhorando a Localização do Som em Ambientes Barulhentos

Um método que combina dados rotulados e não rotulados melhora a detecção de fontes sonoras.

2025-06-07T09:11:00+00:00 ― 6 min ler

Som O Papel do Som na Performance do Tênis de Mesa

Descubra como os sons ajudam os jogadores no pingue-pongue.

2025-06-07T07:33:50+00:00 ― 7 min ler

Som Avanços na Música Orquestral Gerada por Computador

Um sistema que prioriza melodia enquanto oferece controle sobre a geração de música orquestral.

2025-06-07T06:45:15+00:00 ― 6 min ler

Som Avanços nos Sistemas de Feedback para Aprendizado de Línguas

Um novo método usa sombreamento virtual pra melhorar o feedback de pronúncia dos aprendizes de línguas.

2025-06-07T05:56:40+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços nas Técnicas de Áudio Binaural

Novos métodos melhoram a qualidade do áudio binaural em ambientes sonoros desafiadores.

2025-06-07T04:19:30+00:00 ― 10 min ler

Aprendizagem de máquinas Avanços no Reconhecimento de Fala para Crianças

Um novo método de ASR ajuda a tecnologia a entender melhor a fala das crianças.

2025-06-06T20:13:40+00:00 ― 6 min ler

Som Compositor: Uma Nova Maneira de Criar Música a partir de Palavras

O compositor usa comandos de texto pra criar composições musicais complexas em formato MIDI.

2025-06-06T12:07:50+00:00 ― 7 min ler

Som FruitsMusic: Analisando as Músicas de Grupos Idols Japoneses

Um recurso pra estudar os padrões de canto na música de ídolos japoneses.

2025-06-06T10:30:40+00:00 ― 7 min ler

Som Avançando a Síntese de Som de Violino com o ViolinDiff

ViolinDiff melhora o realismo da música de violino gerada por computador.

2025-06-06T09:42:05+00:00 ― 6 min ler

Som Avanços na Classificação de Som Subaquático Usando Aprendizado Profundo

Combinar recursos melhora a precisão na classificação de sons subaquáticos.

2025-06-06T04:50:35+00:00 ― 7 min ler

Som Avanços no Reconhecimento Acústico de Alvos Subaquáticos

Transfer learning melhora a classificação de áudio para detecção de som subaquático.

2025-06-06T04:02:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões V-AURA: Avançando a Integração de Vídeo para Áudio

Um novo modelo cria áudio que combina com o vídeo, melhorando as experiências de mídia.

2025-06-05T23:59:05+00:00 ― 5 min ler

Computação e linguagem Melhorando sistemas de ASR com listas de palavras-chave e modelos de linguagem

Um método pra melhorar o reconhecimento automático de fala misturando listas de palavras-chave com modelos de linguagem.

2025-06-05T20:44:45+00:00 ― 5 min ler

Gráficos Imitando Sons: Conectando Humanos e Máquinas

Um estudo sobre técnicas de imitação vocal usando tecnologia pra melhorar a comunicação.

2025-06-05T19:56:10+00:00 ― 6 min ler

Computação e linguagem Métodos Inovadores para Reconhecimento de Fala com Dados Limitados

Aprenda a treinar modelos de fala de forma eficaz com menos recursos rotulados.

2025-06-05T19:07:35+00:00 ― 8 min ler

Computação e linguagem Reavaliando o Gênero na Pesquisa de Tecnologia de Fala

Uma análise da terminologia de gênero na tecnologia de fala e suas implicações sociais.

2025-06-05T15:53:15+00:00 ― 8 min ler

Processamento de Áudio e Fala Avançando a Detecção de Eventos Sonoros com Novo Framework

Uma nova estrutura melhora a detecção de eventos sonoros sobrepostos em ambientes de áudio complexos.

2025-06-05T13:27:30+00:00 ― 7 min ler

Som Usando Aprendizado de Máquina pra Classificação de Canto de Pássaro

Pesquisas sobre como melhorar a identificação de sons de pássaros usando técnicas de aprendizado de máquina.

2025-06-05T10:13:10+00:00 ― 8 min ler

Som Avanço na Geração de Covers de Piano através de Técnicas de AMT

Um novo método melhora a criação automática de capas de piano usando a tecnologia de transcrição musical existente.

2025-06-05T07:47:25+00:00 ― 7 min ler

Processamento de Áudio e Fala Avaliação de Codecs de Áudio Neural: Insights do Desafio Codec-SUPERB

Um olhar sobre os resultados do desafio Codec-SUPERB e as métricas de desempenho do codec.

2025-06-05T06:58:50+00:00 ― 6 min ler

Computação e linguagem Avançando a Comunicação Médica com Tecnologia ASR

O projeto MultiMed melhora o reconhecimento de fala automático para uma comunicação na saúde mais eficiente.

2025-06-05T06:10:15+00:00 ― 7 min ler

Processamento de Áudio e Fala Novos Métodos para Medir a Qualidade do Áudio

Uma nova abordagem para avaliar a qualidade do áudio sem precisar de referências limpas.

2025-06-05T05:21:40+00:00 ― 7 min ler

Som Aprimorando a Classificação de Sons Ambientais com a Estrutura ECHO

O framework ECHO melhora a precisão da classificação de sons usando rótulos estruturados e um processo de aprendizado em duas etapas.

2025-06-05T04:33:05+00:00 ― 6 min ler

Processamento de Áudio e Fala Combinando Áudio e Dicas Visuais pra Falar Mais Claro

Novo método melhora a clareza da fala integrando informações visuais.

2025-06-04T22:53:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Estimativa de Direção do Som em Ambientes Barulhentos

Uma nova abordagem melhora a estimativa de direção do som para falantes em movimento em ambientes desafiadores.

2025-06-04T19:38:40+00:00 ― 10 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Recuperação de Momentos de Áudio

A Recuperação de Momentos de Áudio permite localizar momentos específicos em gravações longas.

2025-06-04T13:10:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Segurança no VR Social com o Safe Guard

O Safe Guard detecta discurso de ódio em tempo real durante interações de voz na VR social.

2025-06-04T11:32:50+00:00 ― 7 min ler