Informática - Som

RSS

Som Um Novo Método para Detectar Spoofing de Voz

Uma maneira firme de identificar anomalias de áudio e combater a falsificação de voz.

2025-09-09T07:27:00+00:00 ― 6 min ler

Computação e linguagem Avanços no Reconhecimento de Emoções em Conversas

Um novo modelo melhora a compreensão das emoções durante as conversas.

2025-09-09T06:38:25+00:00 ― 7 min ler

Computação e linguagem Os símbolos de fala gerados por computador seguem a Lei de Zipf?

Este estudo investiga se os símbolos de fala aprendidos imitam os padrões de frequência das palavras.

2025-09-09T04:12:40+00:00 ― 6 min ler

Som DiCon: Uma Nova Abordagem para Síntese de Fala

Apresentando um método mais rápido para síntese de fala de alta qualidade usando modelos de difusão.

2025-09-09T03:24:05+00:00 ― 7 min ler

Processamento de Áudio e Fala HiFTNet: Avançando a Tecnologia de Texto para Fala

HiFTNet oferece uma síntese de fala mais rápida e de alta qualidade usando técnicas inovadoras e eficientes.

2025-09-09T02:35:30+00:00 ― 6 min ler

Som Avanços na Tecnologia de Conversão de Voz Usando Imagens Faciais

Novo método transforma vozes usando características faciais para várias aplicações.

2025-09-09T01:46:55+00:00 ― 10 min ler

Processamento de Áudio e Fala Apresentando o AV-SUPERB: Um Novo Padrão para Modelos Audiovisuais

AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.

2025-09-08T22:32:35+00:00 ― 6 min ler

Som Melhorando a Diarização de Falantes com Informações Semânticas

Uma nova abordagem melhora a diarização de falantes ao integrar dados semânticos no processo.

2025-09-08T20:06:50+00:00 ― 6 min ler

Som Geração de Texto pra Áudio Mais Rápida Usando Destilação de Consistência

Nova metodologia melhora a velocidade e eficiência na geração de Texto para Áudio.

2025-09-08T18:29:40+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Emoções na Fala: Uma Abordagem Multilíngue

Pesquisas mostram que a precisão em reconhecer emoções na fala melhorou entre os idiomas.

2025-09-08T16:03:55+00:00 ― 5 min ler

Som Melhorando o Reconhecimento de Fala com Treinamento na Hora do Teste

Explore como o TTT melhora o reconhecimento de fala se adaptando a mudanças na distribuição.

2025-09-08T14:26:45+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Aprimorando Técnicas de Localização de Fontes Sonoras

Melhorando a forma como identificamos fontes de som usando dados áudio-visuais.

2025-09-08T12:49:35+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Mapeando Sons: Uma Nova Abordagem para Análise de Paisagens Sonoras

Um método pra visualizar e prever sons em vários ambientes usando tecnologia avançada.

2025-09-08T11:12:25+00:00 ― 6 min ler

Computação e linguagem Avanços na Identificação de Linguagem Falada

Novos métodos combinam áudio e metadados pra melhorar o reconhecimento de idiomas.

2025-09-08T07:09:30+00:00 ― 7 min ler

Som Novo Sistema de Reconhecimento de Voz Enfrenta Ameaças de Spoofing

Um sistema criado pra detectar ataques de apresentação de voz aumenta a segurança no reconhecimento vocal.

2025-09-08T06:20:55+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando o Whisper para Línguas de Baixo Recurso

Melhorando o reconhecimento de fala do Whisper para o vietnamita e outras línguas com poucos recursos.

2025-09-08T03:55:10+00:00 ― 5 min ler

Som Avanços na Edição de Fala Baseada em Texto

O FluentEditor melhora a edição de áudio focando no fluxo natural e na consistência.

2025-09-07T20:37:55+00:00 ― 4 min ler

Computação e linguagem Novos Métodos em Tradução Simultânea de Fala

Melhorando a tradução em tempo real com técnicas avançadas de segmentação.

2025-09-07T18:12:10+00:00 ― 6 min ler

Computação e linguagem Avanços na Tradução de Fala Simultânea

Melhorando traduções em tempo real com métodos inovadores e políticas inteligentes.

2025-09-07T17:23:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando o Reconhecimento Automático de Fala para o Árabe Tunisiano

Esforços pra melhorar os sistemas de ASR pra árabe tunisiano e troca de código.

2025-09-07T16:35:00+00:00 ― 6 min ler

Som Personalizando a Geração de Música: Novas Abordagens

Métodos inovadores buscam adaptar a geração de música às preferências dos usuários.

2025-09-07T15:46:25+00:00 ― 8 min ler

Processamento de Áudio e Fala Apresentando o Modelo SPGM para Separação de Fala

Um novo modelo melhora a eficiência e o desempenho na separação de fala.

2025-09-07T10:54:55+00:00 ― 6 min ler

Processamento de Áudio e Fala Novo modelo melhora a avaliação da qualidade do áudio

Uma nova abordagem avalia a qualidade do áudio usando vários microfones em diferentes ambientes.

2025-09-07T08:29:10+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços em Técnicas de Separação de Som

Um novo método melhora a separação de som em diferentes frequências.

2025-09-07T06:03:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a comunicação por voz com cancelamento de eco acústico

Explore os avanços em cancelamento de eco pra melhorar a qualidade das chamadas.

2025-09-07T05:14:50+00:00 ― 5 min ler

Som Avanços na Síntese Musical Multi-Instrumental

Um novo método melhora a geração de música ao adicionar contexto de performance.

2025-09-07T01:11:55+00:00 ― 7 min ler

Som Método inovador transforma legendagem de áudio com dados de texto

Uma nova abordagem gera legendas de áudio usando apenas texto, melhorando a eficiência dos dados.

2025-09-07T00:23:20+00:00 ― 8 min ler

Som Conectando Música: Recuperação de Áudio e Partitura

Explorando os desafios e inovações em fazer a correspondência entre gravações de áudio e partituras.

2025-09-06T21:57:35+00:00 ― 7 min ler

Som Avançando a Recuperação Musical com Aprendizado Auto-supervisionado

Uma nova abordagem usa aprendizado auto-supervisionado pra conectar áudio e partituras.

2025-09-06T21:09:00+00:00 ― 6 min ler

Som Ligando Áudio e Partituras com Redes Recorrentes

Um novo método melhora a combinação de áudio e partituras.

2025-09-06T19:31:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando Conjuntos de Dados de Áudio com K-Means Clustering

Usando agrupamento k-means pra otimizar dados de áudio e treinar o modelo melhor.

2025-09-06T15:28:55+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Técnicas de Aumento de Áudio

Estudo mostra que a augmentação de áudio pode melhorar o reconhecimento de fala em línguas de baixo recurso.

2025-09-06T09:48:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando o Reconhecimento Automático de Fala Multilíngue com Máscaras Adaptativas

Uma nova abordagem melhora a eficiência em modelos de ASR multilíngues ao integrar técnicas de mascaramento adaptativo.

2025-09-06T09:00:15+00:00 ― 5 min ler

Som Usando Áudio Deepfake para Melhores Sistemas de Transcrição

Investigando áudio deepfake pra melhorar modelos de transcrição pra línguas menos comuns.

2025-09-06T07:23:05+00:00 ― 10 min ler

Aprendizagem de máquinas Melhorando o Aprendizado com Rótulos Fracos Através da Seleção de Exemplos Negativos

Novas estratégias melhoram o aprendizado com rótulos fracos ao selecionar exemplos negativos relevantes.

2025-09-06T04:57:20+00:00 ― 7 min ler

Som Nova Técnica de Marcação para Modelos de Áudio

Um método novo pra marcar áudio criado por modelos de difusão pra proteger a propriedade.

2025-09-06T04:08:45+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Redes de Memória

Novas técnicas melhoram os sistemas de ASR para reconhecer melhor discursos longos.

2025-09-06T03:20:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços em Sistemas de Detecção de Palavras-chave

Novas técnicas visam aumentar a precisão dos dispositivos ativados por voz contra ataques.

2025-09-06T01:43:00+00:00 ― 7 min ler

Processamento de Áudio e Fala DurIAN-E: Avançando a Tecnologia de Texto para Fala

DurIAN-E melhora a fala sintética com uma expressividade e fluidez mais naturais.

2025-09-06T00:54:25+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Reconhecimento de Emoções na Fala

Descubra como o SER melhora as interações entre humanos e máquinas através da detecção de emoções.

2025-09-06T00:05:50+00:00 ― 6 min ler