Novas técnicas melhoram a estimativa de direção do som para vários tipos de áudio.

2025-08-31T01:35:10+00:00 ― 6 min ler

Processamento de Áudio e Fala Controlando o Som pra Ouvir Melhor

Pesquisas mostram maneiras de ajustar o som nos cômodos pra melhorar a clareza.

2025-08-31T00:46:35+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Detectando Humor em Vídeos com o FunnyNet-W

Um novo modelo identifica momentos engraçados em vídeos usando dados visuais, de áudio e de texto.

2025-08-30T23:09:25+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços em Elastômeros Dielétricos para Tecnologia

Elastômeros dielétricos transformam energia elétrica em movimento mecânico, oferecendo várias aplicações.

2025-08-30T20:43:40+00:00 ― 9 min ler

Computação e linguagem Usando a tecnologia ASR pra ajudar no diagnóstico de demência

Transcrições de ASR com erros podem ajudar a identificar o Alzheimer de forma mais precisa.

2025-08-30T16:40:45+00:00 ― 9 min ler

Computação e linguagem Apresentando ELLA-V: Um Novo Capítulo na Síntese de Fala

A ELLA-V melhora a qualidade e o controle de texto para fala, superando os modelos anteriores.

2025-08-30T01:17:40+00:00 ― 6 min ler

Métodos Quantitativos Novo Método Melhora Monitoramento Acústico da Vida Selvagem

Uma nova abordagem melhora a precisão na detecção de chamados de animais sem limites arbitrários.

2025-08-29T23:46:39+00:00 ― 8 min ler

Computação e linguagem Avançando a Classificação de Fala com Dados Multimodais

Um novo modelo integra áudio e texto pra melhorar a classificação da fala.

2025-08-29T18:49:00+00:00 ― 8 min ler

Som Desafio NOTSOFAR-1: Avançando a Tecnologia de Transcrição de Reuniões

Uma nova iniciativa pra melhorar a tecnologia de transcrição em reuniões em salas grandes.

2025-08-29T16:23:15+00:00 ― 9 min ler

Computação e linguagem Avanços na Correção de Erros de Reconhecimento de Fala

Novos métodos melhoram a precisão no reconhecimento de fala ruidosa usando grandes modelos de linguagem.

2025-08-29T01:48:45+00:00 ― 7 min ler

Som Entendendo os Sons das Galinhas Poedeiras para uma Agricultura Melhor

Analisar os sons das galinhas ajuda a melhorar a saúde delas e a produtividade da fazenda.

2025-08-29T00:11:35+00:00 ― 9 min ler

Interação Homem-Computador Desmistificando o Som: Uma Nova Ferramenta pra Realidade Misturada

Um método pra ajudar pessoas com deficiência visual a reconhecer sons na realidade mista.

2025-08-28T20:57:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Abordando os Desafios da Tecnologia de Fala para Línguas com Poucos Recursos

Este artigo fala sobre soluções para aplicativos de fala em idiomas com dados transcritos limitados.

2025-08-28T18:31:30+00:00 ― 7 min ler

Aprendizagem de máquinas Avanços na Classificação de Som Usando Redes de Crença Projetadas

Pesquisadores combinam métodos generativos e discriminativos pra melhorar a classificação de sons.

2025-08-28T16:05:45+00:00 ― 7 min ler

Criptografia e segurança Fortalecendo a Verificação de Voz Contra Ataques de Falsificação

Um novo modelo melhora a segurança na identificação de voz e resiste a fraudes de voz.

2025-08-28T15:17:10+00:00 ― 6 min ler

Aprendizagem de máquinas Aprimorando Mecanismos de Atenção com GAAM

Uma olhada na Atenção Adaptativa Gaussiana para melhorar o desempenho da IA.

2025-08-28T14:28:35+00:00 ― 7 min ler

Processamento de Áudio e Fala Análise de Ritmo de Linguagem e Aprendizado Profundo

Pesquisas mostram que o deep learning melhora nossa compreensão do ritmo da linguagem.

2025-08-28T12:51:25+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços em Processamento Multimodal com CoAVT

CoAVT integra dados de áudio, vídeo e texto pra uma compreensão melhor.

2025-08-28T12:02:50+00:00 ― 8 min ler

Processamento de Áudio e Fala Avanços na Diarização de Falantes com o Método E-SHARC

O E-SHARC melhora a identificação de falantes em vários ambientes de áudio.

2025-08-28T06:22:45+00:00 ― 7 min ler

Som MoodLoopGP: Criando Emoções em Música em Loop

Um novo sistema gera músicas feitas pra expressar felicidade e tristeza.

2025-08-28T04:45:35+00:00 ― 6 min ler

Som Navegando as Influências em Modelos de Música Generativa

Um guia pra entender a similaridade musical em modelos generativos.

2025-08-27T22:16:55+00:00 ― 10 min ler

Processamento de Áudio e Fala Técnicas para Reprodução e Avaliação de Som

Um estudo sobre síntese de som e sua avaliação em ambientes controlados.

2025-08-27T16:36:50+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços nas Técnicas de Localização de Fontes Sonoras

Um novo método melhora a precisão na localização de fontes sonoras em movimento usando arrays de microfones.

2025-08-27T01:13:45+00:00 ― 7 min ler

Processamento de Áudio e Fala Uma Nova Abordagem para Avaliação da Qualidade de Áudio com PAM

A PAM oferece um jeito novo de medir a qualidade do áudio sem precisar de gravações de referência.

2025-08-26T21:10:50+00:00 ― 8 min ler

Som Audio Flamingo: Um Novo Modelo para Entender Som

O Audio Flamingo manda bem em ouvir, conversar e se adaptar a novas tarefas de áudio.

2025-08-26T16:19:20+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando o Raciocínio Espacial Sonoro em Máquinas

Um novo modelo melhora a compreensão de áudio espacial pelas máquinas.

2025-08-26T15:30:45+00:00 ― 5 min ler

Computação e linguagem Aprimorando Sistemas de Reconhecimento de Fala em Tempo Real

Um novo modelo melhora a eficiência de reconhecimento de fala em tempo real.

2025-08-26T11:27:50+00:00 ― 7 min ler

Computação e linguagem Reavaliando o Papel dos Sons nas Relações Linguísticas

Esse estudo avalia sons versus palavras na reconstrução das árvores genealógicas das línguas.

2025-08-26T03:22:00+00:00 ― 7 min ler

Aprendizagem de máquinas Avanços na Geração de Música com IA

Novo modelo melhora a criação de música usando o feedback dos usuários.

2025-08-25T21:41:55+00:00 ― 9 min ler

Processamento de Áudio e Fala Renascido: Uma Nova Era em ASR Não Supervisionado

Reborn oferece soluções inovadoras para reconhecimento automático de fala sem dados rotulados.

2025-08-25T19:16:10+00:00 ― 7 min ler

Processamento de Áudio e Fala Transformando Sons: A Ferramenta Ouvir, Conversar e Editar

Uma nova ferramenta ajuda os usuários a modificar sons facilmente através de instruções de texto simples.

2025-08-25T17:39:00+00:00 ― 10 min ler

Computação e linguagem Avanços na Tecnologia de Linguagem

Um novo modelo junta a língua falada e escrita pra melhorar a comunicação.

2025-08-25T03:53:05+00:00 ― 6 min ler

Computação e linguagem Avanços na Tecnologia de Diálogo Falado

Um olhar sobre novos modelos para respostas faladas naturais.

2025-08-25T03:04:30+00:00 ― 7 min ler

Computação e linguagem Aprimorando o Reconhecimento de Fala com Dados Acústicos

Um novo método integra informações acústicas nos modelos de linguagem pra melhorar o reconhecimento de fala.

2025-08-25T02:15:55+00:00 ― 10 min ler

Interação Homem-Computador Transformando a Compreensão do Câncer Através da Música

Usar música pra explicar câncer pode ajudar a entender melhor e deixar a galera mais envolvida.

2025-08-25T01:27:20+00:00 ― 8 min ler

Som Entendendo as Técnicas de Localização de Fonte de Som

Aprenda como a localização do som identifica a fonte dos sons usando técnicas avançadas.

2025-08-25T00:38:45+00:00 ― 5 min ler

Som Capturando o Ritmo da Fala: Um Novo Método

Uma nova abordagem pra sintetizar vozes com precisão rítmica melhorada.

2025-08-24T23:50:10+00:00 ― 10 min ler

Computação e linguagem Melhorando a Transcrição Médica com IA

Os LLMs melhoram a precisão nas transcrições médicas, beneficiando o cuidado com os pacientes.

2025-08-24T16:32:55+00:00 ― 8 min ler

Processamento de Áudio e Fala Adaptando extração de melodia pra diversos estilos musicais

Um método pra melhorar a extração de melodia em diferentes estilos musicais com o mínimo esforço humano.

2025-08-24T15:44:20+00:00 ― 9 min ler

Processamento de Áudio e Fala Melhorando a Diarização de Falantes com Abordagens de Múltiplos Microfones

Novos métodos melhoram a detecção de atividade de voz e sobreposição na diarização de falantes.

2025-08-24T13:18:35+00:00 ― 8 min ler

Informática - Som