Engenharia Eletrotécnica e Ciência dos Sistemas - Processamento de Áudio e Fala

RSS

Som Geração de Música por IA Guiada por Melodia

Um novo modelo melhora a criação de música usando melodias e descrições de texto.

2025-05-29T20:30:48+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços em Modelos de Linguagem de Fala Sem Precisar de Muitos Dados de Treinamento

Novo método para modelos de linguagem falada reduz a necessidade de dados extensivos.

2025-05-29T17:50:26+00:00 ― 7 min ler

Som Mudando Vozes: O Processo de Conversão de Voz

Aprenda como funciona a conversão de voz e suas aplicações incríveis.

2025-05-29T13:49:53+00:00 ― 5 min ler

Multimédia Avaliação da Qualidade da Mídia com CCI

Descubra como o CCI melhora as avaliações de qualidade em multimídia.

2025-05-29T12:29:42+00:00 ― 7 min ler

Multimédia A Nova Era da Detecção de Mentiras

Pesquisadores juntam sinais de áudio e visuais pra detectar mentiras com mais precisão.

2025-05-29T11:09:31+00:00 ― 7 min ler

Interação Homem-Computador Sistema de Comunicação Inovador para Resposta a Desastres

Uma nova rede baseada em voz preenche lacunas linguísticas em emergências.

2025-05-29T09:49:20+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Detecção de Fala Direcionada por Dispositivos

Saiba como assistentes virtuais entendem melhor os comandos dos usuários.

2025-05-29T05:48:47+00:00 ― 7 min ler

Som Revolucionando a Legenda de Áudio com o MACE

MACE melhora a legendagem de áudio conectando sons a descrições textuais precisas.

2025-05-28T17:47:08+00:00 ― 5 min ler

Som Prevendo o Sucesso de Covers de Música com Aprendizado de Máquina

Usando aprendizado de máquina pra prever a reação da galera a covers de músicas.

2025-05-28T15:06:46+00:00 ― 7 min ler

Som Melhorando a Classificação de Áudio com a Perda ADD

Uma nova abordagem para melhorar a classificação através da Perda de Distribuição de Distância Angular.

2025-05-28T13:46:35+00:00 ― 7 min ler

Computação e linguagem Avanços no Reconhecimento de Fala para Pessoas com Deficiências

Novos métodos melhoram ferramentas de comunicação para pessoas com dificuldades de fala.

2025-05-28T11:06:13+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando a Detecção de Som em Ambientes Barulhentos

Novos métodos usando modelos de linguagem melhoram a detecção de som em meio ao barulho de fundo.

2025-05-27T03:01:49+00:00 ― 7 min ler

Som Discurso-Peixe: Uma Nova Era em Texto-para-Fala

O Fish-Speech melhora a tecnologia de voz pra ter uma experiência de comunicação mais natural.

2025-05-27T01:41:38+00:00 ― 6 min ler

Som EmoSphere++: Uma Nova Era em Máquinas Emocionais

EmoSphere++ permite que as máquinas expressem emoções como os humanos, melhorando as interações.

2025-05-26T05:38:53+00:00 ― 7 min ler

Som Novo Método para Estimativa de Limites Subaquáticos

U-COTANS melhora a detecção de limites subaquáticos usando técnicas de aprendizado profundo.

2025-05-26T02:58:31+00:00 ― 7 min ler

Som Apresentando o PIAST: Um Novo Conjunto de Dados para Pesquisa em Música de Piano

A PIAST tem uma coleção única de música de piano para os pesquisadores.

2025-05-26T01:38:20+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando a tecnologia com segmentação audiovisual 3D

Máquinas aprendem a conectar som e visuais em espaços 3D.

2025-05-25T21:37:47+00:00 ― 8 min ler

Processamento de Áudio e Fala A Evolução da Diarização de Falantes

Como novos métodos estão transformando a identificação de falantes em gravações de áudio.

2025-05-25T18:57:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Rastreando Movimentos da Língua: Uma Nova Perspectiva sobre a Fala

Pesquisadores usam tecnologia pra visualizar os movimentos da língua durante a fala.

2025-05-25T16:17:03+00:00 ― 9 min ler

Computação e linguagem Avanços em Modelos de Linguagem de Fala

Explore como o Align-SLM tá mudando a geração de fala em computadores.

2025-05-25T12:16:30+00:00 ― 7 min ler

Som Extração de Falante Alvo: Melhorando a Clareza em Ambientes Barulhentos

Saiba como o TSE melhora o reconhecimento de fala em ambientes cheios usando dicas de texto.

2025-05-25T00:14:51+00:00 ― 6 min ler

Som Sistema de áudio inovador melhora a segurança em canteiros de obra

Um novo sistema detecta gritos pra melhorar a segurança dos trabalhadores em canteiros de obras.

2025-05-24T22:54:40+00:00 ― 9 min ler

Som Avanços na tecnologia de reconhecimento de emoção em palestrantes

Explorando novas maneiras de reconhecer emoções na fala usando modelos avançados.

2025-05-24T20:14:18+00:00 ― 9 min ler

Processamento de Áudio e Fala Melhorando a Avaliação da Qualidade da Fala com Consciência do Ruído

Nova abordagem melhora a avaliação da qualidade de fala ao considerar o ruído de fundo.

2025-05-24T12:13:12+00:00 ― 7 min ler

Som O Concatenador: Uma Nova Maneira de Criar Música

Um sistema novo pra misturar áudios e ajudar criadores de música a inovar de boa.

2025-05-24T05:32:17+00:00 ― 6 min ler

Som Compressão de Faixa Dinâmica: Melhorando a Qualidade do Som

Uma olhada em como a compressão de faixa dinâmica melhora as experiências de áudio.

2025-05-24T04:12:06+00:00 ― 6 min ler

Processamento de Áudio e Fala Usando Assistentes de Voz pra Detectar Comprometimento Cognitivo Leve

Assistentes de voz ajudam a identificar sinais precoces de problemas de memória em idosos.

2025-05-24T01:31:44+00:00 ― 8 min ler

Som Geração de Música Dinâmica para RPGs de Mesa

Um sistema cria música em tempo real baseado em narrativas de jogos de interpretação de papéis de mesa.

2025-05-23T16:10:27+00:00 ― 8 min ler

Computação e linguagem SLAM-ASR: Um Olhar sobre o Potencial do Reconhecimento de Fala

Analisando os pontos fortes, fracos e o futuro do SLAM-ASR na reconhecimento de fala.

2025-05-23T14:50:16+00:00 ― 5 min ler

Processamento de Sinal Desembaraçando o Som: O Método SoundSil-DS

Um novo método pra esclarecer e visualizar imagens de campo sonoro.

2025-05-23T13:48:54+00:00 ― 8 min ler

Computação e linguagem Inovando o Reconhecimento de Fala para a Língua Malasar

Um projeto melhora o reconhecimento de fala pra língua Malasar usando recursos em Tamil.

2025-05-23T02:48:37+00:00 ― 5 min ler

Processamento de Áudio e Fala Usando Análise de Fala pra Entender a Esquizofrenia

Pesquisadores estão explorando a fala pra melhorar as avaliações de saúde mental pra esquizofrenia.

2025-05-23T00:08:15+00:00 ― 9 min ler

Processamento de Áudio e Fala A Ciência da Sincronização Musical

Aprenda como os músicos sincronizam seu tempo com modelos científicos.

2025-05-22T21:27:53+00:00 ― 6 min ler

Computação e linguagem NeKo: O Futuro da Correção de Erros

NeKo melhora a comunicação entre máquinas corrigindo erros de fala, traduções e texto.

2025-05-22T13:26:47+00:00 ― 7 min ler

Som Renderização de Volume Acústico: Um Salto na Realidade do Som

Descubra como o som melhora as experiências virtuais através da renderização de volume acústico.

2025-05-21T22:44:46+00:00 ― 9 min ler

Aprendizagem de máquinas Ouvindo Máquinas: Uma Nova Abordagem de Diagnóstico

Esse estudo usa análise de som pra identificar falhas em máquinas de forma eficaz.

2025-05-21T21:24:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Debatts: Uma Nova Ferramenta pra Debates Melhores

Debatts ajuda os usuários a criar refutações eficazes para debates.

2025-05-21T13:23:29+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Localização e Detecção de Eventos Sonoros

Um novo modelo melhora a identificação e localização de sons de forma eficaz.

2025-05-21T08:02:45+00:00 ― 8 min ler

Som AuscultaBase: Transformando Diagnósticos Sonoros do Corpo

AuscultaBase melhora a precisão no diagnóstico de condições de saúde usando dados de sons corporais variados.

2025-05-20T22:41:28+00:00 ― 4 min ler

Som Criando um Sistema de Recuperação de Música por Conversa

Um novo conjunto de dados ajuda a encontrar música através de um diálogo amigável.

2025-05-20T18:40:55+00:00 ― 8 min ler