Pesquisas mostram como é importante ter um diagnóstico justo em doenças respiratórias.
― 8 min ler
Ciência de ponta explicada de forma simples
Pesquisas mostram como é importante ter um diagnóstico justo em doenças respiratórias.
― 8 min ler
O MusicLIME ajuda a explicar como a IA analisa música através do áudio e das letras.
― 7 min ler
Descubra como a Computação Quântica tá mudando a criatividade musical com o Harmonizador Quântico Variacional.
― 14 min ler
O modelo MCMamba melhora a qualidade do som em ambientes barulhentos usando informações espaciais e espectrais.
― 5 min ler
Este estudo avalia métodos de baixa latência para melhorar a qualidade do áudio em condições barulhentas.
― 8 min ler
Analisando como gestos 2D e 3D afetam a comunicação de personagens virtuais.
― 8 min ler
Um estudo sobre como melhorar sistemas de reconhecimento de voz em ambientes barulhentos.
― 7 min ler
Pesquisadores usam a fala pra identificar e monitorar várias condições de saúde.
― 10 min ler
RF-GML mede a qualidade do áudio sem precisar de um sinal de referência.
― 6 min ler
Aprenda como a equalização de ambiente melhora a experiência de áudio em vários lugares.
― 6 min ler
O StyleTTS-ZS oferece uma síntese de fala eficiente e de alta qualidade sem precisar de muito treinamento do falante.
― 6 min ler
Um novo método melhora o canto em conjunto sintetizado ao modelar as interações entre os cantores.
― 6 min ler
Um novo framework melhora o reconhecimento de fala modelando as relações sonoras de forma eficaz.
― 5 min ler
Aprenda como o ajuste de preferências alinha modelos com o feedback humano.
― 5 min ler
Novo método de mascaramento melhora a conversão de voz ao separar a identidade do falante da fonética.
― 7 min ler
Técnicas inovadoras melhoram o treinamento de modelos de música e texto com poucos recursos.
― 8 min ler
Novos métodos melhoram a marcação de áudio para estilos musicais diversos e preservação cultural.
― 8 min ler
Um conjunto de dados de sons de casa promove segurança e conforto para idosos.
― 5 min ler
O SD-Codec melhora o processamento de áudio separando os diferentes tipos de som de forma eficaz.
― 6 min ler
Este artigo fala sobre métodos para melhorar o reconhecimento de fala para sotaques.
― 6 min ler
Uma nova abordagem melhora a interpretabilidade da detecção de fala falsa.
― 5 min ler
Uma olhada no novo sistema TTS de estágio único que tá melhorando a geração de fala.
― 7 min ler
Este estudo fala sobre os desafios em modelos de linguagem áudio para línguas com poucos recursos.
― 6 min ler
Este estudo melhora os sistemas de reconhecimento de emoções para línguas menos comuns usando dados de alta qualidade.
― 7 min ler
Um modelo melhora tarefas de fala em ambientes multilíngues, enfrentando os desafios da troca de códigos.
― 6 min ler
Aprimorando a síntese de fala em línguas indianas usando unidades inter-pausais.
― 7 min ler
DeFT-Mamba melhora a separação e classificação de sons em ambientes barulhentos.
― 6 min ler
CADA-GAN melhora o desempenho dos sistemas de ASR em vários ambientes de gravação.
― 7 min ler
A EVA combina sinais de áudio e visuais pra melhorar a precisão do reconhecimento de fala.
― 5 min ler
Um novo framework simplifica o reconhecimento de fala em ambientes movimentados.
― 6 min ler
Llama-AVSR junta áudio e vídeo pra melhorar a precisão do reconhecimento de fala.
― 8 min ler
WMCodec melhora a marca d'água de áudio pra mais segurança e autenticidade.
― 6 min ler
Novos modelos enfrentam a classificação de som com dados de treinamento limitados.
― 6 min ler
Uma nova abordagem melhora a detecção de áudio falso usando modelos pré-treinados.
― 6 min ler
Novo método melhora a qualidade e a eficiência da geração de fala.
― 5 min ler
Um método que combina dados rotulados e não rotulados melhora a detecção de fontes sonoras.
― 6 min ler
Descubra como os sons ajudam os jogadores no pingue-pongue.
― 7 min ler
Um sistema que prioriza melodia enquanto oferece controle sobre a geração de música orquestral.
― 6 min ler
Um novo método usa sombreamento virtual pra melhorar o feedback de pronúncia dos aprendizes de línguas.
― 7 min ler
Novos métodos melhoram a qualidade do áudio binaural em ambientes sonoros desafiadores.
― 10 min ler