Uma nova tecnologia simplifica a equalização de gravações de áudio.
― 5 min ler
Ciência de ponta explicada de forma simples
Uma nova tecnologia simplifica a equalização de gravações de áudio.
― 5 min ler
Este artigo fala sobre métodos para melhorar o ASR para línguas com dados limitados.
― 7 min ler
Um novo método simplifica a correspondência de sons de sintetizadores para músicos.
― 6 min ler
Um novo método melhora a clareza nas gravações de guitarra elétrica, lidando com os efeitos de distorção.
― 8 min ler
Uma nova ferramenta melhora como os usuários editam faixas de música de forma eficiente.
― 6 min ler
Estudando as vocalizações de marmosets usando métodos de classificação avançados e análise de áudio.
― 7 min ler
Um estudo sobre como melhorar a precisão da transcrição com um design de prompt melhor.
― 6 min ler
Uma estrutura pra melhorar a análise de sentimento de IA em conversas de saúde.
― 7 min ler
Novos métodos melhoram o realismo nas animações para mídias e assistentes virtuais.
― 6 min ler
Combinar palavras de ativação e reconhecimento de voz aumenta a segurança na tecnologia de voz.
― 6 min ler
Uma nova abordagem melhora os sistemas SER usando descrições do ambiente ruidoso.
― 7 min ler
Um novo modelo tem como objetivo melhorar a qualidade da tradução de fala através de sistemas integrados.
― 6 min ler
Explora a importância crescente da edição de áudio para criadores de conteúdo.
― 6 min ler
Novas técnicas melhoram a geração de voz sintética com dados mínimos.
― 6 min ler
Uma nova ferramenta analisa os codas das baleias esperma pra entender melhor as interações sociais delas.
― 7 min ler
Novos métodos ajudam a estudar e proteger os peixes-boi ameaçados usando monitoramento sonoro subaquático.
― 6 min ler
Um novo modelo melhora a conexão entre rostos e vozes, especialmente em ambientes barulhentos.
― 6 min ler
Um estudo melhora a estimativa da frequência cardíaca e a detecção de murmúrios usando gravações.
― 6 min ler
Pesquisas mostram como a música influencia a atividade cerebral usando inteligência de organoides.
― 10 min ler
Este estudo avalia as habilidades de raciocínio de modelos de áudio-linguagem com uma nova tarefa.
― 9 min ler
Novos métodos melhoram sistemas de fala para línguas sub-representadas.
― 6 min ler
Combinar TTS e dados reais melhora de forma eficaz os sistemas de reconhecimento de voz.
― 5 min ler
Melhorando a qualidade do áudio em dispositivos através de técnicas de expansão de largura de banda.
― 7 min ler
Novo método melhora a conversão de fala silenciosa em áudio compreensível.
― 6 min ler
Um método que melhora o reconhecimento de som nas máquinas.
― 6 min ler
Um novo método melhora a separação de vozes em ambientes barulhentos com vários falantes.
― 6 min ler
Este estudo apresenta um método pra avaliar o significado dos sinais sonoros.
― 7 min ler
O modelo FUTGA melhora a compreensão da música através de descrições detalhadas e específicas do tempo.
― 6 min ler
Uma abordagem nova pra estimar características sonoras em ambientes desafiadores usando deep learning.
― 6 min ler
Um novo método de música melhora a expressão emocional através da consideração das notas.
― 6 min ler
A pesquisa combina aprimoramento de voz e aprendizado por transferência para melhorar os sistemas de anti-enganção.
― 9 min ler
Novos métodos melhoram a capacidade da IA de criar música estruturada.
― 7 min ler
O Wavespace oferece ferramentas inovadoras para criar e controlar som de um jeito melhor.
― 7 min ler
Um novo sistema melhora o reconhecimento de comandos de voz apesar do barulho de fundo.
― 6 min ler
Novas estratégias visam melhorar conjuntos de dados sintéticos para uma transcrição de bateria mais precisa.
― 8 min ler
Novos métodos buscam melhorar o reconhecimento da fala sussurrada em sistemas automáticos.
― 7 min ler
Modelos de deep learning analisam gravações de voz pra identificar insuficiência respiratória e estimar os níveis de oxigênio.
― 8 min ler
O MMTrail combina descrições visuais e sonoras para melhorar os modelos de linguagem em vídeo.
― 5 min ler
Esse método melhora a geração de música ao separar os aspectos emocionais em valência e excitação.
― 6 min ler
A PiCoGen oferece um método inovador pra gerar covers de piano sem precisar de dados pareados.
― 6 min ler