Uma nova abordagem para melhorar a classificação através da Perda de Distribuição de Distância Angular.
― 7 min ler
Ciência de ponta explicada de forma simples
Uma nova abordagem para melhorar a classificação através da Perda de Distribuição de Distância Angular.
― 7 min ler
Novos métodos melhoram ferramentas de comunicação para pessoas com dificuldades de fala.
― 7 min ler
Novos métodos usando modelos de linguagem melhoram a detecção de som em meio ao barulho de fundo.
― 7 min ler
O Fish-Speech melhora a tecnologia de voz pra ter uma experiência de comunicação mais natural.
― 6 min ler
EmoSphere++ permite que as máquinas expressem emoções como os humanos, melhorando as interações.
― 7 min ler
U-COTANS melhora a detecção de limites subaquáticos usando técnicas de aprendizado profundo.
― 7 min ler
A PIAST tem uma coleção única de música de piano para os pesquisadores.
― 6 min ler
Máquinas aprendem a conectar som e visuais em espaços 3D.
― 8 min ler
Como novos métodos estão transformando a identificação de falantes em gravações de áudio.
― 6 min ler
Pesquisadores usam tecnologia pra visualizar os movimentos da língua durante a fala.
― 9 min ler
Explore como o Align-SLM tá mudando a geração de fala em computadores.
― 7 min ler
Saiba como o TSE melhora o reconhecimento de fala em ambientes cheios usando dicas de texto.
― 6 min ler
Um novo sistema detecta gritos pra melhorar a segurança dos trabalhadores em canteiros de obras.
― 9 min ler
Explorando novas maneiras de reconhecer emoções na fala usando modelos avançados.
― 9 min ler
Nova abordagem melhora a avaliação da qualidade de fala ao considerar o ruído de fundo.
― 7 min ler
Um sistema novo pra misturar áudios e ajudar criadores de música a inovar de boa.
― 6 min ler
Uma olhada em como a compressão de faixa dinâmica melhora as experiências de áudio.
― 6 min ler
Assistentes de voz ajudam a identificar sinais precoces de problemas de memória em idosos.
― 8 min ler
Um sistema cria música em tempo real baseado em narrativas de jogos de interpretação de papéis de mesa.
― 8 min ler
Analisando os pontos fortes, fracos e o futuro do SLAM-ASR na reconhecimento de fala.
― 5 min ler
Um novo método pra esclarecer e visualizar imagens de campo sonoro.
― 8 min ler
Um projeto melhora o reconhecimento de fala pra língua Malasar usando recursos em Tamil.
― 5 min ler
Pesquisadores estão explorando a fala pra melhorar as avaliações de saúde mental pra esquizofrenia.
― 9 min ler
Aprenda como os músicos sincronizam seu tempo com modelos científicos.
― 6 min ler
NeKo melhora a comunicação entre máquinas corrigindo erros de fala, traduções e texto.
― 7 min ler
Descubra como o som melhora as experiências virtuais através da renderização de volume acústico.
― 9 min ler
Esse estudo usa análise de som pra identificar falhas em máquinas de forma eficaz.
― 6 min ler
Debatts ajuda os usuários a criar refutações eficazes para debates.
― 7 min ler
Um novo modelo melhora a identificação e localização de sons de forma eficaz.
― 8 min ler
AuscultaBase melhora a precisão no diagnóstico de condições de saúde usando dados de sons corporais variados.
― 4 min ler
Um novo conjunto de dados ajuda a encontrar música através de um diálogo amigável.
― 8 min ler
Juntando gravações de áudio com partituras pra praticar melhor.
― 6 min ler
AEROMamba melhora áudio de baixa qualidade pra um som rico e de alta fidelidade.
― 6 min ler
Um modelo de áudio-linguagem inovador ajuda a estudar os sons e comportamentos dos animais.
― 8 min ler
Criando um modelo de IA pra conversas naturais em mandarim taiwanês.
― 5 min ler
A Mamba melhora o reconhecimento de fala com rapidez e precisão, transformando a interação com os dispositivos.
― 5 min ler
Novo método melhora a clareza da fala usando informações visuais do ambiente.
― 6 min ler
Um olhar sobre como o som se comporta em ambientes dinâmicos.
― 6 min ler
Pesquisas mostram como as ondas cerebrais podem ajudar na comunicação silenciosa.
― 6 min ler
A pesquisa busca traduzir sinais do cérebro em vários tipos de fala.
― 7 min ler