Este estudo analisa como a IA avalia e descreve sons em comparação com os humanos.
― 7 min ler
Ciência de ponta explicada de forma simples
Este estudo analisa como a IA avalia e descreve sons em comparação com os humanos.
― 7 min ler
Artigos mais recentes
Artigos mais recentes
Um conjunto de dados de áudio abrangente tem como objetivo melhorar os métodos de desreverberação para um som mais claro.
― 6 min ler
DAS-N2N usa aprendizado de máquina pra melhorar a coleta de dados sísmicos reduzindo o barulho.
― 8 min ler
Novas técnicas melhoram a precisão no reconhecimento de fala em tempo real e fora dele.
― 6 min ler
Este estudo destaca como a tokenização de subpalavras melhora a qualidade e a eficiência da geração de música.
― 7 min ler
Analisando como ataques adversariais impactam sistemas de reconhecimento de fala e métodos pra melhorar a transferibilidade.
― 7 min ler
Explorando métodos modernos pra isolar sinais misturados em áudio e processamento de imagem.
― 6 min ler
CB-Conformer melhora o reconhecimento de fala para palavras tendenciosas com técnicas inovadoras.
― 6 min ler
Explore os desafios de segurança e privacidade da tecnologia de assistentes de voz.
― 7 min ler
Melhorando modelos de reconhecimento de fala para o suíço-alemão usando técnicas avançadas e conjuntos de dados.
― 6 min ler
Estudo explora como dados móveis ajudam a entender alucinações auditivas verbais.
― 9 min ler
Um novo método melhora as defesas contra ataques adversariais de áudio em sistemas de reconhecimento de fala.
― 7 min ler
A pesquisa foca em modelos eficientes para reconhecimento de palavras-chave usando redes ajustáveis.
― 5 min ler
CLaMP combina música e linguagem pra classificação e busca automática de músicas.
― 7 min ler
Um método matemático pra avaliar a beleza das performances musicais.
― 5 min ler
Descubra como modelos pré-treinados melhoram a tecnologia de reconhecimento de emoções na fala.
― 8 min ler
Um novo método melhora a transformação de textura de áudio para design sonoro criativo.
― 6 min ler
Um novo método gera áudio a partir de texto usando modelos modernos.
― 6 min ler
Uma competição pra melhorar a criação automática de sons Foley pra multimídia.
― 6 min ler
Este estudo explora como usar playlists pra melhorar a classificação e similaridade de músicas.
― 5 min ler
Um novo método melhora a detecção de som usando dados rotulados e não rotulados.
― 7 min ler
Um novo método combina fala limpa e informação de ruído pra ter mais clareza.
― 6 min ler
Como o Aprendizado de Transferência Profundo transforma as tecnologias de Reconhecimento Automático de Fala.
― 7 min ler
Tecnologia inovadora separa vozes musicais usando técnicas avançadas de rastreamento.
― 7 min ler
Agricultores agora conseguem acompanhar o comportamento das vacas com precisão, mesmo com o barulho de fundo.
― 7 min ler
Novos métodos de transcrição musical mostram potencial com dados de áudio sintetizado.
― 7 min ler
Um grande conjunto de dados de choros de bebês ajuda a entender a comunicação e a saúde dos pequenos.
― 6 min ler
Um novo método melhora os sistemas de reconhecimento de palavras-chave em condições com poucos recursos.
― 6 min ler
Um novo sistema melhora as previsões de trajetória de voo usando instruções faladas em tempo real.
― 4 min ler
Uma nova abordagem melhora a legendagem de áudio gerando frases mais claras e variadas.
― 5 min ler
LORIS gera músicas de alta qualidade que se encaixam perfeitamente com os movimentos do vídeo.
― 7 min ler
Estudo mostra que CNNs conseguem criar combinações de palavras a partir de dados de fala bruta.
― 8 min ler
A PLiX usa aprendizado de poucos exemplos pra melhorar o reconhecimento de voz em várias línguas.
― 9 min ler
Esse artigo fala sobre como melhorar a detecção de sequências sonoras no reconhecimento de áudio.
― 6 min ler
Estudo revela como a clareza do áudio afeta a análise da aquisição de linguagem em bebês.
― 6 min ler
Uma ferramenta melhora sistemas de posicionamento interno baseado em som através de simulação eficiente.
― 6 min ler
Uma nova abordagem melhora a compreensão da linguagem falada usando um processamento de áudio eficiente.
― 7 min ler
Este artigo apresenta um método pra melhorar CNNs removendo filtros desnecessários.
― 5 min ler
Uma nova abordagem melhora o reconhecimento de fala em tempo real ao equilibrar velocidade e precisão.
― 8 min ler
O X-LLM integra imagens, vídeos e fala no processamento de linguagem.
― 6 min ler
Um novo método melhora a detecção de emoções na fala usando técnicas de autoatenção.
― 6 min ler