Découvre comment les tokens de parole continue changent la communication avec les machines.
Ze Yuan, Yanqing Liu, Shujie Liu
― 7 min lire
La science de pointe expliquée simplement
Découvre comment les tokens de parole continue changent la communication avec les machines.
Ze Yuan, Yanqing Liu, Shujie Liu
― 7 min lire
Apprends comment le dropout adaptatif améliore l'efficacité des systèmes de reconnaissance vocale.
Yotaro Kubo, Xingyu Cai, Michiel Bacchiani
― 9 min lire
Découvrez comment l'IA transforme la musique en expériences visuelles captivantes.
Leonardo Pina, Yongmin Li
― 8 min lire
WavFusion mélange audio, texte et visuels pour mieux reconnaître les émotions.
Feng Li, Jiusong Luo, Wanjun Xia
― 7 min lire
Explore l'essor de la musique générée par des machines et la recherche de méthodes de détection.
Yupei Li, Hanqian Li, Lucia Specia
― 8 min lire
Combiner les modèles d'image avec des systèmes audio améliore l'efficacité et la performance.
Juan Yeo, Jinkwan Jang, Kyubyung Chae
― 8 min lire
Un nouveau système révolutionne la façon dont la musique s'associe au contenu vidéo.
Shanti Stewart, Gouthaman KV, Lie Lu
― 8 min lire
La technologie IA change la façon dont on communique pendant les urgences.
Danush Venkateshperumal, Rahman Abdul Rafi, Shakil Ahmed
― 7 min lire
Découvrez comment la séparation de source musicale et la transcription changent notre façon de vivre la musique.
Bradford Derby, Lucas Dunker, Samarth Galchar
― 8 min lire
Un nouveau modèle mélange musique et IA, créant des mélodies innovantes.
Shansong Liu, Atin Sakkeer Hussain, Qilong Wu
― 9 min lire
AI TrackMate donne aux producteurs des retours objectifs pour améliorer leurs compétences en musique.
Yi-Lin Jiang, Chia-Ho Hsiung, Yen-Tung Yeh
― 7 min lire
Des recherches montrent comment les sons influencent nos émotions et notre comportement.
Claudia Montero-Ramírez, Esther Rituerto-González, Carmen Peláez-Moreno
― 8 min lire
Découvre le Frechet Music Distance et son rôle dans l'évaluation de la musique générée par l'IA.
Jan Retkowski, Jakub Stępniak, Mateusz Modrzejewski
― 11 min lire
Découvrez comment l'IA peut transformer le design sonore dans les vidéos et les jeux.
Sudha Krishnamurthy
― 7 min lire
Découvrez comment CSSinger change la création musicale avec la synthèse vocale chantée en temps réel.
Jianwei Cui, Yu Gu, Shihao Chen
― 6 min lire
Un outil de reconnaissance vocale transforme facilement les maths parlées en LaTeX.
Evangelia Gkritzali, Panagiotis Kaliosis, Sofia Galanaki
― 7 min lire
Analyser la voix peut révéler des signes de dépression et permettre une intervention précoce.
Quang-Anh N. D., Manh-Hung Ha, Thai Kim Dinh
― 7 min lire
Transforme le humm et les tapotements en audio de haute qualité avec Sketch2Sound.
Hugo Flores García, Oriol Nieto, Justin Salamon
― 9 min lire
Les techniques de filigrane protègent les droits des artistes dans la génération de musique avec l'IA.
Pascal Epple, Igor Shilov, Bozhidar Stevanoski
― 9 min lire
Transformer de l'audio mono en expériences binaurales immersives avec des techniques innovantes.
Alon Levkovitch, Julian Salazar, Soroosh Mariooryad
― 9 min lire
La recherche examine comment les modèles d'amélioration de la parole gardent l'accent sur les syllabes malgré le bruit.
Rangavajjala Sankara Bharadwaj, Jhansi Mallela, Sai Harshitha Aluru
― 8 min lire
Un nouveau cadre améliore l'alignement des sons et des visuels dans les vidéos.
Kexin Li, Zongxin Yang, Yi Yang
― 8 min lire
Révolutionner la synthèse vocale avec des voix plus naturelles et une meilleure efficacité.
Haowei Lou, Helen Paik, Pari Delir Haghighi
― 7 min lire
Découvrez comment les systèmes TTS évoluent pour sonner de plus en plus humain.
Haowei Lou, Helen Paik, Wen Hu
― 9 min lire
Nouveau système qui transforme le contrôle audio grâce à des descriptions textuelles détaillées.
Sonal Kumar, Prem Seetharaman, Justin Salamon
― 9 min lire
Combiner vidéo et audio pour mieux détecter les émotions.
Antonio Fernandez, Suzan Awinat
― 11 min lire
YingSound révolutionne la production vidéo en automatisant la création d'effets sonores.
Zihao Chen, Haomin Zhang, Xinhan Di
― 8 min lire
Les chercheurs utilisent des échos pour marquer l'audio, garantissant que les droits des créateurs sont protégés.
Christopher J. Tralie, Matt Amery, Benjamin Douglas
― 10 min lire
Les robots peuvent maintenant naviguer dans des environnements compliqués en utilisant le son grâce à SonicBoom.
Moonyoung Lee, Uksang Yoo, Jean Oh
― 7 min lire
Le modèle MASV améliore la vérification vocale, garantissant sécurité et efficacité.
Yang Liu, Li Wan, Yiteng Huang
― 6 min lire
Explorer l'impact des outils d'IA sur la création musicale et les perspectives des compositeurs.
Eleanor Row, György Fazekas
― 9 min lire
La technologie de reconnaissance vocale améliore la reconnaissance des chiffres, surtout dans des environnements bruyants.
Ali Nasr-Esfahani, Mehdi Bekrani, Roozbeh Rajabi
― 6 min lire
Améliorer les performances de l'ASR multilingue pour le japonais grâce à un réglage fin ciblé.
Mark Bajo, Haruka Fukukawa, Ryuji Morita
― 7 min lire
Explorer comment les BCI décodent la parole imaginée pour améliorer la communication.
Byung-Kwan Ko, Jun-Young Kim, Seo-Hyun Lee
― 8 min lire
SonicMesh utilise le son pour améliorer la modélisation 3D du corps humain à partir d'images.
Xiaoxuan Liang, Wuyang Zhang, Hong Zhou
― 6 min lire
Découvrez les dernières avancées en reconnaissance vocale en temps réel et comment elles améliorent nos échanges.
Rongxiang Wang, Zhiming Xu, Felix Xiaozhu Lin
― 6 min lire
Des chercheurs améliorent le traitement de la parole en utilisant Libri2Vox et des techniques de données synthétiques.
Yun Liu, Xuechen Liu, Xiaoxiao Miao
― 7 min lire
Découvre comment le TTS émotionnel change la communication avec les machines, les rendant plus proches.
Sho Inoue, Kun Zhou, Shuai Wang
― 7 min lire
Apprends comment les sons des insectes peuvent aider à surveiller les écosystèmes et gérer les nuisibles.
Yinxuan Wang, Sudip Vhaduri
― 8 min lire
De nouvelles méthodes aident les machines à trouver des infos clés à partir de contenus parlés.
Yueqian Lin, Yuzhe Fu, Jingyang Zhang
― 6 min lire