Une nouvelle méthode améliore la synchronisation labiale dans les vidéos doublées pour une expérience de visionnage plus naturelle.
Lucas Goncalves, Prashant Mathur, Xing Niu
― 8 min lire
La science de pointe expliquée simplement
Une nouvelle méthode améliore la synchronisation labiale dans les vidéos doublées pour une expérience de visionnage plus naturelle.
Lucas Goncalves, Prashant Mathur, Xing Niu
― 8 min lire
Découvrez comment Whisper améliore la reconnaissance vocale dans les conversations multilingues.
Jiahui Zhao, Hao Shi, Chenrui Cui
― 6 min lire
Une nouvelle approche rend la reconnaissance sonore plus accessible et efficace.
Noriyuki Tonami, Wataru Kohno, Keisuke Imoto
― 8 min lire
Apprends comment l'anonymisation vocale protège les infos perso dans un monde dominé par la tech.
Natalia Tomashenko, Emmanuel Vincent, Marc Tommasi
― 7 min lire
Fusion des indices audio et visuels pour améliorer la reconnaissance vocale dans des environnements bruyants.
Zhaofeng Lin, Naomi Harte
― 7 min lire
La technologie d'amélioration de la parole s'adapte pour réduire le bruit et améliorer la communication.
Riccardo Miccini, Clement Laroche, Tobias Piechowiak
― 6 min lire
Une nouvelle tech combine le son et les visuels pour une meilleure détection des drones.
Zhenyuan Xiao, Yizhuo Yang, Guili Xu
― 8 min lire
Explorer des nouvelles technologies qui détectent des sons provenant de sources invisibles.
Yuhang He, Sangyun Shin, Anoop Cherian
― 6 min lire
Découvrez comment Smooth-Foley améliore la génération audio pour les vidéos.
Yaoyun Zhang, Xuenan Xu, Mengyue Wu
― 7 min lire
Une technique innovante relie les paroles et les mélodies pour créer de meilleures chansons.
Jiaxing Yu, Xinda Wu, Yunfei Xu
― 8 min lire
Améliorer la compréhension par les machines des dynamiques de tour de parole dans les dialogues humains.
Hyunbae Jeon, Frederic Guintu, Rayvant Sahni
― 10 min lire
Explorer comment la langue influence la précision de détection des DeepFake dans différentes langues.
Bartłomiej Marek, Piotr Kawa, Piotr Syga
― 7 min lire
VERSA évalue efficacement la qualité de la parole, de l'audio et de la musique.
Jiatong Shi, Hye-jin Shim, Jinchuan Tian
― 11 min lire
Découvrez comment les modèles audio-linguistiques transforment la technologie de reconnaissance sonore.
Gongyu Chen, Haomin Zhang, Chaofan Ding
― 7 min lire
De nouvelles méthodes améliorent le dialogue naturel dans la technologie de la parole.
Zhenqi Jia, Rui Liu
― 7 min lire
Découvrez comment SpeechSSM transforme la génération de discours long pour de meilleures interactions.
Se Jin Park, Julian Salazar, Aren Jansen
― 6 min lire
Découvrez comment la traduction en temps réel transforme la communication entre les langues.
Sara Papi, Peter Polak, Ondřej Bojar
― 7 min lire
Un modèle léger conçu pour séparer efficacement les discours mélangés dans des environnements bruyants.
Shaoxiang Dang, Tetsuya Matsumoto, Yoshinori Takeuchi
― 7 min lire
Des chercheurs s'attaquent au spoofing audio pour améliorer la sécurité de la reconnaissance vocale.
Xuechen Liu, Junichi Yamagishi, Md Sahidullah
― 11 min lire
Une nouvelle méthode transforme la façon dont les machines apprennent de la musique.
Julien Guinot, Elio Quinton, György Fazekas
― 8 min lire
Une nouvelle technologie transforme les murmures silencieux en communication audible pour ceux qui en ont besoin.
Neil Shah, Shirish Karande, Vineet Gandhi
― 7 min lire
De nouvelles méthodes en synthèse vocale améliorent la clarté et l'adaptabilité pour des applications variées.
Neil Shah, Ayan Kashyap, Shirish Karande
― 9 min lire
Découvre la riche tradition des chants de l'Église orthodoxe éthiopienne Tewahedo.
Mequanent Argaw Muluneh, Yan-Tsung Peng, Li Su
― 8 min lire
Découvrez comment ETTA transforme des mots en expériences audio créatives.
Sang-gil Lee, Zhifeng Kong, Arushi Goel
― 7 min lire
Une nouvelle façon de voir comment la musique influence nos émotions.
Dengming Zhang, Weitao You, Ziheng Liu
― 8 min lire
Un nouveau cadre pour créer des danses de groupe synchronisées et naturelles.
Kaixing Yang, Xulong Tang, Haoyu Wu
― 10 min lire
Nouvelle approche dans la reconnaissance des émotions se concentre sur les mouvements de la bouche plutôt que sur les sons.
Shreya G. Upadhyay, Ali N. Salman, Carlos Busso
― 7 min lire
Découvre comment Stable-TTS améliore la technologie de synthèse vocale pour une expérience plus humaine.
Wooseok Han, Minki Kang, Changhun Kim
― 9 min lire
La technologie innovante des ondes sonores offre de nouvelles perspectives sur la vitesse de marche en intérieur.
Sheng Lyu, Chenshu Wu
― 7 min lire
Les assistants audio deviennent plus malins avec AQA-K, améliorant les réponses grâce à la connaissance.
Abhirama Subramanyam Penamakuri, Kiran Chhatre, Akshat Jain
― 7 min lire
Découvre comment le texte peut se transformer en audio grâce à des modèles à la pointe de la technologie.
Chia-Yu Hung, Navonil Majumder, Zhifeng Kong
― 4 min lire