Die Verbesserung des maschinellen Verständnisses von den Dynamiken des Dialogwechsels bei Menschen.
Hyunbae Jeon, Frederic Guintu, Rayvant Sahni
― 9 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Die Verbesserung des maschinellen Verständnisses von den Dynamiken des Dialogwechsels bei Menschen.
Hyunbae Jeon, Frederic Guintu, Rayvant Sahni
― 9 min Lesedauer
Erforschen, wie Sprache die Genauigkeit der DeepFake-Erkennung in verschiedenen Sprachen beeinflusst.
Bartłomiej Marek, Piotr Kawa, Piotr Syga
― 7 min Lesedauer
VERSA bewertet Sprache, Audio und Musikqualität effektiv.
Jiatong Shi, Hye-jin Shim, Jinchuan Tian
― 9 min Lesedauer
Entdecke, wie Audio-Sprachmodelle die Sounderkennungstechnologie verändern.
Gongyu Chen, Haomin Zhang, Chaofan Ding
― 7 min Lesedauer
Neue Methoden verbessern den natürlichen Dialog in der Sprachtechnologie.
Zhenqi Jia, Rui Liu
― 6 min Lesedauer
Entdecke, wie SpeechSSM die Langzeitsprache-Generierung für bessere Interaktionen verändert.
Se Jin Park, Julian Salazar, Aren Jansen
― 5 min Lesedauer
Lerne, wie Echtzeitübersetzung die Kommunikation über Sprachen hinweg verändert.
Sara Papi, Peter Polak, Ondřej Bojar
― 6 min Lesedauer
Ein leichtgewichtiges Modell, das entwickelt wurde, um gemischte Sprache in lauten Umgebungen effektiv zu trennen.
Shaoxiang Dang, Tetsuya Matsumoto, Yoshinori Takeuchi
― 6 min Lesedauer
Forscher kümmern sich um Audio-Spoofing, um die Sicherheit der Spracherkennung zu verbessern.
Xuechen Liu, Junichi Yamagishi, Md Sahidullah
― 9 min Lesedauer
Lern, wie AV-ASR Audio und Visuals kombiniert, um die Spracherkennung zu verbessern.
Yihan Wu, Yichen Lu, Yifan Peng
― 6 min Lesedauer
Eine neue Methode verändert, wie Maschinen aus Musik lernen.
Julien Guinot, Elio Quinton, György Fazekas
― 7 min Lesedauer
Neue Technologie verwandelt stille Murmeln in hörbare Kommunikation für die Bedürftigen.
Neil Shah, Shirish Karande, Vineet Gandhi
― 6 min Lesedauer
Neue Methoden in der Sprachsynthese verbessern die Klarheit und Anpassungsfähigkeit für verschiedene Anwendungen.
Neil Shah, Ayan Kashyap, Shirish Karande
― 8 min Lesedauer
Entdecke die reiche Tradition der Gesänge der äthiopisch-orthodoxen Tewahedo-Kirche.
Mequanent Argaw Muluneh, Yan-Tsung Peng, Li Su
― 8 min Lesedauer
Ein neues Datenset hebt die Schönheit der äthiopisch-orthodoxen Gesänge hervor.
Mequanent Argaw Muluneh, Yan-Tsung Peng, Worku Abebe Degife
― 8 min Lesedauer
Neue Fortschritte helfen der Spracherkennungstechnologie, Menschen mit Sprachstörungen besser zu unterstützen.
Jimmy Tobin, Katrin Tomanek, Subhashini Venugopalan
― 6 min Lesedauer
Entdecke, wie ETTA Worte in kreative Audioerlebnisse verwandelt.
Sang-gil Lee, Zhifeng Kong, Arushi Goel
― 6 min Lesedauer
Ein neuer Blick darauf, wie Musik unsere Emotionen beeinflusst.
Dengming Zhang, Weitao You, Ziheng Liu
― 7 min Lesedauer
Ein neues Framework für die Erstellung von synchronen und natürlichen Gruppentänzen.
Kaixing Yang, Xulong Tang, Haoyu Wu
― 8 min Lesedauer
Neuer Ansatz bei der Emotionserkennung konzentriert sich auf Mundbewegungen statt auf Geräusche.
Shreya G. Upadhyay, Ali N. Salman, Carlos Busso
― 6 min Lesedauer
Entdecke, wie Stable-TTS die Text-zu-Sprache-Technologie verbessert für ein menschlicheres Erlebnis.
Wooseok Han, Minki Kang, Changhun Kim
― 7 min Lesedauer
Innovative Schallwellentechnologie bietet neue Einblicke in die Gehgeschwindigkeit drinnen.
Sheng Lyu, Chenshu Wu
― 6 min Lesedauer
Audio-Assistenten werden mit AQA-K schlauer und verbessern ihre Antworten durch Wissen.
Abhirama Subramanyam Penamakuri, Kiran Chhatre, Akshat Jain
― 7 min Lesedauer
Forscher untersuchen, wie unser Gehirn Sprache steuert und was das für die Genesung bedeutet.
Eric Easthope
― 7 min Lesedauer
Entdecke, wie Text mit modernen Modellen in Audio verwandelt werden kann.
Chia-Yu Hung, Navonil Majumder, Zhifeng Kong
― 3 min Lesedauer