Ein neues sprachbasiertes Netzwerk überbrückt Sprachbarrieren in Notfällen.
Majid Behravan, Elham Mohammadrezaei, Mohamed Azab
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein neues sprachbasiertes Netzwerk überbrückt Sprachbarrieren in Notfällen.
Majid Behravan, Elham Mohammadrezaei, Mohamed Azab
― 6 min Lesedauer
Lern, wie virtuelle Assistenten Nutzerbefehle besser verstehen.
Ognjen, Rudovic, Pranay Dighe
― 7 min Lesedauer
MACE verbessert Audio-Beschreibungen, indem es Geräusche mit genauen Textbeschreibungen verknüpft.
Satvik Dixit, Soham Deshmukh, Bhiksha Raj
― 5 min Lesedauer
Maschinelles Lernen einsetzen, um die Reaktion des Publikums auf Song-Cover vorherzusagen.
Aris J. Aristorenas
― 7 min Lesedauer
Ein neuer Ansatz zur Verbesserung der Klassifizierung durch den Verlust der Winkelentfernungverteilung.
Antonio Almudévar, Romain Serizel, Alfonso Ortega
― 7 min Lesedauer
Neue Methoden verbessern Kommunikationsmittel für Menschen mit Sprachschwierigkeiten.
Macarious Hui, Jinda Zhang, Aanchan Mohan
― 7 min Lesedauer
Neue Methoden mit Sprachmodellen verbessern die Geräuscherkennung bei Hintergrundgeräuschen.
Han Yin, Yang Xiao, Jisheng Bai
― 6 min Lesedauer
Fish-Speech verbessert die Sprachtechnologie für ein natürlicheres Kommunikationserlebnis.
Shijia Liao, Yuxuan Wang, Tianyu Li
― 6 min Lesedauer
EmoSphere++ erlaubt Maschinen, Emotionen wie Menschen auszudrücken, was die Interaktionen verbessert.
Deok-Hyeon Cho, Hyung-Seok Oh, Seung-Bin Kim
― 7 min Lesedauer
U-COTANS verbessert die Erkennung von Unterwassergrenzen mithilfe von Deep-Learning-Techniken.
Toros Arikan, Luca M. Chackalackal, Fatima Ahsan
― 7 min Lesedauer
PIAST bietet eine einzigartige Sammlung von Klaviermusik für Forscher.
Hayeon Bang, Eunjin Choi, Megan Finch
― 5 min Lesedauer
Maschinen lernen, Geräusche und Bilder in 3D-Räumen zu verbinden.
Artem Sokolov, Swapnil Bhosale, Xiatian Zhu
― 8 min Lesedauer
Wie neue Methoden die Sprecheridentifizierung in Audioaufnahmen verändern.
Petr Pálka, Federico Landini, Dominik Klement
― 6 min Lesedauer
Forscher nutzen Technik, um Zungenbewegungen beim Sprechen sichtbar zu machen.
Sofiane Azzouz, Pierre-André Vuissoz, Yves Laprie
― 8 min Lesedauer
Entdecke, wie Align-SLM die Sprachgenerierung am Computer verändert.
Guan-Ting Lin, Prashanth Gurunath Shivakumar, Aditya Gourav
― 7 min Lesedauer
Erfahre, wie TSE die Spracherkennung in lauten Umgebungen mit Text-Hinweisen verbessert.
Ziyang Jiang, Xinyuan Qian, Jiahe Lei
― 6 min Lesedauer
Ein neues System erkennt Schreie, um die Sicherheit der Arbeiter auf Baustellen zu verbessern.
Bikalpa Gautam, Anmol Guragain, Sarthak Giri
― 8 min Lesedauer
Neue Methoden zur Erkennung von Emotionen in Sprache mit fortgeschrittenen Modellen erkunden.
Pourya Jafarzadeh, Amir Mohammad Rostami, Padideh Choobdar
― 8 min Lesedauer
Neuer Ansatz verbessert die Bewertung der Sprachqualität, indem er Hintergrundgeräusche berücksichtigt.
Subrina Sultana, Donald S. Williamson
― 6 min Lesedauer
Ein frisches System zum Mischen von Audio-Proben, um Musikschaffenden das Innovieren zu erleichtern.
Christopher Tralie, Ben Cantil
― 6 min Lesedauer
Ein Blick darauf, wie die Dynamikkompression Audioerlebnisse verbessert.
Haoran Sun, Dominique Fourer, Hichem Maaref
― 6 min Lesedauer
Sprachassistenten helfen dabei, frühe Anzeichen von Gedächtnisproblemen bei älteren Menschen zu erkennen.
Nana Lin, Youxiang Zhu, Xiaohui Liang
― 7 min Lesedauer
Ein System erstellt in Echtzeit Musik basierend auf Erzählungen von Tischrollenspielen.
Felipe Marra, Lucas N. Ferreira
― 8 min Lesedauer
Die Stärken, Schwächen und die Zukunft von SLAM-ASR in der Spracherkennung untersuchen.
Shashi Kumar, Iuliia Thorbecke, Sergio Burdisso
― 5 min Lesedauer
Eine neue Methode, um Klangfeldbilder zu klären und zu visualisieren.
Risako Tanigawa, Kenji Ishikawa, Noboru Harada
― 7 min Lesedauer
Ein Projekt verbessert die Spracherkennung für die Malasar-Sprache mit Tamil-Ressourcen.
Leena G Pillai, Kavya Manohar, Basil K Raju
― 5 min Lesedauer
Forscher untersuchen Sprache, um psychische Gesundheitsbewertungen bei Schizophrenie zu verbessern.
Gowtham Premananth, Carol Espy-Wilson
― 8 min Lesedauer
Lern, wie Musiker ihren Rhythmus mit wissenschaftlichen Modellen synchronisieren.
Hugo T. Carvalho, Min S. Li, Massimiliano di Luca
― 6 min Lesedauer
NeKo verbessert die Maschinenkommunikation, indem es Sprach-, Übersetzungs- und Textfehler behebt.
Yen-Ting Lin, Chao-Han Huck Yang, Zhehuai Chen
― 7 min Lesedauer
Entdecke, wie Sound virtuelle Erlebnisse durch akustische Volumenwiedergabe verbessert.
Zitong Lan, Chenhao Zheng, Zhiwei Zheng
― 8 min Lesedauer
Diese Studie nutzt Soundanalyse, um Maschinenfehler effektiv zu identifizieren.
Tito Spadini, Kenji Nose-Filho, Ricardo Suyama
― 6 min Lesedauer
Debatts hilft Nutzern, effektive Gegenargumente für Debatten zu formulieren.
Yiqiao Huang, Yuancheng Wang, Jiaqi Li
― 7 min Lesedauer
Ein neues Modell verbessert effektiv das Identifizieren und Lokalisieren von Geräuschen.
Jinbo Hu, Yin Cao, Ming Wu
― 7 min Lesedauer
AuscultaBase verbessert die Genauigkeit bei der Diagnose von Gesundheitszuständen, indem es verschiedene Körpergeräuschdaten nutzt.
Pingjie Wang, Zihan Zhao, Liudan Zhao
― 4 min Lesedauer
Ein neues Dataset hilft, Musik durch freundlichen Dialog zu finden.
SeungHeon Doh, Keunwoo Choi, Daeyong Kwon
― 7 min Lesedauer
Kombiniere Audioaufnahmen mit Noten für besseres Üben.
Irmak Bukey, Michael Feffer, Chris Donahue
― 6 min Lesedauer
AEROMamba verwandelt minderwertigen Audio in satten, hochauflösenden Sound.
Wallace Abreu, Luiz Wagner Pereira Biscainho
― 6 min Lesedauer
Ein bahnbrechendes Audio-Sprachmodell hilft dabei, Tiergeräusche und Verhaltensweisen zu studieren.
David Robinson, Marius Miron, Masato Hagiwara
― 7 min Lesedauer
Ein KI-Modell für natürliche Gespräche auf Taiwanesisch-Mandarin erstellen.
Chih-Kai Yang, Yu-Kuan Fu, Chen-An Li
― 5 min Lesedauer
Mamba verbessert die Spracherkennung mit Schnelligkeit und Genauigkeit und verändert die Interaktion mit Geräten.
Yoshiki Masuyama, Koichi Miyazaki, Masato Murata
― 4 min Lesedauer