Untersuchung der Leistung von automatischer Spracherkennung für taube und schwerhörige Nutzer.
Korbinian Kuhn, Verena Kersken, Benedikt Reuter
― 12 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Untersuchung der Leistung von automatischer Spracherkennung für taube und schwerhörige Nutzer.
Korbinian Kuhn, Verena Kersken, Benedikt Reuter
― 12 min Lesedauer
Ein neues Modell verwandelt einfache Texte in passende Songtexte.
Songyan Zhao, Bingxuan Li, Yufei Tian
― 6 min Lesedauer
Diese Studie analysiert, wie Diphthonge und Monophthonge sich in Produktion und Bewegung unterscheiden.
Patrycja Strycharczuk, Sam Kirkham, Emily Gorman
― 5 min Lesedauer
Neue Methode verbessert die ASR-Genauigkeit mit Sprachmodellen für bessere Transkriptionen.
Ada Defne Tur, Adel Moumen, Mirco Ravanelli
― 4 min Lesedauer
Ein neues System korrigiert Fehler bei der Sprechererkennung für klarere Gesprächsprotokolle.
Grigor Kirakosyan, Davit Karamyan
― 8 min Lesedauer
SelectTTS vereinfacht die Sprachsynthese für unbekannte Sprecher mit effektiver Rahmenauswahl.
Ismail Rasim Ulgen, Shreeram Suresh Chandra, Junchen Lu
― 6 min Lesedauer
Sprachverständlichkeit verbessern mit hybriden Filterbänken und neuronalen Netzen.
Daniel Haider, Felix Perfler, Vincent Lostanlen
― 5 min Lesedauer
AASIST3 verbessert die Erkennung von Fake-Stimmen in automatischen Sprecherverifizierungssystemen.
Kirill Borodin, Vasiliy Kudryavtsev, Dmitrii Korzh
― 6 min Lesedauer
OrthoDoc kombiniert CT-Bilder und Texte für bessere medizinische Diagnosen.
Youzhu Jin, Yichen Zhang
― 6 min Lesedauer
Neue Methode MedDet verbessert die Effizienz bei der Erkennung von Bandscheibenvorfällen in der Halswirbelsäule durch fortschrittliche Techniken.
Zeyu Zhang, Nengmin Yi, Shengbo Tan
― 8 min Lesedauer
Gelernt Methoden verbessern die Effizienz und Qualität der Bildkompression.
Yanbo Gao, Meng Fu, Shuai Li
― 5 min Lesedauer
Dieser Artikel beleuchtet die Vorteile der Dunkelfeld-Radiografie zur Beurteilung medizinischer Fremdkörper.
Lennard Kaster, Henriette Klein, Alexander W. Marka
― 4 min Lesedauer
Eine Studie darüber, wie verschiedene Beschreibungen die Machine-Learning-Modelle in der medizinischen Bildgebung beeinflussen.
Sicheng Wang, Che Liu, Rossella Arcucci
― 6 min Lesedauer
ResEmoteNet verbessert, wie Maschinen Gesichtsausdrücke für verschiedene Anwendungen lesen.
Arnab Kumar Roy, Hemant Kumar Kathania, Adhitiya Sharma
― 5 min Lesedauer
Eine Methode, die Fundus- und OCT-Bilder kombiniert, verbessert die Genauigkeit der AMD-Diagnose.
Pragya Gupta, Subhamoy Mandal, Debashree Guha
― 5 min Lesedauer
Eine neue Methode verbessert die Qualität und Effizienz der Videoerstellung.
Liuhan Chen, Zongjian Li, Bin Lin
― 6 min Lesedauer
Erforschung der Kommunikationseffizienz für IoT-Geräte in drahtlosen Netzwerken.
Asmad Bin Abdul Razzaque, Andrea Baiocchi
― 5 min Lesedauer
Neue Erkenntnisse über Diffusionsmodelle verbessern deren Effizienz und Anpassungsfähigkeit bei der Datengenerierung.
Gen Li, Yuting Wei, Yuejie Chi
― 6 min Lesedauer
Ein neuer Ansatz, um mehrere Quellen im 3D-Raum mit TDOA-Messungen zu lokalisieren.
Wenyu Zhang, Mohammad Javad Khojasteh, Florian Meyer
― 6 min Lesedauer
Ein neuer Ansatz verbessert die Identifizierung von Anfallsursachen für bessere Behandlungsoptionen.
Federico Mason, Lorenzo Ferri, Lidia Di Vito
― 7 min Lesedauer
Ein Überblick über das inverse Hindernisproblem und seine Auswirkungen auf die Bildgebung.
Vincenzo Mottola, Antonio Corbo Esposito, Luisa Faella
― 7 min Lesedauer
Die Vorteile und Herausforderungen bei der Integration von NTNs und O-RAN in 5G erkunden.
S. M. Mahdi Shahabi, Xiaonan Deng, Ahmad Qidan
― 5 min Lesedauer
Ein bahnbrechender Datensatz verbessert KI-Tools zur Diagnose von Herzerkrankungen.
Shams Nafisa Ali, Afia Zahin, Samiul Based Shuvo
― 7 min Lesedauer
Eine neue Methode verbessert die UAV-Kommunikation, indem sie die Verbindungsstatuskarten verfeinert.
Yuhang Yang, Xiaoli Xu, Yong Zeng
― 7 min Lesedauer
Maschinenlernen nutzen, um die Stabilität und Sicherheit von Drohnen unter schwierigen Bedingungen zu verbessern.
Sachithra Atapattu, Oscar De Silva, Thumeera R Wanasinghe
― 5 min Lesedauer
Entdecke, wie Cyber-Physische Systeme die Effizienz in verschiedenen Branchen verbessern.
Dimitrios Kouzapas, Christos G. Panayiotou, Demetrios G. Eliades
― 5 min Lesedauer
Ein neuer Ansatz, um mehrere Quellen im 3D-Raum mit TDOA-Messungen zu lokalisieren.
Wenyu Zhang, Mohammad Javad Khojasteh, Florian Meyer
― 6 min Lesedauer
Erforschen, wie Systeme von gemeinsamen Erfahrungen profitieren können, um die Leistung zu verbessern.
Chenchao Wang, Deyuan Meng
― 6 min Lesedauer
Ein Blick auf Sparse Mamba, eine Methode für besseren Sprachmodell-Kontrolle.
Emadeldeen Hamdan, Hongyi Pan, Ahmet Enis Cetin
― 5 min Lesedauer
Maschinelles Lernen nutzen, um seltene Ereignisse in chemischen Prozessen vorherzusagen und die Sicherheit zu erhöhen.
Vikram Sudarshan, Warren D. Seider
― 6 min Lesedauer
Ein neuer Ansatz zur effizienten Bestimmung von Stabilitätsgrenzen in dynamischen Systemen.
Karthik Chikmagalur, Bassam Bamieh
― 6 min Lesedauer
L-NODEC erkunden für bessere Stabilität in Kontrollstrategien.
Joshua Hang Sai Ip, Georgios Makrygiorgos, Ali Mesbah
― 7 min Lesedauer