Eine neue Methode nutzt virtuelle Schattenbildung, um das Aussprachefeedback für Sprachlerner zu verbessern.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Eine neue Methode nutzt virtuelle Schattenbildung, um das Aussprachefeedback für Sprachlerner zu verbessern.
― 6 min Lesedauer
Neue Methoden verbessern die binaurale Audioqualität in herausfordernden Klangumgebungen.
― 9 min Lesedauer
Eine neue ASR-Methode hilft der Technik, die Sprache von Kindern besser zu verstehen.
― 5 min Lesedauer
Der Komponist nutzt Textanweisungen, um komplexe Musikkompositionen im MIDI-Format zu erstellen.
― 5 min Lesedauer
Eine Ressource zum Studieren von Gesangsmustern in japanischer Idol-Musik.
― 7 min Lesedauer
ViolinDiff verbessert den Realismus von computer-generierter Geigenmusik.
― 5 min Lesedauer
Die Kombination von Features verbessert die Genauigkeit der Unterwasser-Schallklassifikation.
― 6 min Lesedauer
Transfer-Lernen verbessert die Audio-Klassifizierung für die Erkennung von Unterwassergeräuschen.
― 6 min Lesedauer
Ein neues Modell erstellt Audio, das zum Video passt und verbessert so das Medienerlebnis.
― 5 min Lesedauer
Eine Methode, um die automatische Spracherkennung zu verbessern, indem man Schlüsselwortlisten mit Sprachmodellen kombiniert.
― 5 min Lesedauer
Eine Studie über Stimmimitationstechniken, die Technologie nutzt, um die Kommunikation zu verbessern.
― 5 min Lesedauer
Lerne, wie man Sprachmodelle effektiv mit weniger gekennzeichneten Ressourcen trainiert.
― 7 min Lesedauer
Eine Analyse der Geschlechterterminologie in der Sprachtechnologie und ihrer gesellschaftlichen Auswirkungen.
― 7 min Lesedauer
Ein neues Framework verbessert die Erkennung von überlappenden Geräuscheffekten in komplexen Audio-Umgebungen.
― 6 min Lesedauer
Forschung zur Verbesserung der Vogelstimmenidentifikation durch Machine-Learning-Techniken.
― 7 min Lesedauer
Eine neue Methode verbessert die automatische Erstellung von Klaviercovern mithilfe bestehender Musiktranskriptions-technologie.
― 6 min Lesedauer
Ein Blick auf die Ergebnisse der Codec-SUPERB-Challenge und die Leistungskennzahlen der Codecs.
― 5 min Lesedauer
Das MultiMed-Projekt verbessert die automatische Spracherkennung für bessere Kommunikation im Gesundheitswesen.
― 6 min Lesedauer
Ein neuer Ansatz zur Bewertung der Audioqualität, ganz ohne saubere Referenzen.
― 6 min Lesedauer
Der ECHO-Rahmen verbessert die Genauigkeit der Klangklassifizierung mit strukturierten Labels und einem zweistufigen Lernprozess.
― 5 min Lesedauer
Neues Verfahren verbessert die Sprachklarheit, indem es visuelle Informationen integriert.
― 5 min Lesedauer
Ein neuer Ansatz verbessert die Schätzung der Schallrichtung für sich bewegende Sprecher in schwierigen Umgebungen.
― 8 min Lesedauer
Audio Moment Retrieval ermöglicht es, bestimmte Momente in langen Aufnahmen genau zu finden.
― 5 min Lesedauer
Safe Guard erkennt Hassrede in Echtzeit während Sprachinteraktionen in sozialer VR.
― 6 min Lesedauer
KI entwickelt sich weiter, um natürlichere Gespräche zu führen.
― 6 min Lesedauer
Ein neuer Ansatz nutzt Echtzeit-MRT, um die Bewegungen bei der Sprachproduktion sichtbar zu machen.
― 6 min Lesedauer
Eine neue Methode zur Erkennung von frühen Raumreflexionen verbessert das Audioerlebnis.
― 7 min Lesedauer
Ein Projekt, das Sprach- und Textdatensätze für Sprachen mit begrenzten Ressourcen entwickelt.
― 5 min Lesedauer
Ein neues Framework verbessert die Spracherkennung und passt sich verschiedenen Sprachaufgaben an.
― 4 min Lesedauer
Es werden neue Methoden gebraucht, um fortschrittliche Deepfake-Sprachtechnologien zu erkennen.
― 6 min Lesedauer
Neue Methoden verbessern die Genauigkeit bei der Identifizierung von Tiergeräuschen aus begrenzten Daten.
― 5 min Lesedauer
Neue Methode verbessert die virtuelle Klangintegration in AR-Umgebungen.
― 6 min Lesedauer
Eine neue Methode zielt darauf ab, die Sprachprivatsphäre zu wahren und gleichzeitig effektive Kommunikation zu ermöglichen.
― 5 min Lesedauer
Neue Methoden verbessern die Spracherkennung für ressourcenarme Sprachen ohne Text.
― 5 min Lesedauer
Neue Methoden verbessern die Genauigkeit in Spracherkennungssystemen durch phoneticisches Verständnis.
― 6 min Lesedauer
Dieses Framework verbessert Echtzeit-Animationen, indem es Sprache und Gesten nahtlos synchronisiert.
― 5 min Lesedauer
Neue akustische Merkmale verbessern die Leistung von ASR-Systemen in lauten Umgebungen.
― 5 min Lesedauer
Eine neue Verlustfunktion verbessert die Audioqualität, indem sie Phase und Magnitude ausrichtet.
― 6 min Lesedauer
Ein neues TTS-Modell bringt emotionale Tiefe in computer-generierte Sprache.
― 6 min Lesedauer
Bewertung von Spracherkennungsmodellen für Autismus-Diagnosesitzungen.
― 6 min Lesedauer