Ein Blick darauf, wie XLS-R Modelle die Audioqualität in Online-Meetings verbessern.

2025-09-22T01:31:30+00:00 ― 6 min Lesedauer

Ton Audio-Tagging mit dem CED-Framework verbessern

Eine neue Methode verbessert die Audio-Tagging-Leistung und Effizienz.

2025-09-22T00:42:55+00:00 ― 5 min Lesedauer

Ton Neue Studie zur Erkennung von KI-generierter Sprache

Forschung hebt Methoden zur Echtzeit-Erkennung von gefälschten Audios, die von KI erstellt wurden, hervor.

2025-09-21T19:02:50+00:00 ― 6 min Lesedauer

Ton Whombat: Ein neues Tool für bioakustische Forschung

Whombat vereinfacht die Annotation von Tonaufnahmen für die Wildtierforschung.

2025-09-21T18:14:15+00:00 ― 5 min Lesedauer

Ton Fortschritte bei Sprachverbesserungstechniken

Neue Strategien verbessern die Sprachverständlichkeit in lauten Umgebungen für eine bessere Erkennung.

2025-09-21T17:25:40+00:00 ― 6 min Lesedauer

Multimedia Emotionen in Bildern mit Musiksuche verknüpfen

Ein neues System verbindet emotionale Bilder mit Musik für eine bessere Entdeckung.

2025-09-21T16:37:05+00:00 ― 6 min Lesedauer

Ton Die Musikqualität bei alltäglichen Aufnahmen verbessern

Ein neues System verbessert Audioaufnahmen für ein besseres Hörerlebnis.

2025-09-21T15:48:30+00:00 ― 6 min Lesedauer

Ton Bioakustik mit aktiven Lerntechniken verbessern

Ein neuer Ansatz reduziert die Datenbeschriftung und verbessert gleichzeitig die Genauigkeit der Audio-Klassifizierung.

2025-09-21T14:11:20+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Text-to-Speech-Technologie für natürliche Sprache

Ein neues System verbessert die Sprachqualität und Ausdruckskraft bei der Absatzsynthese.

2025-09-21T11:45:35+00:00 ― 5 min Lesedauer

Ton Die Qualität von KI-generierter Musik bewerten

Entdecke Methoden zur Bewertung der Qualität von KI-erstellter Musik durch subjektive und objektive Beurteilung.

2025-09-21T10:08:25+00:00 ― 5 min Lesedauer

Ton Neue Erkenntnisse über die Zungenbewegung beim Sprechen

Die Forschung konzentriert sich auf Zungenbewegungen, um Sprachtherapie und Sprachenlernen zu unterstützen.

2025-09-21T04:28:20+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Genderauswirkungen auf stimmbiometrische Systeme

Diese Studie untersucht, wie Geschlecht die Nützlichkeit, Privatsphäre und Fairness von Sprachbiometrie beeinflusst.

2025-09-20T19:33:55+00:00 ― 7 min Lesedauer

Ton Die Verbesserung der Sprachsynthese mit Pruning-Techniken

Neue Schnittmethoden verbessern die Leistung von Zero-Shot Multi-Speaker Text-to-Speech-Modellen.

2025-09-20T15:31:00+00:00 ― 7 min Lesedauer

Rechnen und Sprache Emotionen in Notfallgesprächen verstehen

Forschung zur Emotionserkennung in Notrufinteraktionen liefert wichtige Erkenntnisse.

2025-09-20T14:42:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im selbstüberwachten Lernen für Spracherkennung

Neue Methoden zur Auswahl von Sprachdaten minimieren das Labeln und verbessern gleichzeitig die Erkennungsgenauigkeit.

2025-09-20T13:53:50+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Spracherkennungs-Emotion mit Zeit-Frequenz-Transformer

Eine neue Methode verbessert die Emotionserkennung in der Sprache, indem sie Zeit und Frequenz analysiert.

2025-09-20T12:16:40+00:00 ― 5 min Lesedauer

Quantenphysik Quanten Technologie trifft Musikproduktion

Entdecke, wie Quantenwerkzeuge die Musikproduktion für Künstler verändern.

2025-09-20T08:57:42+00:00 ― 5 min Lesedauer

Ton Die Verbesserung der Spracherkennung für Stotterer

Eine Methode, um ASR-Systeme für Nutzer mit Stottern zu verbessern.

2025-09-20T06:36:35+00:00 ― 5 min Lesedauer

Ton Zugangsprobleme im Million Song Dataset

Herausforderungen beim Zugriff auf Audiodaten behindern Forschungsgelegenheiten.

2025-09-20T00:07:55+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprachisolierungstechnologie

Neue Methoden verbessern die Klarheit in lauten Umgebungen durch fortschrittliche Klangverarbeitung.

2025-09-19T22:30:45+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der französischen Sprachsynthesetechnologie

Ein neu entwickeltes System erzeugt realistische französische Sprache für einen Wettbewerb.

2025-09-19T21:42:10+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Technologie zur Erkennung von Schlüsselwörtern

Neue Methoden verbessern die Effizienz und Genauigkeit in Spracherkennungssystemen.

2025-09-19T17:39:15+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte im Sprachmodellieren

Neue Methoden verbessern die Sprachverarbeitung und -erzeugung in Sprachmodellen.

2025-09-19T16:02:05+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Geräuschunterdrückungstechnologie

Neue Techniken verbessern die Audio-Klarheit in lauten Umgebungen.

2025-09-19T15:13:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Few-Shot Keyword Spotting mit Lesesprechdaten

Neue Methoden verbessern die Schlüsselworterkennung mit verfügbaren Lesesprechdaten.

2025-09-19T13:36:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sound-Extraktionstechnologie

Ein Blick auf regionsspezifische Methoden zur Klangextraktion für klareren Sound.

2025-09-19T07:56:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Formanten-Tracking für Sprachverarbeitung

Neue Ein-Schritt-Methoden verbessern die Genauigkeit bei der Formantenverfolgung für Sprachlaute.

2025-09-19T02:16:10+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Neue Erkenntnisse in der Sprachtechnologie

Ein frischer Blick auf Fortschritte in den Methoden und Anwendungen der gesprochenen Sprachwissenschaft.

2025-09-19T01:27:35+00:00 ― 6 min Lesedauer

Informationsbeschaffung Herausforderungen beim Lernen aus Musikvideos

Diese Studie untersucht die Schwierigkeiten bei der Verwendung von kontrastivem Lernen für das Verständnis von Musikvideos.

2025-09-18T17:21:45+00:00 ― 6 min Lesedauer

Rechnen und Sprache Sprache mit Sprachmodellen verbinden: Die BLSP-Methode

Ein neuer Ansatz verbessert die Integration von Sprache mit Sprachmodellen.

2025-09-18T15:44:35+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Vorhersage von Sprachbewegungen bei Dysarthrie

Selbstüberwachtes Lernen nutzen, um Vorhersagen von Sprechbewegungen bei Dysarthrie zu verbessern.

2025-09-18T12:30:15+00:00 ― 6 min Lesedauer

Ton Die Verbindung zwischen Tanz und Musik mit MDSC bewerten

Ein neues Mass, um die Übereinstimmung von Tanzstilen mit Musik zu bewerten.

2025-09-18T11:41:40+00:00 ― 7 min Lesedauer

Rechnen und Sprache Die Rolle von vortrainierten Sprachmodellen in TTS

Untersuchen, wie vortrainierte Sprachmodelle die Qualität von Text-zu-Sprache verbessern.

2025-09-17T20:18:35+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung BWSNet: Fortschritt bei der Bewertung der Audio-Wahrnehmung

Ein neues Modell bewertet die Audio-Wahrnehmung durch menschliches Feedback mit Best-Worst-Skalierung.

2025-09-17T13:49:55+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Musikquellen-Trennungstechniken

Neue Methoden verbessern die Klarheit der Audio-Komponenten in Musikstücken.

2025-09-17T08:09:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der audiovisuellen Trennung mit BandIt

BandIt verbessert die Trennung von Audioquellen mit innovativen Deep-Learning-Techniken.

2025-09-17T06:32:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Personalisierung von Sprachgefühls-Erkennungssystemen

Die Anpassung der Emotionserkennungstechnologie verbessert die Genauigkeit für verschiedene Sprecher.

2025-09-17T04:55:30+00:00 ― 6 min Lesedauer

Ton Stimmenidentitätsmorphing: Eine Bedrohung für die Sicherheit

Eine Studie zeigt ernsthafte Bedrohungen bei der Sprach- erkennung mit Morph-Proben.

2025-09-17T04:06:55+00:00 ― 5 min Lesedauer

Ton Batik spielt Mozart: Ein umfassendes Klavier-Dataset

Ein detaillierter Datensatz, der Mozarts Sonaten mit Klavieraufführungen und Expertenkommentaren kombiniert.

2025-09-17T03:18:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Tonhöhenbestimmung mit selbstüberwachtem Lernen

Ein neues leichtgewichtiges Modell verbessert die Tonhöhenschätzung mithilfe von selbstüberwachten Lerntechniken.

2025-09-17T00:04:00+00:00 ― 7 min Lesedauer

Computerwissenschaften - Ton