Neue Modelle gehen das Thema Klangklassifikation mit begrenzten Trainingsdaten an.

2025-06-07T12:25:20+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Methoden zur Erkennung von Fake-Audio

Ein neuer Ansatz verbessert die Erkennung von gefälschter Audio mit vortrainierten Modellen.

2025-06-07T11:36:45+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Text-zu-Sprache-Technologie

Neue Methode verbessert die Sprachgenerierung in Qualität und Effizienz.

2025-06-07T10:48:10+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Klanglokalisierung in lauten Umgebungen

Eine Methode, die beschriftete und unbeschriftete Daten kombiniert, verbessert die Erkennung von Schallquellen.

2025-06-07T09:11:00+00:00 ― 6 min Lesedauer

Ton Die Rolle von Sound im Tischtennis-Leistung

Entdecke, wie akustische Signale Spielern im Tischtennis helfen.

2025-06-07T07:33:50+00:00 ― 7 min Lesedauer

Ton Fortschritte in der computer-generierten Orchestermusik

Ein System, das Melodie priorisiert und gleichzeitig Kontrolle über die Erzeugung von Orchestermusik bietet.

2025-06-07T06:45:15+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Feedbacksystemen zum Sprachenlernen

Eine neue Methode nutzt virtuelle Schattenbildung, um das Aussprachefeedback für Sprachlerner zu verbessern.

2025-06-07T05:56:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in binauralen Audio-Techniken

Neue Methoden verbessern die binaurale Audioqualität in herausfordernden Klangumgebungen.

2025-06-07T04:19:30+00:00 ― 9 min Lesedauer

Maschinelles Lernen Fortschritte in der Spracherkennung für Kinder

Eine neue ASR-Methode hilft der Technik, die Sprache von Kindern besser zu verstehen.

2025-06-06T20:13:40+00:00 ― 5 min Lesedauer

Ton Composer: Ein neuer Weg, Musik aus Worten zu schaffen

Der Komponist nutzt Textanweisungen, um komplexe Musikkompositionen im MIDI-Format zu erstellen.

2025-06-06T12:07:50+00:00 ― 5 min Lesedauer

Ton FruitsMusic: Eine Analyse von Songs japanischer Idol-Gruppen

Eine Ressource zum Studieren von Gesangsmustern in japanischer Idol-Musik.

2025-06-06T10:30:40+00:00 ― 7 min Lesedauer

Ton Fortschrittliche Violinensound-Synthese mit ViolinDiff

ViolinDiff verbessert den Realismus von computer-generierter Geigenmusik.

2025-06-06T09:42:05+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Unterwasser-Schallklassifikation mit Deep Learning

Die Kombination von Features verbessert die Genauigkeit der Unterwasser-Schallklassifikation.

2025-06-06T04:50:35+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der akustischen Zielerkennung unter Wasser

Transfer-Lernen verbessert die Audio-Klassifizierung für die Erkennung von Unterwassergeräuschen.

2025-06-06T04:02:00+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung V-AURA: Fortschrittliche Video-zu-Audio-Integration

Ein neues Modell erstellt Audio, das zum Video passt und verbessert so das Medienerlebnis.

2025-06-05T23:59:05+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung von ASR-Systemen mit Schlüsselwortlisten und Sprachmodellen

Eine Methode, um die automatische Spracherkennung zu verbessern, indem man Schlüsselwortlisten mit Sprachmodellen kombiniert.

2025-06-05T20:44:45+00:00 ― 5 min Lesedauer

Graphik Geräusche nachahmen: Menschen und Maschinen verbinden

Eine Studie über Stimmimitationstechniken, die Technologie nutzt, um die Kommunikation zu verbessern.

2025-06-05T19:56:10+00:00 ― 5 min Lesedauer

Rechnen und Sprache Innovative Methoden zur Spracherkennung mit begrenzten Daten

Lerne, wie man Sprachmodelle effektiv mit weniger gekennzeichneten Ressourcen trainiert.

2025-06-05T19:07:35+00:00 ― 7 min Lesedauer

Rechnen und Sprache Geschlecht in der Sprachtechnologieforschung neu bewerten

Eine Analyse der Geschlechterterminologie in der Sprachtechnologie und ihrer gesellschaftlichen Auswirkungen.

2025-06-05T15:53:15+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Erkennung von Klangereignissen mit neuem Framework

Ein neues Framework verbessert die Erkennung von überlappenden Geräuscheffekten in komplexen Audio-Umgebungen.

2025-06-05T13:27:30+00:00 ― 6 min Lesedauer

Ton Maschinelles Lernen zur Klassifizierung von Vogelgesang nutzen

Forschung zur Verbesserung der Vogelstimmenidentifikation durch Machine-Learning-Techniken.

2025-06-05T10:13:10+00:00 ― 7 min Lesedauer

Ton Fortschrittliche Klaviercover-Generierung durch AMT-Techniken

Eine neue Methode verbessert die automatische Erstellung von Klaviercovern mithilfe bestehender Musiktranskriptions-technologie.

2025-06-05T07:47:25+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Evaluierung von neuralen Audio-Codecs: Einblicke aus der Codec-SUPERB-Herausforderung

Ein Blick auf die Ergebnisse der Codec-SUPERB-Challenge und die Leistungskennzahlen der Codecs.

2025-06-05T06:58:50+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschrittliche medizinische Kommunikation mit ASR-Technologie

Das MultiMed-Projekt verbessert die automatische Spracherkennung für bessere Kommunikation im Gesundheitswesen.

2025-06-05T06:10:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Neue Methoden zur Messung der Audioqualität

Ein neuer Ansatz zur Bewertung der Audioqualität, ganz ohne saubere Referenzen.

2025-06-05T05:21:40+00:00 ― 6 min Lesedauer

Ton Umweltgeräuschklassifikation mit dem ECHO-Framework verbessern

Der ECHO-Rahmen verbessert die Genauigkeit der Klangklassifizierung mit strukturierten Labels und einem zweistufigen Lernprozess.

2025-06-05T04:33:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Kombination von Audio- und visuellen Hinweisen für deutlichere Sprache

Neues Verfahren verbessert die Sprachklarheit, indem es visuelle Informationen integriert.

2025-06-04T22:53:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Schätzung der Geräuschrichtung in lauten Umgebungen

Ein neuer Ansatz verbessert die Schätzung der Schallrichtung für sich bewegende Sprecher in schwierigen Umgebungen.

2025-06-04T19:38:40+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audio-Momenten-Wiederholungstechnologie

Audio Moment Retrieval ermöglicht es, bestimmte Momente in langen Aufnahmen genau zu finden.

2025-06-04T13:10:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Sicherheit in Social VR mit Safe Guard verbessern

Safe Guard erkennt Hassrede in Echtzeit während Sprachinteraktionen in sozialer VR.

2025-06-04T11:32:50+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei KI-Dialogsystemen: Ein neuer Ansatz

KI entwickelt sich weiter, um natürlichere Gespräche zu führen.

2025-06-04T10:44:15+00:00 ― 6 min Lesedauer

Bild- und Videoverarbeitung Neue Methode visualisiert die Bewegungen des Sprachtrakts beim Sprechen

Ein neuer Ansatz nutzt Echtzeit-MRT, um die Bewegungen bei der Sprachproduktion sichtbar zu machen.

2025-06-04T09:07:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Frühe Raumreflexionen mit der FF-PHALCOR-Methode schätzen

Eine neue Methode zur Erkennung von frühen Raumreflexionen verbessert das Audioerlebnis.

2025-06-04T07:29:55+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Bessere Sprachdatensätze für unterversorgte Sprachen erstellen

Ein Projekt, das Sprach- und Textdatensätze für Sprachen mit begrenzten Ressourcen entwickelt.

2025-06-04T06:41:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprecherverifikation mit CA-MHFA

Ein neues Framework verbessert die Spracherkennung und passt sich verschiedenen Sprachaufgaben an.

2025-06-04T05:52:45+00:00 ― 4 min Lesedauer

Ton Den Aufstieg der Deepfake-Spracherkennung angehen

Es werden neue Methoden gebraucht, um fortschrittliche Deepfake-Sprachtechnologien zu erkennen.

2025-06-04T05:04:10+00:00 ― 6 min Lesedauer

Ton Verbesserung der bioakustischen Ereigniserkennung mit neuen Strategien

Neue Methoden verbessern die Genauigkeit bei der Identifizierung von Tiergeräuschen aus begrenzten Daten.

2025-06-04T04:15:35+00:00 ― 5 min Lesedauer

Ton Fortschritte im Sounddesign für Augmented Reality

Neue Methode verbessert die virtuelle Klangintegration in AR-Umgebungen.

2025-06-04T00:12:40+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Sprachprivatsphäre mit neuen Umwandlungstechniken

Eine neue Methode zielt darauf ab, die Sprachprivatsphäre zu wahren und gleichzeitig effektive Kommunikation zu ermöglichen.

2025-06-03T23:24:05+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte in sprachlosen Sprachverarbeitungstechniken

Neue Methoden verbessern die Spracherkennung für ressourcenarme Sprachen ohne Text.

2025-06-03T18:32:35+00:00 ― 5 min Lesedauer

Computerwissenschaften - Ton