Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

Audio- und Sprachverarbeitung Neue Erkenntnisse in der Sprachtechnologie

Ein frischer Blick auf Fortschritte in den Methoden und Anwendungen der gesprochenen Sprachwissenschaft.

2025-09-19T01:27:35+00:00 ― 6 min Lesedauer

Informationsbeschaffung Herausforderungen beim Lernen aus Musikvideos

Diese Studie untersucht die Schwierigkeiten bei der Verwendung von kontrastivem Lernen für das Verständnis von Musikvideos.

2025-09-18T17:21:45+00:00 ― 6 min Lesedauer

Rechnen und Sprache Sprache mit Sprachmodellen verbinden: Die BLSP-Methode

Ein neuer Ansatz verbessert die Integration von Sprache mit Sprachmodellen.

2025-09-18T15:44:35+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Vorhersage von Sprachbewegungen bei Dysarthrie

Selbstüberwachtes Lernen nutzen, um Vorhersagen von Sprechbewegungen bei Dysarthrie zu verbessern.

2025-09-18T12:30:15+00:00 ― 6 min Lesedauer

Ton Die Verbindung zwischen Tanz und Musik mit MDSC bewerten

Ein neues Mass, um die Übereinstimmung von Tanzstilen mit Musik zu bewerten.

2025-09-18T11:41:40+00:00 ― 7 min Lesedauer

Rechnen und Sprache Die Rolle von vortrainierten Sprachmodellen in TTS

Untersuchen, wie vortrainierte Sprachmodelle die Qualität von Text-zu-Sprache verbessern.

2025-09-17T20:18:35+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung BWSNet: Fortschritt bei der Bewertung der Audio-Wahrnehmung

Ein neues Modell bewertet die Audio-Wahrnehmung durch menschliches Feedback mit Best-Worst-Skalierung.

2025-09-17T13:49:55+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Musikquellen-Trennungstechniken

Neue Methoden verbessern die Klarheit der Audio-Komponenten in Musikstücken.

2025-09-17T08:09:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der audiovisuellen Trennung mit BandIt

BandIt verbessert die Trennung von Audioquellen mit innovativen Deep-Learning-Techniken.

2025-09-17T06:32:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Personalisierung von Sprachgefühls-Erkennungssystemen

Die Anpassung der Emotionserkennungstechnologie verbessert die Genauigkeit für verschiedene Sprecher.

2025-09-17T04:55:30+00:00 ― 6 min Lesedauer

Ton Stimmenidentitätsmorphing: Eine Bedrohung für die Sicherheit

Eine Studie zeigt ernsthafte Bedrohungen bei der Sprach- erkennung mit Morph-Proben.

2025-09-17T04:06:55+00:00 ― 5 min Lesedauer

Ton Batik spielt Mozart: Ein umfassendes Klavier-Dataset

Ein detaillierter Datensatz, der Mozarts Sonaten mit Klavieraufführungen und Expertenkommentaren kombiniert.

2025-09-17T03:18:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Audioqualität für virtuelle Meetings verbessern

Ein neues Ohrhörer-Design verbessert die Klangklarheit mit Knochenleitungs-Technologie.

2025-09-17T02:29:45+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Tonhöhenbestimmung mit selbstüberwachtem Lernen

Ein neues leichtgewichtiges Modell verbessert die Tonhöhenschätzung mithilfe von selbstüberwachten Lerntechniken.

2025-09-17T00:04:00+00:00 ― 7 min Lesedauer

Ton Fortschritte in der Analyse von Musikstrukturen

Ein neuer Ansatz zur Verbesserung der Identifizierung und Analyse von Musiksegmenten.

2025-09-16T23:15:25+00:00 ― 5 min Lesedauer

Ton Falsche Songs aufspüren: Ein neuer Datensatz-Ansatz

Neue Methoden entwickelt, um gefälschte Songs zu identifizieren, angesichts wachsender Bedenken.

2025-09-16T22:26:50+00:00 ― 5 min Lesedauer

Rechnen und Sprache Spracherkennung mit Cleancoder verbessern

Cleancoder verbessert ASR-Systeme, indem es Hintergrundgeräusche reduziert, um das Verständnis der Sprache klarer zu machen.

2025-09-16T21:38:15+00:00 ― 4 min Lesedauer

Computer Vision und Mustererkennung RADIO: Ein neuer Ansatz für Quasselstrippen

RADIO erstellt realistische sprechende Gesichter nur mit einem Referenzbild.

2025-09-16T16:46:45+00:00 ― 6 min Lesedauer

Rechnen und Sprache RoDia: Ein neuer Datensatz zur Identifizierung rumänischer Dialekte

RoDia liefert wichtige Audioproben zur Identifizierung rumänischer Dialekte.

2025-09-16T15:58:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Die Rolle von nonverbalen Signalen in der Kommunikation

Erschliessen, wie Gesten und Mimik unser Verständnis von gesprochener Sprache verbessern.

2025-09-16T08:40:55+00:00 ― 8 min Lesedauer

Mensch-Computer-Interaktion Die Kunst und Wissenschaft des Musikmixens

Ein Blick auf das Mischen von Musik, wo technisches Können auf künstlerische Vision trifft.

2025-09-16T07:03:45+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Erkennung und Lokalisierung von Schallereignissen

Neue Methoden zur Geräuscherkennung und -lokalisierung mit synthetischen Daten erforschen.

2025-09-16T05:26:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Klangsimulationssystem für Musiker

Ein neues System hilft Musikern, Sound auf einer virtuellen Bühne zu erleben.

2025-09-16T03:00:50+00:00 ― 7 min Lesedauer

Ton Fortschritte bei der Erkennung von teilweise gefälschtem Audio

Neue Methode verbessert die Erkennung von gefälschten Audio-Segmenten in Aufnahmen.

2025-09-16T01:23:40+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Musiktechnologie: Rhythmus und Harmonie trennen

Computer lernen, Rhythmus und Harmonie in Musik für kreative Anwendungen zu trennen.

2025-09-15T23:46:30+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung MuLanTTS: Eine neue Grenze im Text-zu-Sprache

Microsofts MuLanTTS bietet natürliche und ausdrucksstarke Text-zu-Sprache-Funktionen für Französisch.

2025-09-15T22:57:55+00:00 ― 5 min Lesedauer

Ton Fortschritte in der akustischen Verkehrüberwachungstechnologie

Neue Datensätze und Methoden verbessern die Fahrzeugklassifizierung für ein besseres Verkehrsmanagement.

2025-09-15T13:14:55+00:00 ― 6 min Lesedauer

Ton Fortschritte bei automatischen Spracherkennungssystemen

Neue Methoden verbessern die Genauigkeit und Geschwindigkeit in der Spracherkennungstechnologie.

2025-09-15T06:46:15+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Foley-Sound-Synthese mit Machine Learning

Ein neuer Synthesizer verbessert die Erzeugung von realistischen Soundeffekten für Medien.

2025-09-15T05:57:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Vertrauensschätzung in der automatischen Spracherkennung

Ein neuer Ansatz verbessert die Vertrauensschätzung in ASR-Systemen für bessere Genauigkeit.

2025-09-15T03:14:28+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprachsynthesetechnologie

Einführung eines Rahmens für natürlichere und ausdrucksvollere Sprachsynthese.

2025-09-15T01:06:10+00:00 ― 6 min Lesedauer

Ton Musikgenres mit Technologie klassifizieren

Lern, wie Technologie dabei hilft, Musikgenres effizient zu kategorisieren.

2025-09-14T21:51:50+00:00 ― 6 min Lesedauer

Ton Neues Modell verbessert die Bewertung der Fischnahrungsaufnahme

Ein einheitlicher Ansatz zur Bewertung der Fischfütterung mit Audio- und Videodaten.

2025-09-14T21:03:15+00:00 ― 5 min Lesedauer

Ton Fortschritte in der emotionalen Talking-Head-Technologie

Eine neue Methode verbessert die Erstellung von emotional ausdrucksvollen Talking-Head-Videos.

2025-09-14T15:23:10+00:00 ― 7 min Lesedauer

Maschinelles Lernen Herausforderungen bei der Verwendung von Convnets für die Design von Audio-Filterbänken

Diese Studie untersucht Probleme bei der Verwendung von ConvNets zur Erstellung von Audio-Filterbänken.

2025-09-14T14:34:35+00:00 ― 5 min Lesedauer

Ton Fortschritte in Audio- und Sprachmodellen

Das CLAP-Modell verbindet Audio- und Textverarbeitung für verschiedene Anwendungen.

2025-09-14T13:46:00+00:00 ― 4 min Lesedauer

Rechnen und Sprache Fortschritte im Selbstüberwachten Lernen für französische Sprachtechnologien

Ein Projekt zielt darauf ab, die Verarbeitung von französischer Sprache mit selbstüberwachtem Lernen zu verbessern.

2025-09-14T12:57:25+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der automatischen Prosodie-Annotation

Neue Methoden verbessern, wie Maschinen Sprachrhythmus und Emotionen erkennen.

2025-09-14T12:08:50+00:00 ― 7 min Lesedauer

Ton Neue Methode zur Schallabschätzung in gestreuten Umgebungen

Ein neuer Ansatz verbessert die Schallabschätzung in Räumen mit streuenden Objekten.

2025-09-14T06:28:45+00:00 ― 6 min Lesedauer

Ton Die Auswirkungen von Unentscheidbarkeit auf die Musikproduktion

Untersucht, wie Unentscheidbarkeit die Musikkomposition und -produktion heute beeinflusst.

2025-09-14T05:40:10+00:00 ― 5 min Lesedauer