Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

RSS

Ton Audiovisuelles Lernen mit synchronisierten Filmen verbessern

Forschung nutzt synchronisierte Filme, um die Verbindung zwischen Sehen und Hören im maschinellen Lernen zu verbessern.

2025-11-22T07:58:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Eine neue Methode, um Sprachlaute über die Zeit zu analysieren

Vorstellung von Absement, einer Methode zur dynamischen Messung von Sprachlauten über die Zeit.

2025-11-22T03:07:20+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Methoden zur Gesangstranskription

Ein neuer Ansatz, um Gesangstöne und Texte genau mit Technologie zu transkribieren.

2025-11-22T01:30:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Neues Modell verbessert die Emotionserkennung in Gesprächen

Das hierarchische Cross Attention Modell verbessert das emotionale Verständnis in verschiedenen Kommunikationsformen.

2025-11-21T19:01:30+00:00 ― 5 min Lesedauer

Ton Fortschritte in Musikabrufsystemen

Neue Methoden verbessern das Taggen und Abrufen von Musik mit weniger menschlichem Aufwand.

2025-11-21T06:52:45+00:00 ― 6 min Lesedauer

Ton Analyse der Signalgrössen in Sprachtrennmodellen

Diese Studie untersucht, wie die Länge des Signals die Sprachtrennung beeinflusst.

2025-11-21T04:27:00+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Reden vor emotionaler Kommunikation schützen

Die Forschung beschäftigt sich damit, Sprache zu anonymisieren und gleichzeitig den emotionalen Inhalt beizubehalten.

2025-11-21T02:01:15+00:00 ― 5 min Lesedauer

Robotik Mit Drohnengeräuschen Distanzen messen

Neue Methode schätzt Distanzen anhand von Drohnenmotorengeräuschen.

2025-11-21T00:24:05+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Emotionserkennung mit Audio-Visuellen Daten vorantreiben

Diese Forschung stellt ein neues Modell vor, um Emotionen besser anhand von Audio- und Visualdaten zu erkennen.

2025-11-20T21:09:45+00:00 ― 5 min Lesedauer

Rechnen und Sprache Maschinen und Geräusche: Kann KI akustische Beschreibungen verstehen?

Diese Studie untersucht, wie KI Geräusche bewertet und beschreibt im Vergleich zu Menschen.

2025-11-20T19:32:35+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Phonetische vs. grafemische Eingaben in TTS-Systemen

Die Studie vergleicht phonetic und grafemische Eingaben in TTS-Systemen für Französisch.

2025-11-20T16:18:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audio-Codierungstechnologie

Neue Methoden verbessern die Audioqualität und reduzieren gleichzeitig den Datenverbrauch.

2025-11-20T14:41:05+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachverbesserungstechnologie

FSB-LSTM verbessert die Sprachklarheit in lauten Umgebungen mit niedriger Latenz und geringer Komplexität.

2025-11-20T12:15:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Optimierung der Keyword-Erkennung für bessere Energieeffizienz

Forschung zeigt Wege, um Keyword-Spotting-Systeme zu verbessern und gleichzeitig den Stromverbrauch zu senken.

2025-11-20T11:26:45+00:00 ― 5 min Lesedauer

Rechnen und Sprache Prak vorstellen: Ein Tool für phonetiche Ausrichtung

Prak vereinfacht die phonetische Ausrichtung für die tschechische Sprachforschung.

2025-11-20T10:38:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Neues Audio-Datensatz für Forschungszwecke zur Dereverberation

Ein umfassendes Audio-Dataset zielt darauf ab, Dereverberationsmethoden zu verbessern, um klareren Sound zu erzielen.

2025-11-20T05:46:40+00:00 ― 5 min Lesedauer

Geophysik Fortschritte in der seismischen Überwachung mit der DAS-N2N-Technik

DAS-N2N nutzt maschinelles Lernen, um die seismische Datenerfassung durch Rauschreduzierung zu verbessern.

2025-11-20T00:13:15+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei einheitlichen Spracherkennungsmodellen

Neue Techniken verbessern die Genauigkeit bei Streaming- und Nicht-Streaming-Spracherkennung.

2025-11-19T23:18:00+00:00 ― 5 min Lesedauer

Ton Fortschritte in der symbolischen Musikgenerierung mit Subword-Tokenisierung

Diese Studie zeigt, wie Subword-Tokenisierung die Qualität und Effizienz der Musikgenerierung verbessert.

2025-11-19T20:03:40+00:00 ― 6 min Lesedauer

Kryptographie und Sicherheit Gegnerische Beispiele in der Spracherkennung: Risiken und Methoden

Untersuchung, wie angreifende Attacken Spracherkennungssysteme beeinflussen und Methoden zur Verbesserung der Übertragbarkeit.

2025-11-19T17:37:55+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Quellen-Trennungstechniken

Moderne Methoden zum Isolieren von gemischten Signalen in der Audio- und Bildverarbeitung erkunden.

2025-11-19T16:10:08+00:00 ― 6 min Lesedauer

Ton Fortschritte beim Erkennen von voreingenommenen Wörtern in der Sprache

CB-Conformer verbessert die Spracherkennung für voreingenommene Wörter mit innovativen Techniken.

2025-11-19T11:57:50+00:00 ― 5 min Lesedauer

Kryptographie und Sicherheit Sprachassistenten: Bequemlichkeit und Risiken ausbalancieren

Erkunde die Sicherheits- und Datenschutzprobleme von Sprachassistenten-Technologie.

2025-11-19T09:32:05+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei der Spracherkennung für Schweizerdeutsche Dialekte

Die Verbesserung von Spracherkennungsmodellen für Schweizerdeutsch mit fortschrittlichen Techniken und Datensätzen.

2025-11-19T04:40:35+00:00 ― 5 min Lesedauer

Ton Einblicke in auditive verbale Halluzinationen durch mobile Technologie

Studie untersucht, wie mobile Daten helfen, auditive verbale Halluzinationen zu verstehen.

2025-11-19T03:52:00+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Automatische Spracherkennung vor audio adversarialen Angriffen schützen

Eine neue Methode verbessert die Abwehr gegen audio-adversarielle Angriffe in Spracherkennungssystemen.

2025-11-18T22:11:55+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Keyword-Erkennungstechnologie

Die Forschung konzentriert sich auf effiziente Modelle zum Erkennen von Schlüsselwörtern mithilfe von schlanken Netzwerken.

2025-11-18T19:46:10+00:00 ― 5 min Lesedauer

Ton CLaMP: Ein neuer Ansatz zur Musiksuche

CLaMP kombiniert Musik und Sprache für automatische Musikklassifizierung und -suche.

2025-11-18T15:43:15+00:00 ― 6 min Lesedauer

Ton Die Messung von Schönheit in der Musik: Ein neuer Ansatz

Eine mathematische Methode zur Bewertung der Schönheit von Musikaufführungen.

2025-11-18T07:37:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung von Emotionen mit vortrainierten Modellen

Entdecke, wie vortrainierte Modelle die Spracherkennung von Emotionen verbessern.

2025-11-18T06:48:50+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audio-Textur-Morphing-Technologie

Eine neue Methode verbessert das Audio-Texturmorphing für kreatives Sounddesign.

2025-11-17T21:05:50+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Audioerstellung durch Textbeschreibungen voranbringen

Eine neue Methode erzeugt Audio aus Text mit modernen Modellen.

2025-11-17T15:25:45+00:00 ― 5 min Lesedauer

Ton DCASE 2023: Fortschritte bei der automatischen Foley-Sound-Synthese

Ein Wettbewerb zur Verbesserung der automatisierten Foley-Sounderstellung für Multimedia.

2025-11-17T14:37:10+00:00 ― 5 min Lesedauer

Ton Musikklassifikation mit Playlists voranbringen

Diese Studie untersucht, wie man Playlists nutzen kann, um die Musikklassifikation und Ähnlichkeit zu verbessern.

2025-11-17T10:34:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Schallortung mit halbüberwachtem Lernen

Eine neue Methode verbessert die Tonerkennung mit beschrifteten und unbeschrifteten Daten.

2025-11-17T08:08:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Sprachverbesserungstechniken

Eine neue Methode kombiniert saubere Sprache und Geräuschinformationen für bessere Klarheit.

2025-11-16T13:31:05+00:00 ― 5 min Lesedauer

Ton Fortschritte bei der automatischen Spracherkennung mit Deep Transfer Learning

Wie Deep Transfer Learning die Technologien zur automatischen Spracherkennung verändert.

2025-11-15T23:45:10+00:00 ― 6 min Lesedauer

Ton Eine neue Methode zur Trennung von Stimmen in Musik

Innovative Technologie trennt musikalische Stimmen mit fortschrittlichen Tracking-Techniken.

2025-11-15T11:36:25+00:00 ― 6 min Lesedauer

Maschinelles Lernen Neue Methode zur Überwachung von Kühen in lauten Umgebungen

Bauern können jetzt das Verhalten von Kühen genau verfolgen, trotz Hintergrundgeräuschen.

2025-11-15T09:59:15+00:00 ― 7 min Lesedauer

Ton Fortschritte in der automatischen Musiktranskription mit synthetischen Daten

Neue Methoden in der Musiktranskription zeigen vielversprechende Ergebnisse mit synthetisierten Audiodaten.

2025-11-15T04:19:10+00:00 ― 6 min Lesedauer