Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

RSS

Audio- und Sprachverarbeitung Verbesserung der Inklusivität in Remote-Meetings mit KI

Ein neues System soll die Teilnahme an Online-Meetings mit Hilfe von Maschinenlernen verbessern.

2025-11-27T01:20:30+00:00 ― 6 min Lesedauer

Neueste Artikel

Rechnen und Sprache Neue Methode zur Bewertung von Spracherkennungssystemen

2025-11-26T22:06:10+00:00 ― 5 min Lesedauer

Rechnen und Sprache Sprachanonymisierung in COVID-19-Diagnosen: Privatsphäre und Genauigkeit im Gleichgewicht halten

2025-11-26T01:03:00+00:00 ― 7 min Lesedauer

Mensch-Computer-Interaktion Revolutionierung des Schlagzeugspielens: Das Air Drumming System

2025-11-25T21:48:40+00:00 ― 5 min Lesedauer

Mensch-Computer-Interaktion Wie KI das Musik-Mixing verändert

2025-11-24T20:42:35+00:00 ― 8 min Lesedauer

Ton Blasen im Wasser: Eine neue Klangfrontier

2025-11-24T18:42:00+00:00 ― 7 min Lesedauer

Neueste Artikel

Ton Fortschritte bei automatisierten Audio-Untertiteln

Ein Blick auf neue Methoden, die Audio-Untertitelung für bessere Barrierefreiheit verbessern.

2025-11-24T10:11:00+00:00 ― 5 min Lesedauer

Computer und Gesellschaft Sprachbiometrie: Datensätze, Vorurteile und Datenschutzprobleme

Die Analyse von Datensätzen, die in der Sprachbiometrie verwendet werden, zeigt erhebliche Vorurteile und Datenschutzprobleme auf.

2025-11-24T06:56:40+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprecherverifikation mit Margin-Mixup

Eine neue Methode verbessert die Sprecherverifikationssysteme bei überlappenden Stimmen.

2025-11-24T01:16:35+00:00 ― 6 min Lesedauer

Maschinelles Lernen Neue Techniken zur Sprachverarbeitung

Innovative Methoden für effektive Sprachsegmentdarstellung in Verarbeitung Aufgaben.

2025-11-23T14:45:00+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Sprachsynthese mit Pausen-Vorhersage verbessern

Verbesserung von TTS-Systemen für besseres Geschichtenerzählen durch effektives Setzen von Pausen.

2025-11-23T09:53:30+00:00 ― 4 min Lesedauer

Ton AffectMachine-Klassisch: Eine neue Art, emotionale Musik zu erstellen

AffectMachine-Classical erzeugt in Echtzeit klassische Musik, um bei der Emotionsbewältigung zu helfen.

2025-11-23T06:39:10+00:00 ― 7 min Lesedauer

Ton Einfluss von TTS-Systemen auf die Sprach-zu-Sprach-Übersetzung

Diese Studie untersucht, wie verschiedene TTS-Systeme die Leistung von S2ST-Modellen verbessern.

2025-11-23T02:36:15+00:00 ― 6 min Lesedauer

Rechnen und Sprache Modellierung von Backchannels: Ein Schritt zu natürlichen Gesprächen

Forschung zeigt, wie Backchannels die Maschinenkommunikation verbessern.

2025-11-23T01:47:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audiomanipulation mit neuronalen Netzwerken

Forschung zeigt neue Wege, wie man Sound mit neuronalen Netzen für die Musikproduktion manipulieren kann.

2025-11-23T00:10:30+00:00 ― 5 min Lesedauer

Ton Audiovisuelles Lernen mit synchronisierten Filmen verbessern

Forschung nutzt synchronisierte Filme, um die Verbindung zwischen Sehen und Hören im maschinellen Lernen zu verbessern.

2025-11-22T07:58:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Eine neue Methode, um Sprachlaute über die Zeit zu analysieren

Vorstellung von Absement, einer Methode zur dynamischen Messung von Sprachlauten über die Zeit.

2025-11-22T03:07:20+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Methoden zur Gesangstranskription

Ein neuer Ansatz, um Gesangstöne und Texte genau mit Technologie zu transkribieren.

2025-11-22T01:30:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Neues Modell verbessert die Emotionserkennung in Gesprächen

Das hierarchische Cross Attention Modell verbessert das emotionale Verständnis in verschiedenen Kommunikationsformen.

2025-11-21T19:01:30+00:00 ― 5 min Lesedauer

Ton Fortschritte in Musikabrufsystemen

Neue Methoden verbessern das Taggen und Abrufen von Musik mit weniger menschlichem Aufwand.

2025-11-21T06:52:45+00:00 ― 6 min Lesedauer

Ton Analyse der Signalgrössen in Sprachtrennmodellen

Diese Studie untersucht, wie die Länge des Signals die Sprachtrennung beeinflusst.

2025-11-21T04:27:00+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Reden vor emotionaler Kommunikation schützen

Die Forschung beschäftigt sich damit, Sprache zu anonymisieren und gleichzeitig den emotionalen Inhalt beizubehalten.

2025-11-21T02:01:15+00:00 ― 5 min Lesedauer

Robotik Mit Drohnengeräuschen Distanzen messen

Neue Methode schätzt Distanzen anhand von Drohnenmotorengeräuschen.

2025-11-21T00:24:05+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Emotionserkennung mit Audio-Visuellen Daten vorantreiben

Diese Forschung stellt ein neues Modell vor, um Emotionen besser anhand von Audio- und Visualdaten zu erkennen.

2025-11-20T21:09:45+00:00 ― 5 min Lesedauer

Rechnen und Sprache Maschinen und Geräusche: Kann KI akustische Beschreibungen verstehen?

Diese Studie untersucht, wie KI Geräusche bewertet und beschreibt im Vergleich zu Menschen.

2025-11-20T19:32:35+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Phonetische vs. grafemische Eingaben in TTS-Systemen

Die Studie vergleicht phonetic und grafemische Eingaben in TTS-Systemen für Französisch.

2025-11-20T16:18:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audio-Codierungstechnologie

Neue Methoden verbessern die Audioqualität und reduzieren gleichzeitig den Datenverbrauch.

2025-11-20T14:41:05+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachverbesserungstechnologie

FSB-LSTM verbessert die Sprachklarheit in lauten Umgebungen mit niedriger Latenz und geringer Komplexität.

2025-11-20T12:15:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Optimierung der Keyword-Erkennung für bessere Energieeffizienz

Forschung zeigt Wege, um Keyword-Spotting-Systeme zu verbessern und gleichzeitig den Stromverbrauch zu senken.

2025-11-20T11:26:45+00:00 ― 5 min Lesedauer

Rechnen und Sprache Prak vorstellen: Ein Tool für phonetiche Ausrichtung

Prak vereinfacht die phonetische Ausrichtung für die tschechische Sprachforschung.

2025-11-20T10:38:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Neues Audio-Datensatz für Forschungszwecke zur Dereverberation

Ein umfassendes Audio-Dataset zielt darauf ab, Dereverberationsmethoden zu verbessern, um klareren Sound zu erzielen.

2025-11-20T05:46:40+00:00 ― 5 min Lesedauer

Geophysik Fortschritte in der seismischen Überwachung mit der DAS-N2N-Technik

DAS-N2N nutzt maschinelles Lernen, um die seismische Datenerfassung durch Rauschreduzierung zu verbessern.

2025-11-20T00:13:15+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei einheitlichen Spracherkennungsmodellen

Neue Techniken verbessern die Genauigkeit bei Streaming- und Nicht-Streaming-Spracherkennung.

2025-11-19T23:18:00+00:00 ― 5 min Lesedauer

Ton Fortschritte in der symbolischen Musikgenerierung mit Subword-Tokenisierung

Diese Studie zeigt, wie Subword-Tokenisierung die Qualität und Effizienz der Musikgenerierung verbessert.

2025-11-19T20:03:40+00:00 ― 6 min Lesedauer

Kryptographie und Sicherheit Gegnerische Beispiele in der Spracherkennung: Risiken und Methoden

Untersuchung, wie angreifende Attacken Spracherkennungssysteme beeinflussen und Methoden zur Verbesserung der Übertragbarkeit.

2025-11-19T17:37:55+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Quellen-Trennungstechniken

Moderne Methoden zum Isolieren von gemischten Signalen in der Audio- und Bildverarbeitung erkunden.

2025-11-19T16:10:08+00:00 ― 6 min Lesedauer

Ton Fortschritte beim Erkennen von voreingenommenen Wörtern in der Sprache

CB-Conformer verbessert die Spracherkennung für voreingenommene Wörter mit innovativen Techniken.

2025-11-19T11:57:50+00:00 ― 5 min Lesedauer

Kryptographie und Sicherheit Sprachassistenten: Bequemlichkeit und Risiken ausbalancieren

Erkunde die Sicherheits- und Datenschutzprobleme von Sprachassistenten-Technologie.

2025-11-19T09:32:05+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei der Spracherkennung für Schweizerdeutsche Dialekte

Die Verbesserung von Spracherkennungsmodellen für Schweizerdeutsch mit fortschrittlichen Techniken und Datensätzen.

2025-11-19T04:40:35+00:00 ― 5 min Lesedauer

Ton Einblicke in auditive verbale Halluzinationen durch mobile Technologie

Studie untersucht, wie mobile Daten helfen, auditive verbale Halluzinationen zu verstehen.

2025-11-19T03:52:00+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Automatische Spracherkennung vor audio adversarialen Angriffen schützen

Eine neue Methode verbessert die Abwehr gegen audio-adversarielle Angriffe in Spracherkennungssystemen.

2025-11-18T22:11:55+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Keyword-Erkennungstechnologie

Die Forschung konzentriert sich auf effiziente Modelle zum Erkennen von Schlüsselwörtern mithilfe von schlanken Netzwerken.

2025-11-18T19:46:10+00:00 ― 5 min Lesedauer

Ton CLaMP: Ein neuer Ansatz zur Musiksuche

CLaMP kombiniert Musik und Sprache für automatische Musikklassifizierung und -suche.

2025-11-18T15:43:15+00:00 ― 6 min Lesedauer

Ton Die Messung von Schönheit in der Musik: Ein neuer Ansatz

Eine mathematische Methode zur Bewertung der Schönheit von Musikaufführungen.

2025-11-18T07:37:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung von Emotionen mit vortrainierten Modellen

Entdecke, wie vortrainierte Modelle die Spracherkennung von Emotionen verbessern.

2025-11-18T06:48:50+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audio-Textur-Morphing-Technologie

Eine neue Methode verbessert das Audio-Texturmorphing für kreatives Sounddesign.

2025-11-17T21:05:50+00:00 ― 5 min Lesedauer