Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

RSS

Audio- und Sprachverarbeitung Fortschritte in der Sprachemotionstransformationstechnologie

Ein neuer Ansatz, um Emotionen in der Sprache mitten im echten Lärm zu verändern.

2025-10-28T23:21:40+00:00 ― 7 min Lesedauer

Ton Neue Methode zur Verbesserung der Erkennung von Sprachpronunciation

Diese Studie stellt ein neues System vor, um Aussprachefehler bei Sprachlernern zu erkennen.

2025-10-28T21:44:30+00:00 ― 6 min Lesedauer

Ton Ein neuer Ansatz zur Musikumgestaltung

Das Q A System nutzt selbstüberwachtes Lernen für innovative Musikneuordnungen.

2025-10-28T20:07:20+00:00 ― 6 min Lesedauer

Ton Verbesserung der ausdrucksvollen Sprachsynthese mit TVC-GMM

Eine neue Methode verbessert die Qualität von Text-zu-Sprache und den emotionalen Ausdruck.

2025-10-28T18:30:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Sprachklarheit mit audiovisuellen Techniken verbessern

Forscher kombinieren Audio- und Visualdaten, um das Sprachverständnis an lauten Orten zu verbessern.

2025-10-28T17:41:35+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Aktive Geräuschkontrolle: Unerwünschten Lärm reduzieren

Entdecke, wie die aktive Geräuschkontrolle unsere Klangwahrnehmung verändert.

2025-10-28T16:53:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung mit kleineren Modellen

Techniken, um die Modellgrösse zu verringern und gleichzeitig die Leistung zu erhalten, kommen auf.

2025-10-28T15:15:50+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei digitalen Phaseneffekten

Neues Modell ahmt analoge Phaseneffekte mit verbesserten Lerntechniken nach.

2025-10-28T12:50:05+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschrittliche mehrsprachige Spracherkennung mit DistilXLSR

Ein neues Modell reduziert die Grösse und verbessert die mehrsprachige Spracherkennung.

2025-10-28T11:12:55+00:00 ― 6 min Lesedauer

Rechnen und Sprache Spracherkennung für verschiedene Akzente verbessern

Eine neue Methode verbessert die Spracherkennungsgenauigkeit für afrikanische Akzente.

2025-10-28T09:35:45+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprachtechnologie-Bewertungen durch detaillierte Berichterstattung

Untersuchung der Auswirkungen von detaillierten Bewertungen auf Sprachsynthesesysteme.

2025-10-28T07:58:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Echokompensationstechnologie

Die Verbesserung der Sprachklarheit durch effektive Echo-Unterdrückungstechniken und maschinelles Lernen.

2025-10-28T05:32:50+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Echtzeitverfolgung von Gesangsstimmen mit SingNet

SingNet verbessert das Schlag-Tracking in Gesangsstimmen mit Hilfe von vergangenen Daten.

2025-10-28T04:44:15+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei der Spracherkennung für mehrere Sprecher

Ein neues System verbessert die Spracherkennung in Umgebungen mit mehreren Sprechern.

2025-10-28T00:41:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Lippen-zu-Sprache-Technologie

LipVoicer erzeugt klaren Sprachsound aus stummen Videos mit fortschrittlichen Lippenlese-Methoden.

2025-10-27T21:27:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Erkennung von dysarthrischer Sprache mit innovativen Ansätzen

Neue Methoden zielen darauf ab, die Kommunikation für Personen mit Dysarthrie zu verbessern.

2025-10-27T21:01:09+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Spracheverarbeitung mit visuellem Lernen kombinieren

Diese Studie untersucht die Vorteile der Kombination von Sprachverarbeitung mit visuellen Daten.

2025-10-27T20:38:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Vorhersagen mit mehreren Scores in Gauss-Prozessen verbessern

Neue Methode verbessert Vorhersagen, indem sie mehrere Expertenbewertungen berücksichtigt.

2025-10-27T19:49:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Neubewertung der Sprecheranonymisierung und Einfluss von Vocodern

Ein frischer Blick auf die Anonymisierung von Sprechern und die wichtige Rolle von Vocodern.

2025-10-27T18:12:40+00:00 ― 5 min Lesedauer

Rechnen und Sprache Bewertung von Whispers Leistung bei arabischen Dialekten

Ein Blick darauf, wie Whisper mit verschiedenen arabischen Dialekten und Akzenten umgeht.

2025-10-27T13:21:10+00:00 ― 5 min Lesedauer

Rechnen und Sprache Video-LLaMA: Ein neuer Ansatz für das Verstehen von Videos

Ein Programm, das visuelle und auditive Daten kombiniert, um das Verstehen von Videos zu verbessern.

2025-10-27T11:44:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei der Erkennung von Sprechakten in Bengali

Eine neue Methode verbessert die Erkennung von Sprechakten in Bengali durch Audio- und Textanalyse.

2025-10-27T10:55:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Die Rolle von Lachen in der Maschineninteraktion

Das Studieren von Lachen kann verbessern, wie Maschinen mit Menschen interagieren.

2025-10-27T08:29:40+00:00 ― 5 min Lesedauer

Ton Musik mit BERT analysieren: Ein neuer Ansatz

Forschung untersucht BERTs Potenzial in der Analyse von Musik auf Barkebene.

2025-10-27T07:41:05+00:00 ― 5 min Lesedauer

Computer und Gesellschaft Fesselndes Mathe-Lernen für kleine Kinder

Ein neues System verbessert das Mathelernen zu Hause durch coole Interaktionen.

2025-10-27T07:08:49+00:00 ― 6 min Lesedauer

Rechnen und Sprache Effiziente Anpassung der Spracherkennung mithilfe von Textdaten

Eine neue Methode verbessert Spracherkennungsmodelle, indem sie nur Textdaten für die Anpassung nutzt.

2025-10-27T06:52:30+00:00 ― 5 min Lesedauer

Ton Fortschrittliche Melodienharmonisierung mit emotionalem Kontext

Ein neues Modell verbessert die Melodienharmonisierung, indem es emotionale Faktoren berücksichtigt.

2025-10-26T21:58:05+00:00 ― 6 min Lesedauer

Maschinelles Lernen Innovative Tanzkreation mit Klangwörtern

Neue Methoden nutzen Onomatopöie, um einzigartige Tanzbewegungen zu inspirieren.

2025-10-26T20:20:55+00:00 ― 5 min Lesedauer

Ton Fortschritte bei Sprachgegenmassnahmesystemen

Forscher verbessern die Erkennung von maschinell erzeugter Sprache durch Anpassungen der Phaseninformation.

2025-10-26T17:55:10+00:00 ― 6 min Lesedauer

Digitale Bibliotheken Reproduzierbarkeitsprobleme bei Interspeech-Konferenzen

Ein Blick auf Reproduktionsprobleme in der Sprachverarbeitungsforschung.

2025-10-26T16:18:00+00:00 ― 8 min Lesedauer

Rechnen und Sprache Fortschritte bei der Spracherkennung mit dem LASR-Framework

Ein neuer Ansatz verbessert die Sprach- und Sprachidentifikation mit selbstüberwachtem Lernen und Labels.

2025-10-26T08:12:10+00:00 ― 6 min Lesedauer

Ton Verbesserung der Spracherkennung für arabische Dysarthrie

Eine neue Methode verbessert die Spracherkennung für dysarthrische arabische Sprecher.

2025-10-26T07:23:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Innovatives Spracherkennungstool für ressourcenschwache Sprachen

Allophant verbessert die Phonemerkennung für Sprachen mit wenig Daten.

2025-10-26T06:35:00+00:00 ― 6 min Lesedauer

Ton SANGEET: Ein strukturiertes Datenset für Hindustani Musik

Hier ist SANGEET, ein umfassender Datensatz über Hindustani-Klassische Musik.

2025-10-26T04:57:50+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Wortzeitbestimmung in Spracherkennungssystemen

Verbesserung der Schätzung der Worttiming in Spracherkennungssystemen für bessere Genauigkeit.

2025-10-26T01:43:30+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung mit fortgeschrittenen Modellen verbessern

Neue Methoden verbessern die Sprachverarbeitung in Sprachmodellen.

2025-10-26T00:54:55+00:00 ― 6 min Lesedauer

Ton Die Herausforderung der Erkennung von Fake-Audio angehen

Eine neue Methode soll die Erkennung von gefälschter Audio verbessern, ohne das vergangene Wissen zu verlieren.

2025-10-25T16:00:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der unüberwachten Spracherkennung

Ein neues Framework verbessert das Studium von unüberwachten Spracherkennungssystemen.

2025-10-25T13:34:45+00:00 ― 7 min Lesedauer

Ton Melodien aus einfachen Beats kreieren

Dieses Projekt hilft jedem, Musik mit einfachen Beats und fortgeschrittenen Computer-Methoden zu komponieren.

2025-10-25T11:57:35+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte im selbstüberwachten Lernen für Spracherkennung

Selbstüberwachende Modelle zeigen Einblicke in phonetische und phonemische Unterschiede in der Sprache.

2025-10-25T10:20:25+00:00 ― 5 min Lesedauer