Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

RSS

Rechnen und Sprache Verbesserung der Spracherkennung für ressourcenarme Sprachen

Die Forschung konzentriert sich darauf, die Sprachtechnik für Sprachen mit unzureichenden Daten zu verbessern.

2025-10-22T23:13:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Sprachverbesserungstechniken

Ein Blick auf die neuesten Entwicklungen zur Verbesserung der Audio-Klarheit mit fortschrittlichen Modellen.

2025-10-22T21:36:40+00:00 ― 5 min Lesedauer

Ton Bewertung der Schwierigkeitsgrade von Klavierstücken mit neuem Datensatz

Ein neues Datenset hat das Ziel, Klaviernoten nach Schwierigkeitsgrad zu klassifizieren.

2025-10-22T20:48:05+00:00 ― 8 min Lesedauer

Ton Fortschritte bei der Verbesserung der Sprachqualität

Das Gesper-Framework verbessert die Sprachklarheit in lauten Umgebungen.

2025-10-22T19:59:30+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Sprachverbesserung mit Normalisierungstechniken optimieren

Diese Studie stellt eine neue Methode vor, um die Sprachqualität mit vortrainierten Modellen zu verbessern.

2025-10-22T19:10:55+00:00 ― 6 min Lesedauer

Künstliche Intelligenz Verbesserung der Erkennung von Hassrede in Multimedia

Die Kombination aus Audio, Video und Text verbessert die Erkennung von Hassrede.

2025-10-22T15:08:00+00:00 ― 5 min Lesedauer

Ton Ein Vereinfachter Ansatz für Hybrid HMM bei ASR

In diesem Artikel wird eine neue Methode vorgestellt, um effiziente ASR-Systeme zu entwickeln.

2025-10-22T14:19:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Personalisierung von Sprachrecognition auf Mobilgeräten

Ein neuer Ansatz verbessert die Spracherkennung direkt auf Smartphones und schützt dabei die Privatsphäre der Nutzer.

2025-10-22T10:16:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Neues System verbessert die Sprecheridentifikation in Audio

Ein neues Verfahren verbessert die Genauigkeit bei der Identifikation von Sprechern während Gesprächen.

2025-10-22T09:27:55+00:00 ― 5 min Lesedauer

Ton Fortschritte bei der Few-Shot-Bioakustik-Ereigniserkennung

Teams verbessern die Identifizierung von Tiergeräuschen mit wenigen Beispielen im DCASE-Wettbewerb.

2025-10-22T07:50:45+00:00 ― 6 min Lesedauer

Ton Audio-Tagging auf kleinen Computern nutzen

Lerne über Audio-Tagging-Systeme und deren Nutzung auf dem Raspberry Pi.

2025-10-22T06:13:35+00:00 ― 5 min Lesedauer

Ton Fortschritte bei Algorithmen zur Erkennung von Coverversionen

Neue Techniken verbessern die Genauigkeit und Effizienz bei der Identifizierung von Cover-Songs.

2025-10-22T05:25:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der aktiven Geräuschunterdrückungstechnologie

Neue Methode verbessert die Geräuschkontrolle in 3D-Räumen.

2025-10-22T01:22:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Neuer Datensatz und Modell für mehrsprachige Text-to-Speech

CML-TTS ermöglicht bessere Text-zu-Sprache-Systeme in sieben Sprachen.

2025-10-21T18:04:50+00:00 ― 5 min Lesedauer

Ton Bewertung der Sprachqualität mit Machine-Learning-Modellen

Diese Studie bewertet verschiedene Modelle zur Vorhersage der Qualität synthetischer Sprache.

2025-10-21T16:27:40+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Methoden zur Klassifizierung von Vogelgeräuschen

Forscher automatisieren die Klassifikation von Vogelgeräuschen und verbessern die Genauigkeit bei der Überwachung von Arten.

2025-10-21T14:50:30+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung FALL-E: Eine neue Ära der Soundkreation

FALL-E erstellt hochwertige Soundeffekte aus Textbeschreibungen.

2025-10-21T13:13:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Typische Sprache für Leute mit Dysarthrie anpassen

Eine neue Methode verbessert die Sprachkonversion für Menschen mit atypischer Sprache.

2025-10-21T05:56:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung für mehrere Sprecher mit SURT 2.0

SURT 2.0 verbessert die Spracherkennung für mehrere Sprecher in Echtzeiteinstellungen.

2025-10-21T05:07:30+00:00 ― 6 min Lesedauer

Ton Hier kommt MARBLE: Ein Benchmark für Musik-AI

MARBLE setzt einen Standard zur Bewertung von Musik-AI-Modellen in verschiedenen Aufgaben.

2025-10-21T04:18:55+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Neues Modell verbessert die Erkennung von Vogelgeräuschen

Eine neue Methode verbessert die Genauigkeit bei der Erkennung von Vogelrufen.

2025-10-21T03:30:20+00:00 ― 6 min Lesedauer

Ton Verbesserung der Audioverarbeitung mit SFI-Schichten

Neue Algorithmen verbessern die Audioverarbeitung bei unterschiedlichen Abtastraten.

2025-10-21T00:16:00+00:00 ― 5 min Lesedauer

Ton Geräusche nutzen, um männliche Mücken für die Schädlingsbekämpfung zu sortieren

Forschung untersucht die Klanganalyse, um die Sortierung von Mücken für die Krankheitsbekämpfung zu verbessern.

2025-10-20T21:50:15+00:00 ― 6 min Lesedauer

Ton Vokalklänge mit DSP-Techniken umwandeln

Erkunde zwei innovative Methoden zur Veränderung des Stimmklangs mit Digital Signal Processing.

2025-10-20T14:33:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Lernen von automatischer Spracherkennung

Ein neues Verfahren verbessert die Spracherkennungstechnologie, ohne das zuvor erlernte Wissen zu verlieren.

2025-10-20T13:44:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Multitrack-Musiktranskription mit Perceiver TF

Ein neues Modell verbessert die Genauigkeit der Musiktranskription für mehrere Instrumente.

2025-10-20T12:07:15+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Audioverarbeitung mit DAMAS-FISTA

Eine neue Methode kombiniert traditionelle und Deep Learning für effizientes Klang-Imageing.

2025-10-20T11:18:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Schallfeldrekonstruktion

Neue Methoden verbessern den Realismus in Audiotechnologien mit physikbasierten Techniken.

2025-10-20T10:30:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte beim Sprachenlernen für ressourcenarme Sprachen

Ein neues Modell verbessert das Wortlernen mit Audio und Bildern.

2025-10-20T09:41:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Rolle der Spracherkennung für die Integrität klinischer Studien

Untersuchen, wie Sprachtechnologie verhindern kann, dass Patienten doppelt an Studien teilnehmen.

2025-10-20T07:15:45+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Sprache analysieren, um psychische Gesundheitsprobleme zu erkennen

Ein neues Datenset hilft, Anzeichen von Depression und Angst durch Sprachanalyse zu erkennen.

2025-10-20T06:27:10+00:00 ― 7 min Lesedauer

Ton Geräusche aus Gehirnaktivität rekonstruieren

Neue Methode rekonstruiert Geräusche aus Gehirnsignalen und enthüllt Einblicke in die auditiven Prozesse.

2025-10-20T01:35:40+00:00 ― 5 min Lesedauer

Ton KI in die Musikproduktion auf Bela bringen

Ein Leitfaden zur Nutzung von KI-Modellen für Musik auf der Bela-Plattform.

2025-10-19T22:21:20+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neue Metriken zur Bewertung der Qualität der Spracherkennung

Ein neues Verfahren bewertet ASR-Systeme, ohne dass Referenztexte nötig sind.

2025-10-19T19:07:00+00:00 ― 5 min Lesedauer

Rechnen und Sprache Evaluation der ASR-Qualität ohne Referenztexte

NoRefER bietet eine neue Möglichkeit, die Ergebnisse der Spracherkennung zu bewerten, ohne Transkripte zu benötigen.

2025-10-19T16:41:15+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Verbesserung von Videountertiteln mit Audio-Integration

In diesem Artikel geht's um 'ne Methode, um die Video-Untertitelung zu verbessern, indem man Audio einbezieht.

2025-10-19T15:52:40+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Sprachumwandlungstechnologie

Ein neues Modell verbessert die Sprachumwandlung, indem es die Methoden zur Sprachtrennung vereinfacht.

2025-10-19T12:38:20+00:00 ― 7 min Lesedauer

Ton Fortschritte bei der Messung von Musikähnlichkeit

Die Forschung zielt darauf ab, Audio- und symbolische Daten für die Analyse von Musikähnlichkeiten zu kombinieren.

2025-10-19T11:49:45+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Techniken zur Sprachdiarisierung

Neue Methoden verbessern die Sprachsegmentierung in mehrsprachigen Gesprächen.

2025-10-19T02:06:45+00:00 ― 6 min Lesedauer

Ton Neue Methode verbessert Schallschutz in lauten Umgebungen

NoisyILRMA verbessert die Klangextraktion aus Hintergrundgeräuschen für klarere Audioerlebnisse.

2025-10-19T00:29:35+00:00 ― 5 min Lesedauer