Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

Audio- und Sprachverarbeitung Neuer Datensatz und Modell für mehrsprachige Text-to-Speech

CML-TTS ermöglicht bessere Text-zu-Sprache-Systeme in sieben Sprachen.

2025-10-21T18:04:50+00:00 ― 5 min Lesedauer

Ton Bewertung der Sprachqualität mit Machine-Learning-Modellen

Diese Studie bewertet verschiedene Modelle zur Vorhersage der Qualität synthetischer Sprache.

2025-10-21T16:27:40+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Methoden zur Klassifizierung von Vogelgeräuschen

Forscher automatisieren die Klassifikation von Vogelgeräuschen und verbessern die Genauigkeit bei der Überwachung von Arten.

2025-10-21T14:50:30+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung FALL-E: Eine neue Ära der Soundkreation

FALL-E erstellt hochwertige Soundeffekte aus Textbeschreibungen.

2025-10-21T13:13:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Typische Sprache für Leute mit Dysarthrie anpassen

Eine neue Methode verbessert die Sprachkonversion für Menschen mit atypischer Sprache.

2025-10-21T05:56:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung für mehrere Sprecher mit SURT 2.0

SURT 2.0 verbessert die Spracherkennung für mehrere Sprecher in Echtzeiteinstellungen.

2025-10-21T05:07:30+00:00 ― 6 min Lesedauer

Ton Hier kommt MARBLE: Ein Benchmark für Musik-AI

MARBLE setzt einen Standard zur Bewertung von Musik-AI-Modellen in verschiedenen Aufgaben.

2025-10-21T04:18:55+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Neues Modell verbessert die Erkennung von Vogelgeräuschen

Eine neue Methode verbessert die Genauigkeit bei der Erkennung von Vogelrufen.

2025-10-21T03:30:20+00:00 ― 6 min Lesedauer

Ton Verbesserung der Audioverarbeitung mit SFI-Schichten

Neue Algorithmen verbessern die Audioverarbeitung bei unterschiedlichen Abtastraten.

2025-10-21T00:16:00+00:00 ― 5 min Lesedauer

Ton Geräusche nutzen, um männliche Mücken für die Schädlingsbekämpfung zu sortieren

Forschung untersucht die Klanganalyse, um die Sortierung von Mücken für die Krankheitsbekämpfung zu verbessern.

2025-10-20T21:50:15+00:00 ― 6 min Lesedauer

Ton Vokalklänge mit DSP-Techniken umwandeln

Erkunde zwei innovative Methoden zur Veränderung des Stimmklangs mit Digital Signal Processing.

2025-10-20T14:33:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Lernen von automatischer Spracherkennung

Ein neues Verfahren verbessert die Spracherkennungstechnologie, ohne das zuvor erlernte Wissen zu verlieren.

2025-10-20T13:44:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Multitrack-Musiktranskription mit Perceiver TF

Ein neues Modell verbessert die Genauigkeit der Musiktranskription für mehrere Instrumente.

2025-10-20T12:07:15+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Audioverarbeitung mit DAMAS-FISTA

Eine neue Methode kombiniert traditionelle und Deep Learning für effizientes Klang-Imageing.

2025-10-20T11:18:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Schallfeldrekonstruktion

Neue Methoden verbessern den Realismus in Audiotechnologien mit physikbasierten Techniken.

2025-10-20T10:30:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte beim Sprachenlernen für ressourcenarme Sprachen

Ein neues Modell verbessert das Wortlernen mit Audio und Bildern.

2025-10-20T09:41:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Rolle der Spracherkennung für die Integrität klinischer Studien

Untersuchen, wie Sprachtechnologie verhindern kann, dass Patienten doppelt an Studien teilnehmen.

2025-10-20T07:15:45+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Sprache analysieren, um psychische Gesundheitsprobleme zu erkennen

Ein neues Datenset hilft, Anzeichen von Depression und Angst durch Sprachanalyse zu erkennen.

2025-10-20T06:27:10+00:00 ― 7 min Lesedauer

Ton Geräusche aus Gehirnaktivität rekonstruieren

Neue Methode rekonstruiert Geräusche aus Gehirnsignalen und enthüllt Einblicke in die auditiven Prozesse.

2025-10-20T01:35:40+00:00 ― 5 min Lesedauer

Ton KI in die Musikproduktion auf Bela bringen

Ein Leitfaden zur Nutzung von KI-Modellen für Musik auf der Bela-Plattform.

2025-10-19T22:21:20+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neue Metriken zur Bewertung der Qualität der Spracherkennung

Ein neues Verfahren bewertet ASR-Systeme, ohne dass Referenztexte nötig sind.

2025-10-19T19:07:00+00:00 ― 5 min Lesedauer

Rechnen und Sprache Evaluation der ASR-Qualität ohne Referenztexte

NoRefER bietet eine neue Möglichkeit, die Ergebnisse der Spracherkennung zu bewerten, ohne Transkripte zu benötigen.

2025-10-19T16:41:15+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Verbesserung von Videountertiteln mit Audio-Integration

In diesem Artikel geht's um 'ne Methode, um die Video-Untertitelung zu verbessern, indem man Audio einbezieht.

2025-10-19T15:52:40+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Sprachumwandlungstechnologie

Ein neues Modell verbessert die Sprachumwandlung, indem es die Methoden zur Sprachtrennung vereinfacht.

2025-10-19T12:38:20+00:00 ― 7 min Lesedauer

Ton Fortschritte bei der Messung von Musikähnlichkeit

Die Forschung zielt darauf ab, Audio- und symbolische Daten für die Analyse von Musikähnlichkeiten zu kombinieren.

2025-10-19T11:49:45+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Techniken zur Sprachdiarisierung

Neue Methoden verbessern die Sprachsegmentierung in mehrsprachigen Gesprächen.

2025-10-19T02:06:45+00:00 ― 6 min Lesedauer

Ton Neue Methode verbessert Schallschutz in lauten Umgebungen

NoisyILRMA verbessert die Klangextraktion aus Hintergrundgeräuschen für klarere Audioerlebnisse.

2025-10-19T00:29:35+00:00 ― 5 min Lesedauer

Ton Fortschritte im Verständnis der Gesangsstimme mit SSL-Modellen

Dieser Artikel behandelt die Rolle von selbstüberwachtem Lernen in der Musiktechnologie.

2025-10-18T22:03:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der automatischen Spracherkennung für mehrsprachige Nutzung

Ein neues Framework verbessert die ASR für ressourcenarme Sprachen und mehrsprachige Skalierbarkeit.

2025-10-18T19:38:05+00:00 ― 6 min Lesedauer

Ton Sprachrecognition für taube Nutzer voranbringen

Personalisierte ASR-Systeme verbessern die Kommunikation für DHH-Personen erheblich.

2025-10-18T03:26:25+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Techniken zur Sprecherdiarisierung

Neue Methoden nutzen konversationelle Zusammenfassungen für eine bessere Sprechererkennung.

2025-10-18T00:12:05+00:00 ― 6 min Lesedauer

Rechnen und Sprache Automatisierte Spracherkennung für Sprachlerner verbessern

Verbesserung von Feedback-Systemen für Englischlerner, indem das Cold-Start-Problem angegangen wird.

2025-10-17T16:54:50+00:00 ― 6 min Lesedauer

Ton Verbesserung der Lärm-Lokalisierung für Windkraftanlagen

Forschung, wie man Geräuschquellen von Windkraftanlagen findet, um Lärm zu reduzieren.

2025-10-17T16:06:15+00:00 ― 5 min Lesedauer

Ton Fortschritte bei der Erkennung von Gesangstechniken mit PrimaDNN

Ein neues Modell zur Identifizierung von Gesangstechniken in Audiodateien.

2025-10-17T14:29:05+00:00 ― 5 min Lesedauer

Multimedia Verbesserung der Zielsprecherextraktion mit visuellen Hinweisen

Ein neues Modell verbessert die Sprachextraktion mit Hilfe von Audio- und visuellen Informationen.

2025-10-17T12:51:55+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Wespeaker vorstellen: Ein Toolkit zur Sprechererkennung

Wespeaker macht die Sprechererkennung einfacher mit benutzerfreundlichen Tools und vortrainierten Modellen.

2025-10-17T10:26:10+00:00 ― 6 min Lesedauer

Ton Mono-Audio in immersiven Stereo umwandeln

Eine neue Methode verwandelt Monosignale in fesselnde Stereoerlebnisse.

2025-10-17T01:31:45+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei der Emotionserkennung über verschiedene Altersgruppen und Sprachen hinweg

Eine Studie zur Verbesserung der Emotions erkennung in der Sprache für verschiedene Gruppen.

2025-10-16T23:06:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Sprachrecognition verbessern durch vertrauensbasierte Ensembles

In diesem Artikel geht's darum, wie man die Spracherkennung mit vertrauensbasierten Ensemble-Methoden verbessern kann.

2025-10-16T18:14:30+00:00 ― 5 min Lesedauer

Multimedia Die Revolution der Babyschlafüberwachung mit LittleBeats

Studie nutzt Mehrdaten-Gerät, um Schlafmuster von Babys genauer zu verfolgen.

2025-10-16T17:25:55+00:00 ― 5 min Lesedauer