Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

RSS

Rechnen und Sprache Die Nuancen von Sarkasmus in der Kommunikation

Erforschen, wie Ton und Wortwahl unser Verständnis von Sarkasmus prägen.

2025-06-23T15:28:10+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Vereinfachung der Erstellung von Musikdatensätzen für AMT

Eine neue Methode vereinfacht die Erstellung von Musikdatensätzen für automatische Transkription.

2025-06-23T14:39:35+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Die Erhaltung tamilscher Dialekte durch Technologie

Ein System zur Klassifizierung von literarischen und umgangssprachlichen Tamil-Dialekten anhand von Klangmerkmalen.

2025-06-23T13:51:00+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Sprechererkennung: Überblick über die VoxCeleb-Herausforderung

Ein Überblick über die Fortschritte in der Sprechererkennung durch die VoxCeleb Challenge.

2025-06-23T13:02:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritt bei der Umwandlung von geflüsterten Sprachäusserungen mit MaskCycleGAN

Eine neue Methode verbessert die Umwandlung von geflüstertem Gesprochenem in normale Sprache mit fortschrittlichen Techniken.

2025-06-23T09:48:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung verbessern: Geflüstert vs. Normal

Neue Methoden verbessern das Verständnis von geflüstertem und normalem Sprache durch Computer.

2025-06-23T08:59:30+00:00 ― 5 min Lesedauer

Ton Künstliche Intelligenz und die Zukunft der Musikproduktion

KI verändert, wie Musik komponiert und erlebt wird.

2025-06-23T08:10:55+00:00 ― 6 min Lesedauer

Signalverarbeitung BELT-2: Brücke zwischen Gehirnsignalen und Sprache

Ein neues Modell soll die Gehirnaktivität in lesbare Sprache übersetzen.

2025-06-23T07:22:20+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Modellieren von Sprachdysflüssigkeit mit SSDM

Ein neuer Ansatz verbessert die Modelling von Dysflüssigkeit für Therapie und Sprachenlernen.

2025-06-23T06:33:45+00:00 ― 5 min Lesedauer

Maschinelles Lernen Verstehen von Micro-Batch Clipping im Machine Learning

Ein Blick auf Micro-Batch Clipping und seine Vorteile fürs Modelltraining.

2025-06-23T05:45:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Japanischen Spracherkennung mit GER-Techniken

Forschung zeigt, wie LLMs die automatische Spracherkennung in der japanischen Sprache verbessern.

2025-06-23T04:08:00+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Sprecherverifizierung gegen Spoofing-Angriffe

Innovative Methoden verbessern die Sicherheit in Spracherkennungssystemen.

2025-06-23T01:42:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Audioerkennung verbessern durch multimodales Lernen

Ein neues Framework verbessert die Audio-Klassifikation, indem es das Wissen von mehreren Geräten nutzt.

2025-06-23T00:53:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Innovatives System zur Echo- und Geräuschreduzierung

Ein neuer Ansatz verbessert die Kommunikationsklarheit, indem er Echo und Hintergrundgeräusche reduziert.

2025-06-23T00:05:05+00:00 ― 5 min Lesedauer

Ton VoxInstruct: Eine neue Art, Sprache zu erzeugen

VoxInstruct kombiniert Inhalte und Stil für eine natürlichere Sprachgeneration.

2025-06-22T23:16:30+00:00 ― 5 min Lesedauer

Rechnen und Sprache Bewertung der Genauigkeit von automatischer Spracherkennung

Ein Blick auf die Messung der Genauigkeit in Spracherkennungssystemen mit neuen Methoden.

2025-06-22T20:50:45+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Sprecherverifikation mit Whisper

Eine neue Methode verbessert die Spracherkennungsgenauigkeit in mehreren Sprachen.

2025-06-22T18:25:00+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachverbesserung mit Zeit-Kontext-Fensterung

Eine neue Methode zur Verbesserung der Sprachqualität mit zeitbasiertem Fensteransatz erkunden.

2025-06-22T17:36:25+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei digitalen Audio-Wasserzeichen-Techniken

Neuere Methoden verbessern die Audio-Wasserzeichen-Technik für bessere Klangqualität und Urheberrechtsverwaltung.

2025-06-22T15:59:15+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprachumwandlungstechnologie

Eine neue Methode zur Verbesserung der Qualität von Echtzeit-Sprachumwandlung.

2025-06-22T07:04:50+00:00 ― 6 min Lesedauer

Rechnen und Sprache Einführung von SALSA: Eine neue Methode zur Verbesserung der Spracherkennung

SALSA verbessert die Spracherkennung für Sprachen mit wenig Ressourcen, indem es ASR- und Sprachmodelle integriert.

2025-06-22T06:16:15+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Text-zu-Sprache-Technologie

Neue Methoden verbessern die Qualität der Sprachsynthese in TTS-Systemen.

2025-06-22T05:27:40+00:00 ― 5 min Lesedauer

Rechnen und Sprache Bewertung der ASR-Genauigkeit für Barrierefreiheit

Untersuchung der Leistung von automatischer Spracherkennung für taube und schwerhörige Nutzer.

2025-06-22T01:24:45+00:00 ― 12 min Lesedauer

Rechnen und Sprache Songtexte mit einem neuen Modell verfeinern

Ein neues Modell verwandelt einfache Texte in passende Songtexte.

2025-06-21T23:47:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Die Bewegung der englischen Vokale: Diphthonge vs. Monophthonge

Diese Studie analysiert, wie Diphthonge und Monophthonge sich in Produktion und Bewegung unterscheiden.

2025-06-21T22:10:25+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung der automatischen Spracherkennung mit Sprachmodellen

Neue Methode verbessert die ASR-Genauigkeit mit Sprachmodellen für bessere Transkriptionen.

2025-06-21T20:33:15+00:00 ― 4 min Lesedauer

Rechnen und Sprache Verbesserung der Genauigkeit von Sprecher-Tags in Gesprächen

Ein neues System korrigiert Fehler bei der Sprechererkennung für klarere Gesprächsprotokolle.

2025-06-21T18:56:05+00:00 ― 8 min Lesedauer

Audio- und Sprachverarbeitung Einführung von SelectTTS: Eine vereinfachte Text-zu-Sprache-Methode

SelectTTS vereinfacht die Sprachsynthese für unbekannte Sprecher mit effektiver Rahmenauswahl.

2025-06-21T18:07:30+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Sprachverbesserungstechniken

Sprachverständlichkeit verbessern mit hybriden Filterbänken und neuronalen Netzen.

2025-06-21T17:18:55+00:00 ― 5 min Lesedauer

Ton AASIST3: Fortgeschrittene Lösung zur Sprachverifizierung

AASIST3 verbessert die Erkennung von Fake-Stimmen in automatischen Sprecherverifizierungssystemen.

2025-06-21T16:30:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audiotechnologie: Einführung von X-Codec

X-Codec verbessert die Audioerzeugung, indem es semantisches Verständnis in die Verarbeitung integriert.

2025-06-21T15:41:45+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in der Gestenerkennungstechnologie

Forscher verbessern die Gestenerkennung mit innovativen Lerntechniken.

2025-06-21T12:27:25+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Innovative Lärmkontrolle für Baustellen

Tragbares System reduziert Baulärm, verbessert den Komfort der Arbeiter und das Wohlbefinden der Gemeinschaft.

2025-06-21T11:38:50+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Text-zu-Musik-Generierungstechnologie

Neue Modelle wie FluxMusic verbessern die Musikproduktion aus geschriebenem Text.

2025-06-21T10:50:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Kombination von Stimme und Gesicht für bessere Identifikation

In diesem Artikel geht's um die Vorteile von der Zusammenlegung von Sprach- und Gesichtserkennungssystemen.

2025-06-21T08:24:30+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Audio-Visual-Spracherkennungstechnologie

Ein neues Modell verbessert die Spracherkennung, indem es Audio- und visuelle Eingaben effektiv kombiniert.

2025-06-21T05:58:45+00:00 ― 5 min Lesedauer

Ton Fortschritte bei der Depressionsdiagnose durch Sprachanalyse

Neue Modelle verbessern die Genauigkeit bei der Erkennung von Depressionen durch Sprachaufnahmen.

2025-06-21T03:33:00+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Selbstüberwachten Lernen für Sprachverarbeitung

Eine neue Methode verbessert die Leistung von Sprachmodellen bei verschiedenen Aufgaben.

2025-06-21T02:44:25+00:00 ― 7 min Lesedauer

Ton Fortschritte beim Erkennen von Keywords mit unlabeled Daten

Eine neue Methode verbessert die Genauigkeit der Keyword-Erkennung mit unmarkierten Audiodaten.

2025-06-21T01:55:50+00:00 ― 7 min Lesedauer

Neuronen und Kognition Automatische Erkennung von leichten kognitiven Beeinträchtigungen durch Sprachanalyse

Forschungen zeigen, dass Sprachanalysen bei der frühzeitigen Erkennung von leichter kognitiver Beeinträchtigung helfen können.

2025-06-21T01:11:33+00:00 ― 6 min Lesedauer