Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

RSS

Audio- und Sprachverarbeitung Vibravox: Fortschritt in der Spracherkennungstechnologie

Ein neues Datenset zielt darauf ab, die Sprachaufnahme mit Körpersensoren zu verbessern.

2025-07-15T14:35:55+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Neue Methode zur Erkennung von Deepfakes

Ein neuer Ansatz verbessert die Deepfake-Erkennung durch audio-visuelle Analyse.

2025-07-15T12:10:10+00:00 ― 5 min Lesedauer

Ton Die Entwicklung von automatischen Spracherkennungssystemen

Ein Blick auf die Fortschritte bei Spracherkennungstechnologien und -methoden.

2025-07-15T11:21:35+00:00 ― 5 min Lesedauer

Ton Verbesserung der Stottererkennung mit MMSD-Net

Ein neues Verfahren verbessert die Stottererkennung, indem es Audio-, Video- und Textdaten kombiniert.

2025-07-15T07:18:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Sprecher- und Sprachdiarisierungssystemen

Ein Team verbessert die Audioverarbeitung für Sprecher- und Sprachenidentifikation.

2025-07-15T03:15:45+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Emotionserkennung aus Sprache

Forschung zur Erkennung menschlicher Emotionen durch Sprache zeigt vielversprechende Möglichkeiten für verschiedene Anwendungen.

2025-07-15T00:50:00+00:00 ― 5 min Lesedauer

Ton Innovative Klanggeneration für 3D-Menschenmodelle

Ein neues Verfahren verbessert die Klangproduktion für realistische 3D-Menschenmodelle.

2025-07-15T00:01:25+00:00 ― 7 min Lesedauer

Ton Atemfrequenzen durch Sprachanalyse schätzen

Diese Studie zeigt, wie Sprache die Atemfrequenz mit fortgeschrittenen Modellen schätzen kann.

2025-07-14T23:12:50+00:00 ― 6 min Lesedauer

Ton GraphMuse: Ein neues Tool für Musik-Analyse

GraphMuse vereinfacht die Analyse von symbolischen Musikdaten mit fortschrittlichen Machine-Learning-Techniken.

2025-07-14T19:58:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Spracherkennung für die polnische Sprache

Die Forschung präsentiert neue Methoden zur Bewertung von Spracherkennungssystemen in Polnisch.

2025-07-14T16:44:10+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Zahlenformatierung in ASR-Transkripten

Dieser Artikel bespricht, wie man die Formatierung von Zahlen in automatischen Transkripten verbessern kann.

2025-07-14T15:55:35+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Musikklassifikationstechniken

Selbstüberwachtes Lernen verwandelt die Musikwahrnehmung durch innovative Methoden.

2025-07-14T12:41:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung MSceneSpeech: Fortschritte in der Mandarin-Sprachsynthese

Ein neues Dataset verbessert die maschinelle Sprachverarbeitung für Mandarin und zielt auf natürliche Ausdrucksweise ab.

2025-07-14T09:26:55+00:00 ― 6 min Lesedauer

Multimedia Fortschritte bei der Schallquellenlokalisierung durch audio-visuelle Integration

Eine Studie zur Verbesserung der Klangquellenlokalisierung durch bessere Nutzung von Audio- und visuellen Informationen.

2025-07-14T06:12:35+00:00 ― 8 min Lesedauer

Maschinelles Lernen Bewertung der kognitiven Gesundheit durch Sprachanalyse

Ein neues Framework analysiert Sprache, um leichte kognitive Beeinträchtigungen in verschiedenen Sprachen zu erkennen.

2025-07-14T05:24:00+00:00 ― 6 min Lesedauer

Ton KI und die Herausforderung verschiedener Musikgenres

Die Auswirkungen von KI auf unterrepräsentierte Musikstile erkunden.

2025-07-14T02:58:15+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Text-zu-Sprache für indische Sprachen

Eine Methode, um TTS-Systeme für eine bessere Aussprache von OOV-Wörtern in Indien zu verbessern.

2025-07-14T02:09:40+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung des selbstüberwachten Lernens für Sprachverarbeitung

Ein neues Modell verbessert die Effizienz in der Sprachverarbeitung mit weniger Energieverbrauch.

2025-07-14T00:32:30+00:00 ― 4 min Lesedauer

Ton Fortschritte bei Hörgerätetechnologie mit maschinellem Lernen

Neue Machine-Learning-Modelle verbessern die Sprachverständlichkeit für Hörgeräte-Nutzer.

2025-07-13T23:43:55+00:00 ― 6 min Lesedauer

Ton Studien über soziale Interaktionen mit niederfrequentem Audio

Forschung schaut sich niederfrequente Audio an, um Privatsphäre bei Studien zum sozialen Verhalten zu schützen.

2025-07-13T21:18:10+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verstehen von Schallausbreitung in verbundenen Räumen

Erforschen, wie sich Sound in Mehrzimmerumgebungen verhält und welche Auswirkungen das auf die Technik hat.

2025-07-13T20:29:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung KI-Tools verändern den Musikbearbeitungsprozess

Neue KI-Tools machen das Musikbearbeiten einfacher mit innovativen Techniken und besserer Präzision.

2025-07-13T18:52:25+00:00 ― 5 min Lesedauer

Rechnen und Sprache Ein neuer Ansatz für die Sprachübersetzung: Vorab-Stimmenanpassung

Preset-Stimmenanpassung verbessert die Sprachausgabeübersetzung und sorgt gleichzeitig für Privatsphäre und reduziert Risiken.

2025-07-13T18:03:50+00:00 ― 6 min Lesedauer

Ton Komponisten-Helfer 2: Ein neues Tool für Musiker

Ein neues System hilft Musikern, Musik mit mehr Kontrolle und Präzision zu erstellen.

2025-07-13T14:00:55+00:00 ― 8 min Lesedauer

Ton Die Auswirkungen von KI auf die Originalität in der Musik bewerten

Ein neues Tool zur Bewertung von Replikationen in KI-generierter Musik.

2025-07-13T12:23:45+00:00 ― 7 min Lesedauer

Ton Offene Audio-Generierung: Ein neues Modell

Ein neues Text-zu-Audio-Modell, das nur öffentliche Daten verwendet.

2025-07-13T11:35:10+00:00 ― 6 min Lesedauer

Rechnen und Sprache Herausforderungen und Innovationen in der Forschung zum Code-Switching

Ein neuer Datensatz soll das Verständnis von Code-Switching über mehrere Sprachen hinweg verbessern.

2025-07-13T09:58:00+00:00 ― 5 min Lesedauer

Rechnen und Sprache Geschlechterrepräsentation in französischen Rundfunknachrichten

Dieser Artikel untersucht das Geschlechterverhältnis in französischen Nachrichtenübertragungen zu verschiedenen Themen.

2025-07-13T08:20:50+00:00 ― 5 min Lesedauer

Rechnen und Sprache Rasa: Ein Durchbruch in der Sprachsynthese für Indische Sprachen

Das Rasa-Dataset verbessert die Text-zu-Sprache-Technologie für indische Sprachen mit neutraler und ausdrucksvoller Stimme.

2025-07-13T05:55:05+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Spracherkennung für Emotionen

Neue Methoden verbessern das maschinelle Verständnis menschlicher Emotionen in der Sprache.

2025-07-12T18:34:55+00:00 ― 4 min Lesedauer

Ton KI-Tools für Künstler zugänglich machen

Die Vereinfachung von KI-Tools kann Künstlern helfen, ihre kreative Ausdruckskraft zu steigern.

2025-07-12T17:46:20+00:00 ― 5 min Lesedauer

Ton MusiConGen: Fortschritte bei der Text-zu-Musik-Technologie

MusiConGen verbessert die Kontrolle für Nutzer bei der Text-zu-Musik-Generierung.

2025-07-12T16:57:45+00:00 ― 6 min Lesedauer

Neuronen und Kognition Fortschritte in der EEG-Technologie zur Sprachwiederherstellung

Forscher verbessern die Sprachdekodierung mit EEG, um Menschen mit Sprachbehinderungen zu helfen.

2025-07-12T16:20:33+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Sprachverbesserungstechniken

Ein neues Modell verbessert die Sprachklarheit, indem es Geräusche und Echos gezielt angeht.

2025-07-12T15:20:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Einführung in J-CHAT: Ein neues Datenset für die Forschung zu gesprochener Dialogführung

J-CHAT bietet ein grosses, Open-Source-Datenset zur Verbesserung von Sprachdialogsystemen.

2025-07-12T12:06:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Erstellung von samplebasierten Musikinstrumenten

Neue Methoden ermöglichen es Musikern, Instrumente aus Klangvorgaben zu erstellen.

2025-07-12T08:51:55+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Sprachcodecs und emotionale Erhaltung

Untersuchen, wie Codecs emotionale Töne in Sprachdaten beibehalten.

2025-07-12T06:26:10+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Rundfunkwelt mit IP-Technologie und Audio-Tagging umkrempeln

Lern, wie IP-Broadcasting und Audio-Tagging die Bereitstellung von Inhalten verändern.

2025-07-12T05:37:35+00:00 ― 5 min Lesedauer

Mensch-Computer-Interaktion Menschen und Roboter machen zusammen Musik

Ein Blick darauf, wie Technologie und Musiker in einer einzigartigen Performance zusammenarbeiten.

2025-07-12T03:11:50+00:00 ― 8 min Lesedauer

Robotik Robot-Musiker verbessert das Einkaufserlebnis

Ein Roboter spielt Musik in einem Laden, um den Kunden mehr Spass zu bringen.

2025-07-12T02:23:15+00:00 ― 7 min Lesedauer