Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

RSS

Rechnen und Sprache Fortschritte bei Audio-Frage-Antwort-Systemen

Neue Modelle verbessern, wie Maschinen auf audio-basierte Fragen reagieren.

2025-10-30T13:25:05+00:00 ― 5 min Lesedauer

Rechnen und Sprache Sprachidentifikation bei Code-Switching-Sprache verbessern

Die Forschung zielt darauf ab, die Spracherkennung in Englisch-Mandarin-Gesprächen zu verbessern.

2025-10-30T12:36:30+00:00 ― 8 min Lesedauer

Rechnen und Sprache Fortschritte in der Schweizerdeutschen Sprachsynthese

Neue Methoden verbessern die Sprachsynthese für Schweizerdeutsch aus Hochdeutsch-Text.

2025-10-30T10:59:20+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei mehrsprachigen Spracherkennungssystemen

Erforschen von Methoden zur Verbesserung der mehrsprachigen Spracherkennung in indischen Sprachen.

2025-10-30T10:10:45+00:00 ― 6 min Lesedauer

Ton Fortschrittliche Sprachaktivitätserkennung mit SVVAD

Entdecke, wie SVVAD die Spracherkennung verbessert, um die Sprecherverifizierung zu optimieren.

2025-10-30T09:22:10+00:00 ― 5 min Lesedauer

Ton Fortschritte in der automatischen Aussprachebewertung

Eine neue Methode verbessert das Aussprache-Feedback für Sprachlerner.

2025-10-30T08:33:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Anpassungsfähigkeit bei Spracherkennungsmodellen messen

Ein neues Rahmenwerk bewertet, wie gut Sprachmodelle sich an bestimmte Aufgaben anpassen.

2025-10-30T06:56:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der mehrsprachigen Sprachübersetzung

Forschung verbessert die mehrsprachige Sprachübersetzung mit semantischem Wissen.

2025-10-30T06:07:50+00:00 ― 4 min Lesedauer

Ton Fortschrittliche Sprachverarbeitung mit HuBERT

HuBERT-Modelle verbessern Sprachaufgaben durch mehrere Auflösungen für bessere Leistung.

2025-10-29T22:02:00+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Lautsprecheridentifikationstechnologie

Neue Techniken verbessern die Genauigkeit beim Erkennen von Sprechern und beim Aufspüren von Impostoren.

2025-10-29T20:24:50+00:00 ― 5 min Lesedauer

Ton Verbesserung von virtuellen analogen Audioeffekten mit Deep Learning

Ein neuer Ansatz verbessert die Phasenreaktion in virtuellen Audioeffekten mit Hilfe von Deep Learning.

2025-10-29T18:47:40+00:00 ― 5 min Lesedauer

Ton Verlangsamung bei der Spracherkennung: Ein näherer Blick auf SlothSpeech

SlothSpeech zeigt Schwächen in Spracherkennungssystemen und bremst sie richtig aus.

2025-10-29T17:10:30+00:00 ― 5 min Lesedauer

Ton UnDiff: Ein neuer Ansatz für Audio-Klarheit

UnDiff verbessert die Audioqualität mit innovativen Sprachwiederherstellungstechniken.

2025-10-29T16:21:55+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neue Einblicke in die generative Sprachmodellierung für gesprochene Sprache

Forscher schauen sich an, wie GSLM Sprache in lauten Umgebungen verarbeitet.

2025-10-29T15:33:20+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Stottererkennungstechnologie

Neue Methoden im maschinellen Lernen verbessern die Möglichkeiten zur Stottererkennung.

2025-10-29T14:44:45+00:00 ― 5 min Lesedauer

Ton EmoMix: Fortschrittliche emotionale Sprachsynthese

EmoMix ermöglicht es, Sprache zu kreieren, die gemischte Emotionen mit präziser Intensität ausdrückt.

2025-10-29T13:56:10+00:00 ― 5 min Lesedauer

Ton MW-MAE: Ein neuer Ansatz fürs Audio-Lernen

Entdecke die innovative Multi-Window Masked Autoencoder Methode für verbessertes Audio-Processing.

2025-10-29T11:30:25+00:00 ― 5 min Lesedauer

Ton Audio-Wiederherstellung mit visuellen Hinweisen verbessern

Eine neuartige Methode kombiniert Audio- und Visueldaten, um fehlende Sprache zu reparieren.

2025-10-29T10:41:50+00:00 ― 6 min Lesedauer

Rechnen und Sprache Hassrede in spärlich ressourcierten Sprachen angehen

Methoden zur Erkennung von Hassrede in Audioübertragungen von unterversorgten Sprachen erkunden.

2025-10-29T09:04:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Sound wiederbeleben: Die BABE-Methode für Audio-Restaurierung

Eine neue Methode stellt verlorene hohe Frequenzen in historischen Aufnahmen wieder her.

2025-10-29T06:38:55+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der ASR-Technologie durch sequenzielle allgemeine Entropieminimierung

Ein neues Verfahren verbessert automatische Spracherkennungssysteme für mehr Genauigkeit und Anpassungsfähigkeit.

2025-10-29T02:36:00+00:00 ― 6 min Lesedauer

Ton Fortschrittliche Klangsimulation mit BEDRF

Ein neues Modell verbessert die Schallbeugung in virtuellen Umgebungen.

2025-10-29T01:47:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Die Verbesserung der Spracherkennung durch kontextuelle Beeinflussung

Kontextbasierte Biasierung verbessert ASR-Systeme und steigert die Genauigkeit bei speziellen Aufgaben.

2025-10-29T00:58:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachemotionstransformationstechnologie

Ein neuer Ansatz, um Emotionen in der Sprache mitten im echten Lärm zu verändern.

2025-10-28T23:21:40+00:00 ― 7 min Lesedauer

Ton Neue Methode zur Verbesserung der Erkennung von Sprachpronunciation

Diese Studie stellt ein neues System vor, um Aussprachefehler bei Sprachlernern zu erkennen.

2025-10-28T21:44:30+00:00 ― 6 min Lesedauer

Ton Ein neuer Ansatz zur Musikumgestaltung

Das Q A System nutzt selbstüberwachtes Lernen für innovative Musikneuordnungen.

2025-10-28T20:07:20+00:00 ― 6 min Lesedauer

Ton Verbesserung der ausdrucksvollen Sprachsynthese mit TVC-GMM

Eine neue Methode verbessert die Qualität von Text-zu-Sprache und den emotionalen Ausdruck.

2025-10-28T18:30:10+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Sprachklarheit mit audiovisuellen Techniken verbessern

Forscher kombinieren Audio- und Visualdaten, um das Sprachverständnis an lauten Orten zu verbessern.

2025-10-28T17:41:35+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Aktive Geräuschkontrolle: Unerwünschten Lärm reduzieren

Entdecke, wie die aktive Geräuschkontrolle unsere Klangwahrnehmung verändert.

2025-10-28T16:53:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung mit kleineren Modellen

Techniken, um die Modellgrösse zu verringern und gleichzeitig die Leistung zu erhalten, kommen auf.

2025-10-28T15:15:50+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei digitalen Phaseneffekten

Neues Modell ahmt analoge Phaseneffekte mit verbesserten Lerntechniken nach.

2025-10-28T12:50:05+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschrittliche mehrsprachige Spracherkennung mit DistilXLSR

Ein neues Modell reduziert die Grösse und verbessert die mehrsprachige Spracherkennung.

2025-10-28T11:12:55+00:00 ― 6 min Lesedauer

Rechnen und Sprache Spracherkennung für verschiedene Akzente verbessern

Eine neue Methode verbessert die Spracherkennungsgenauigkeit für afrikanische Akzente.

2025-10-28T09:35:45+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprachtechnologie-Bewertungen durch detaillierte Berichterstattung

Untersuchung der Auswirkungen von detaillierten Bewertungen auf Sprachsynthesesysteme.

2025-10-28T07:58:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Echokompensationstechnologie

Die Verbesserung der Sprachklarheit durch effektive Echo-Unterdrückungstechniken und maschinelles Lernen.

2025-10-28T05:32:50+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Echtzeitverfolgung von Gesangsstimmen mit SingNet

SingNet verbessert das Schlag-Tracking in Gesangsstimmen mit Hilfe von vergangenen Daten.

2025-10-28T04:44:15+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei der Spracherkennung für mehrere Sprecher

Ein neues System verbessert die Spracherkennung in Umgebungen mit mehreren Sprechern.

2025-10-28T00:41:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Lippen-zu-Sprache-Technologie

LipVoicer erzeugt klaren Sprachsound aus stummen Videos mit fortschrittlichen Lippenlese-Methoden.

2025-10-27T21:27:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Erkennung von dysarthrischer Sprache mit innovativen Ansätzen

Neue Methoden zielen darauf ab, die Kommunikation für Personen mit Dysarthrie zu verbessern.

2025-10-27T21:01:09+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Spracheverarbeitung mit visuellem Lernen kombinieren

Diese Studie untersucht die Vorteile der Kombination von Sprachverarbeitung mit visuellen Daten.

2025-10-27T20:38:25+00:00 ― 6 min Lesedauer