Elektrotechnik und Systemtechnik - Audio- und Sprachverarbeitung

RSS

Rechnen und Sprache Fortschritte im Verstehen gesprochener Sprache mit diskreten Einheiten

Neue Methode verbessert das Verständnis gesprochener Sprache, ohne schriftliche Transkripte zu benötigen.

2025-11-01T00:14:10+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Audio-Klassifikationstechniken

Eine neuartige Methode verbessert die Audio-Klassifizierung, indem sie neue Geräusche effizient lernt.

2025-10-31T22:37:00+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Text-zu-Sprache Anpassungstechnologie

Neue Methode verbessert TTS-Anpassung mit minimalen Datenanforderungen.

2025-10-31T21:48:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verstehen von erklärbarer KI in Spracherkennungssystemen

Eine Übersicht über erklärbare KI-Methoden in der automatischen Spracherkennung.

2025-10-31T20:11:15+00:00 ― 6 min Lesedauer

Ton Fortschritte beim Audio-Fragen beantworten mit dem MWAFM-Modell

Ein neues Modell verbessert, wie Maschinen Audiofragen verstehen und darauf reagieren.

2025-10-31T18:34:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Evaluierung von Sprechwechseln in Text-to-Speech-Systemen

Forschung zeigt, dass es bei TTS-Technologie nötig ist, das Abwechseln zu verbessern.

2025-10-31T17:45:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neuer Massstab für Sprachlernmodelle

BabySLM bewertet, wie gut Maschinen lernen, Sprache basierend auf der Sprache von Kindern zu verstehen.

2025-10-31T11:33:20+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Optimierung von synthetischer Sprache für besseres ASR-Training

Eine neue Methode verbessert die Auswahl von synthetischer Sprache für eine höhere Genauigkeit von ASR-Systemen.

2025-10-31T08:51:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprachstörungen-Anpassung mit neuen Techniken

Eine neue Methode passt stockende Sprache effizient an Text an.

2025-10-31T08:02:30+00:00 ― 6 min Lesedauer

Ton Fortschritte bei stillen Sprachschnittstellen

Verbesserung von Systemen zur stillen Spracherkennung mit neuen Techniken.

2025-10-31T07:13:55+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung der ASR-Genauigkeit mit kontextuellem Biasing

Neue Methoden verbessern die automatische Spracherkennung seltener Wörter durch Kontext.

2025-10-31T02:22:25+00:00 ― 6 min Lesedauer

Ton Fortschritte im schwach überwachten Keyword Spotting

Eine neue Methode zum Trainieren von Keyword-Spotting-Modellen mit schwacher Aufsicht in lauten Umgebungen.

2025-10-31T01:33:50+00:00 ― 7 min Lesedauer

Rechnen und Sprache Fortschritte bei der Sprachübersetzung für ressourcenarme Sprachen

Methoden zur Verbesserung von Sprachtechnologiesystemen für unterrepräsentierte Sprachen.

2025-10-31T00:45:15+00:00 ― 5 min Lesedauer

Ton MERT: Ein selbstüberwachtes Modell für das Musikverständnis

MERT geht die Herausforderungen im Musikmodellieren mit innovativen selbstüberwachten Lerntechniken an.

2025-10-30T23:56:40+00:00 ― 6 min Lesedauer

Ton Verbesserung von RNN-T-Modellen mit Reinforcement Learning

Ein neuer Ansatz verbessert die RNN-T-Leistung bei automatischer Spracherkennung.

2025-10-30T19:53:45+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung AVLIT: Fortschrittliche Sprachtrennung im Lärm

Das AVLIT-Modell kombiniert Sound und Video für bessere Sprachverständlichkeit in lauten Umgebungen.

2025-10-30T18:16:35+00:00 ― 6 min Lesedauer

Maschinelles Lernen Bewältigung von Shortcut-Lernen in Spracherkennungssystemen

Untersuchung der Auswirkungen von voreingenommenen Daten in der Audiowiedergabetechnologie.

2025-10-30T17:28:00+00:00 ― 6 min Lesedauer

Ton Verbesserung der Sprachtrennung mit mehreren Mikrofonen

Eine neue Methode verbessert die Sprachtrennung mit mehreren Mikrofonen ganz ohne beschriftete Daten.

2025-10-30T15:50:50+00:00 ― 4 min Lesedauer

Ton Fortschritte bei Audio-Anti-Spoofing-Techniken

Eine Studie verbessert die Sprecherverifikationsmodelle für besseren Identitätsschutz.

2025-10-30T15:02:15+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei Audio-Frage-Antwort-Systemen

Neue Modelle verbessern, wie Maschinen auf audio-basierte Fragen reagieren.

2025-10-30T13:25:05+00:00 ― 5 min Lesedauer

Rechnen und Sprache Sprachidentifikation bei Code-Switching-Sprache verbessern

Die Forschung zielt darauf ab, die Spracherkennung in Englisch-Mandarin-Gesprächen zu verbessern.

2025-10-30T12:36:30+00:00 ― 8 min Lesedauer

Rechnen und Sprache Fortschritte in der Schweizerdeutschen Sprachsynthese

Neue Methoden verbessern die Sprachsynthese für Schweizerdeutsch aus Hochdeutsch-Text.

2025-10-30T10:59:20+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei mehrsprachigen Spracherkennungssystemen

Erforschen von Methoden zur Verbesserung der mehrsprachigen Spracherkennung in indischen Sprachen.

2025-10-30T10:10:45+00:00 ― 6 min Lesedauer

Ton Fortschrittliche Sprachaktivitätserkennung mit SVVAD

Entdecke, wie SVVAD die Spracherkennung verbessert, um die Sprecherverifizierung zu optimieren.

2025-10-30T09:22:10+00:00 ― 5 min Lesedauer

Ton Fortschritte in der automatischen Aussprachebewertung

Eine neue Methode verbessert das Aussprache-Feedback für Sprachlerner.

2025-10-30T08:33:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Anpassungsfähigkeit bei Spracherkennungsmodellen messen

Ein neues Rahmenwerk bewertet, wie gut Sprachmodelle sich an bestimmte Aufgaben anpassen.

2025-10-30T06:56:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der mehrsprachigen Sprachübersetzung

Forschung verbessert die mehrsprachige Sprachübersetzung mit semantischem Wissen.

2025-10-30T06:07:50+00:00 ― 4 min Lesedauer

Ton Fortschrittliche Sprachverarbeitung mit HuBERT

HuBERT-Modelle verbessern Sprachaufgaben durch mehrere Auflösungen für bessere Leistung.

2025-10-29T22:02:00+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Lautsprecheridentifikationstechnologie

Neue Techniken verbessern die Genauigkeit beim Erkennen von Sprechern und beim Aufspüren von Impostoren.

2025-10-29T20:24:50+00:00 ― 5 min Lesedauer

Ton Verbesserung von virtuellen analogen Audioeffekten mit Deep Learning

Ein neuer Ansatz verbessert die Phasenreaktion in virtuellen Audioeffekten mit Hilfe von Deep Learning.

2025-10-29T18:47:40+00:00 ― 5 min Lesedauer

Ton Verlangsamung bei der Spracherkennung: Ein näherer Blick auf SlothSpeech

SlothSpeech zeigt Schwächen in Spracherkennungssystemen und bremst sie richtig aus.

2025-10-29T17:10:30+00:00 ― 5 min Lesedauer

Ton UnDiff: Ein neuer Ansatz für Audio-Klarheit

UnDiff verbessert die Audioqualität mit innovativen Sprachwiederherstellungstechniken.

2025-10-29T16:21:55+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neue Einblicke in die generative Sprachmodellierung für gesprochene Sprache

Forscher schauen sich an, wie GSLM Sprache in lauten Umgebungen verarbeitet.

2025-10-29T15:33:20+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Stottererkennungstechnologie

Neue Methoden im maschinellen Lernen verbessern die Möglichkeiten zur Stottererkennung.

2025-10-29T14:44:45+00:00 ― 5 min Lesedauer

Ton EmoMix: Fortschrittliche emotionale Sprachsynthese

EmoMix ermöglicht es, Sprache zu kreieren, die gemischte Emotionen mit präziser Intensität ausdrückt.

2025-10-29T13:56:10+00:00 ― 5 min Lesedauer

Ton MW-MAE: Ein neuer Ansatz fürs Audio-Lernen

Entdecke die innovative Multi-Window Masked Autoencoder Methode für verbessertes Audio-Processing.

2025-10-29T11:30:25+00:00 ― 5 min Lesedauer

Ton Audio-Wiederherstellung mit visuellen Hinweisen verbessern

Eine neuartige Methode kombiniert Audio- und Visueldaten, um fehlende Sprache zu reparieren.

2025-10-29T10:41:50+00:00 ― 6 min Lesedauer

Rechnen und Sprache Hassrede in spärlich ressourcierten Sprachen angehen

Methoden zur Erkennung von Hassrede in Audioübertragungen von unterversorgten Sprachen erkunden.

2025-10-29T09:04:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Sound wiederbeleben: Die BABE-Methode für Audio-Restaurierung

Eine neue Methode stellt verlorene hohe Frequenzen in historischen Aufnahmen wieder her.

2025-10-29T06:38:55+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der ASR-Technologie durch sequenzielle allgemeine Entropieminimierung

Ein neues Verfahren verbessert automatische Spracherkennungssysteme für mehr Genauigkeit und Anpassungsfähigkeit.

2025-10-29T02:36:00+00:00 ― 6 min Lesedauer