Neuste Artikel für Automatische Spracherkennung

Rechnen und Sprache Verbesserung der Entitätserkennung aus fehlerhaften medizinischen Transkriptionen

Diese Studie befasst sich mit den Herausforderungen, genaue medizinische Begriffe aus geräuschvollen Audios zu erfassen.

2025-08-26T04:59:30+00:00 ― 8 min Lesedauer

Rechnen und Sprache Spracherkennung mit akustischen Daten verbessern

Eine neue Methode integriert akustische Informationen in Sprachmodelle für eine bessere Spracherkennung.

2025-08-25T02:15:55+00:00 ― 9 min Lesedauer

Rechnen und Sprache Verbesserung der medizinischen Transkription mit KI

LLMs verbessern die Genauigkeit bei medizinischen Transkriptionen, was der Patientenversorgung zugutekommt.

2025-08-24T16:32:55+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Codec-SUPERB: Ein Benchmark für Audio-Codecs

Ein neues System, um die Leistung von Audio-Codecs in verschiedenen Anwendungen zu bewerten.

2025-08-22T23:15:10+00:00 ― 7 min Lesedauer

Ton Verstehen von automatischer Spracherkennungstechnologie

Eine Übersicht über ASR und seine Fortschritte in modernen Anwendungen.

2025-08-20T15:22:55+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Cochlea-Implantaten mit KI-Technologien

KI verbessert Cochlea-Implantate für besseres Hören und Kommunizieren in schwierigen Umgebungen.

2025-08-17T13:41:50+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der automatischen Sprachqualitätsbewertung

Eine neue Methode verbessert die Sprachauswertung mit kompletten Aufnahmen.

2025-08-14T06:20:40+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Die Bewertung von Sprachverarbeitungsmodellen mit SUPERB

Ein neues Framework zur Bewertung von Grundmodellen bei Sprachaufgaben.

2025-08-11T09:31:05+00:00 ― 8 min Lesedauer

Rechnen und Sprache Fortschritte bei automatischen Untertitelungssystemen

Eine neue Methode erstellt direkt Untertitel und verbessert die Barrierefreiheit für verschiedene Zielgruppen.

2025-08-10T07:49:00+00:00 ― 9 min Lesedauer

Rechnen und Sprache Bewertung von ASR-Systemen für stotternde Sprache

Diese Studie bewertet die Leistung von ASR-Systemen bei Personen, die stottern.

2025-08-07T04:18:10+00:00 ― 8 min Lesedauer

Rechnen und Sprache Neue Angriffsmethode macht ASR-Systeme sprachlos

Ein universeller Audio-Clip kann fortgeschrittene ASR-Modelle wie Whisper stummschalten.

2025-08-07T03:29:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Spracherkennung im Klassenzimmer durch fortgesetztes Prétraining

Verbesserte Spracherkennung für Klassenzimmer mit fortschrittlichen Trainingstechniken verbessert das Lernen.

2025-08-05T19:06:15+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachverbesserung mit VPIDM

Das neue Modell VPIDM verbessert die Sprachverständlichkeit in lauten Umgebungen.

2025-08-03T16:54:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Einführung des 4D-Modells in der Spracherkennung

Ein neues Modell verbessert die Spracherkennung mit mehreren Dekodierungs-Methoden.

2025-08-01T01:44:35+00:00 ― 7 min Lesedauer

Rechnen und Sprache Vorstellung von mHuBERT-147: Ein kompaktes Sprachmodell

mHuBERT-147 verarbeitet Sprache effizient in mehreren Sprachen.

2025-07-30T22:12:45+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte in der multimodalen wissenschaftlichen Spracherkennung

Die Genauigkeit beim Transkribieren von wissenschaftlichen Präsentationen durch Sprach- und visuelle Integration verbessern.

2025-07-28T04:36:24+00:00 ― 9 min Lesedauer

Rechnen und Sprache Nollywoods Sprachherausforderung: Dialekte verbinden

Eine Studie über die Übersetzung von nigerianischem Englisch für bessere Zugänglichkeit in Nollywood-Filmen.

2025-07-24T04:16:05+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei der Sprach-zu-Text-Übersetzung mit LLMs

Neues Modell verbessert die Sprach-zu-Text-Übersetzung mithilfe grosser Sprachmodelle.

2025-07-23T08:01:30+00:00 ― 7 min Lesedauer

Rechnen und Sprache Fortschritte bei der Anonymisierung mehrsprachiger Sprecher

Die Verbesserung der Technologie zur Anonymisierung von Sprechern in neun Sprachen, um die Privatsphäre zu gewährleisten.

2025-07-23T03:58:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Spracherkennung mit akzent-spezifischen Codebüchern verbessern

Neue Methode verbessert die Handhabung von verschiedenen Akzenten in ASR-Systemen durch spezielle Codebücher.

2025-07-22T04:29:40+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritt der Sprachtechnologie für tunesisches Arabisch

Diese Studie bewertet Sprachtechnologie in ressourcenarmen Sprachen wie Tunesisch-Arabisch.

2025-07-21T12:18:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Die Effizienz von Mamba in der Sprachtechnologie bewerten

Mamba zeigt vielversprechende Ergebnisse gegen Transformer bei Sprachaufgaben, besonders bei langen Eingaben.

2025-07-17T13:33:45+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung mit Kontexthinweisen verbessern

Lern, wie Kontext die Genauigkeit der automatischen Spracherkennung und die Wörterkennung verbessert.

2025-07-16T14:53:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Spracherkennung für die polnische Sprache

Die Forschung präsentiert neue Methoden zur Bewertung von Spracherkennungssystemen in Polnisch.

2025-07-14T16:44:10+00:00 ― 6 min Lesedauer

Rechnen und Sprache Optimierung der ASR-Fehlerkorrektur mit Sprachmodellen

Eine Studie zur Verbesserung der Transkriptionsgenauigkeit durch verbessertes Prompt-Design.

2025-07-11T15:03:05+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der Sprachübersetzungstechnologie

Ein neues Modell soll die Qualität der Sprachübersetzung durch integrierte Systeme verbessern.

2025-07-11T02:54:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung von Technologien zur Erkennung von geflüsterten Sprache

Neue Methoden sollen die Erkennung von geflüsterten Sprachäusserungen in automatischen Systemen verbessern.

2025-07-08T08:30:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung mit KI- Zusammenarbeit verbessern

KI-Modelle verbessern die Genauigkeit von Sprach-zu-Text-Umwandlungen.

2025-07-07T09:50:10+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung der Spracherkennung für spezielle Begriffe

Forschung verbessert ASR-Systeme mit Sprachmodellen für bessere Genauigkeit.

2025-07-06T20:41:12+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung mit kontextuellen Schlüsselwörtern verbessern

Ein neues System verbessert die Spracherkennung, indem es kontextuelle Schlüsselwörter für genauere Ergebnisse verwendet.

2025-06-29T22:53:15+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der mehrsprachigen Spracherkennung ohne Originaldaten

Neue Methoden verbessern ASR-Modelle für mehrere Sprachen und bewahren das vorhandene Wissen.

2025-06-27T15:01:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Die Rolle von ASR in der Gerichtstranskription

Untersuchung der automatischen Spracherkennung in kanadischen Gerichtssystemen und deren Auswirkungen.

2025-06-24T14:48:24+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Japanischen Spracherkennung mit GER-Techniken

Forschung zeigt, wie LLMs die automatische Spracherkennung in der japanischen Sprache verbessern.

2025-06-23T04:08:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Einführung von SALSA: Eine neue Methode zur Verbesserung der Spracherkennung

SALSA verbessert die Spracherkennung für Sprachen mit wenig Ressourcen, indem es ASR- und Sprachmodelle integriert.

2025-06-22T06:16:15+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung der ASR-Genauigkeit für Barrierefreiheit

Untersuchung der Leistung von automatischer Spracherkennung für taube und schwerhörige Nutzer.

2025-06-22T01:24:45+00:00 ― 12 min Lesedauer

Rechnen und Sprache Gesprächsdaten zur Autismusdiagnose nutzen

Eine neue Methode nutzt Sprachdaten, um Autismusbewertungen zu verbessern.

2025-06-19T19:12:12+00:00 ― 6 min Lesedauer

Maschinelles Lernen Fortschritte bei generativen Modellen und deren Anwendungen

Untersuchung der neuesten Entwicklungen bei generativen Modellen in verschiedenen Bereichen.

2025-06-14T04:06:48+00:00 ― 6 min Lesedauer

Rechnen und Sprache WhisperNER: Spracherkennung und Entitätserkennung zusammenbringen

Ein neues Modell kombiniert Spracherkennung und Entitätserkennung für bessere Ergebnisse.

2025-06-13T03:29:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Spracherkennung im Klassenzimmer durch kontinuierliches Pretraining

Ein neuer Ansatz verbessert ASR-Systeme für eine bessere Kommunikation im Klassenzimmer.

2025-06-12T18:44:20+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Spracherkennung mit mehreren Eingabetypen verbessern

Dieser Artikel beleuchtet, wie unterschiedliche Eingaben die Spracherkennung verbessern können.

2025-06-12T15:30:00+00:00 ― 5 min Lesedauer