Neuste Artikel für Wortfehlerquote

Rechnen und Sprache Fortschritte bei der Korrektur von Fehlern in der Spracherkennung

Neue Methoden verbessern die Genauigkeit bei der Erkennung von Sprache in lauten Umgebungen mit grossen Sprachmodellen.

2025-08-29T01:48:45+00:00 ― 6 min Lesedauer

Rechnen und Sprache Spracherkennung mit akustischen Daten verbessern

Eine neue Methode integriert akustische Informationen in Sprachmodelle für eine bessere Spracherkennung.

2025-08-25T02:15:55+00:00 ― 9 min Lesedauer

Rechnen und Sprache Verbesserung der medizinischen Transkription mit KI

LLMs verbessern die Genauigkeit bei medizinischen Transkriptionen, was der Patientenversorgung zugutekommt.

2025-08-24T16:32:55+00:00 ― 7 min Lesedauer

Mensch-Computer-Interaktion Fortschritte bei stillen Sprachschnittstellen

Ein Blick auf MONA, ein System, das die stille Sprachkommunikation verbessert.

2025-08-20T16:11:30+00:00 ― 5 min Lesedauer

Robotik Verbesserung der Spracherkennung von Robotern in lauten Umgebungen

Die Forschung konzentriert sich darauf, Robotern zu helfen, Sprache besser zu verstehen, auch wenn Hintergrundgeräusche da sind.

2025-08-19T22:22:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Bewertung der Spracherkennung in lauten Umgebungen

Ein neuer Benchmark bewertet die Leistung von Spracherkennungssystemen unter verschiedenen Störungen.

2025-08-19T14:16:50+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung für ressourcenarme Sprachen verbessern

Eine Methode zur Verbesserung der Spracherkennungsgüte in den Sprachen Kannada und Telugu.

2025-08-17T15:19:00+00:00 ― 8 min Lesedauer

Rechnen und Sprache Verbesserung der Spracherkennung im Klassenzimmer durch fortgesetztes Prétraining

Verbesserte Spracherkennung für Klassenzimmer mit fortschrittlichen Trainingstechniken verbessert das Lernen.

2025-08-05T19:06:15+00:00 ― 7 min Lesedauer

Maschinelles Lernen Fortschritte bei automatischer Spracherkennung mit Denoising-Sprachmodellen

Denoising-Sprachmodelle verbessern die Fehlerkorrektur in Sprach-erkennungssystemen mit synthetischen Daten.

2025-08-03T22:34:10+00:00 ― 7 min Lesedauer

Rechnen und Sprache Spracherkennung mit akzent-spezifischen Codebüchern verbessern

Neue Methode verbessert die Handhabung von verschiedenen Akzenten in ASR-Systemen durch spezielle Codebücher.

2025-07-22T04:29:40+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte beim Streaming-Automatischen-Spracherkennung

Das XLSR-Transducer-Modell glänzt bei der Echtzeit-Transkription mit minimalen Daten.

2025-07-21T18:46:40+00:00 ― 6 min Lesedauer

Ton Schwachstelle in Spracherkennungssystemen aufgedeckt

Forschung zeigt Risiken bei Sprachmodellen, die multitaskingfähig sind, wie Whisper.

2025-07-21T09:52:15+00:00 ― 5 min Lesedauer

Rechnen und Sprache TokenVerse: Die Analyse von Gesprächen vereinfachen

TokenVerse vereinfacht die Analyse von gesprochenen Gesprächen, indem es mehrere Aufgaben in ein einziges Modell integriert.

2025-07-21T08:15:05+00:00 ― 7 min Lesedauer

Rechnen und Sprache LearnerVoice: Fortschritt bei der Spracherkennung für Sprachlerner

Neuer Datensatz soll die Spracherkennung für Nicht-Englisch-Muttersprachler verbessern.

2025-07-21T02:35:00+00:00 ― 6 min Lesedauer

Künstliche Intelligenz Anpassung der OCR-Technologie für die Texterkennung in Spanisch

Ein Projekt zur Verbesserung der Texterkennung für spanische Dokumente mit TrOCR.

2025-07-16T15:58:30+00:00 ― 6 min Lesedauer

Ton Die Entwicklung von automatischen Spracherkennungssystemen

Ein Blick auf die Fortschritte bei Spracherkennungstechnologien und -methoden.

2025-07-15T11:21:35+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Zahlenformatierung in ASR-Transkripten

Dieser Artikel bespricht, wie man die Formatierung von Zahlen in automatischen Transkripten verbessern kann.

2025-07-14T15:55:35+00:00 ― 5 min Lesedauer

Künstliche Intelligenz Wir stellen vor: DANIEL – Ein neuer Ansatz zur Erkennung handgeschriebener Dokumente

DANIEL nutzt verschiedene Methoden für eine effiziente Extraktion aus handschriftlichen Dokumenten.

2025-07-14T08:08:54+00:00 ― 8 min Lesedauer

Computer Vision und Mustererkennung Ereigniskameras revolutionieren die Gebärdenspracheerkennung

Neue Event-Kameras verbessern die Erkennung und Übersetzung von Gebärdensprache und steigern die Genauigkeit von Kommunikationshilfen.

2025-07-11T18:39:36+00:00 ― 5 min Lesedauer

Ton Der Aufstieg der Sprachbearbeitung in digitalen Medien

Entdeck die wachsende Bedeutung von Sprachnachbearbeitung für Content Creator.

2025-07-11T00:28:35+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Fortschritte in der arabischen OCR und HWR mit Qalam

Qalam bietet verbesserte Erkennung für arabischen Text und Handschrift.

2025-07-11T00:21:30+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung von Technologien zur Erkennung von geflüsterten Sprache

Neue Methoden sollen die Erkennung von geflüsterten Sprachäusserungen in automatischen Systemen verbessern.

2025-07-08T08:30:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Spracherkennung durch Kontextgeräuscherkennung Lernen

Eine Methode zur Verbesserung der Spracherkennung in lauten Umgebungen.

2025-07-01T23:28:15+00:00 ― 7 min Lesedauer

Ton Fortschritte in der Zero-Shot Sprachumwandlungstechnologie

Neues Modell verbessert die Sprachumwandlung, besonders für geflüsterte Sprache und Echtzeitanwendungen.

2025-06-26T17:57:50+00:00 ― 6 min Lesedauer

Rechnen und Sprache Die Rolle von ASR in der Gerichtstranskription

Untersuchung der automatischen Spracherkennung in kanadischen Gerichtssystemen und deren Auswirkungen.

2025-06-24T14:48:24+00:00 ― 7 min Lesedauer

Ton StyleSpeech: Die Zukunft der Text-to-Speech-Technologie

StyleSpeech verbessert TTS-Systeme, indem es natürliche Sprachnuancen einfängt.

2025-06-24T14:08:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neuer Massstab für die Hindi-Spracherkennung

Forschung verbessert die Spracherkennung für Hindi mit verschiedenen Akzenten.

2025-06-24T05:11:42+00:00 ― 5 min Lesedauer

Rechnen und Sprache Bewertung der Genauigkeit von automatischer Spracherkennung

Ein Blick auf die Messung der Genauigkeit in Spracherkennungssystemen mit neuen Methoden.

2025-06-22T20:50:45+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung der ASR-Genauigkeit für Barrierefreiheit

Untersuchung der Leistung von automatischer Spracherkennung für taube und schwerhörige Nutzer.

2025-06-22T01:24:45+00:00 ― 12 min Lesedauer

Rechnen und Sprache Verbesserung der automatischen Spracherkennung mit Sprachmodellen

Neue Methode verbessert die ASR-Genauigkeit mit Sprachmodellen für bessere Transkriptionen.

2025-06-21T20:33:15+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung mit Lärm-unterstütztem Training verbessern

Diese Studie untersucht, wie Lärm die Sprachwahrnehmung bei Herausforderungen verbessern kann.

2025-06-19T14:18:10+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachsynthese mit DDSP

Entdeck, wie DDSP die Effizienz und Qualität der Spracherzeugung verbessert.

2025-06-18T17:15:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Herausforderungen und Fortschritte bei der Sprachübersetzung

Ein Blick auf die Komplexität und Fortschritte in der Sprach-zu-Sprach-Übersetzungstechnologie.

2025-06-18T06:12:18+00:00 ― 6 min Lesedauer

Rechnen und Sprache Wie Transkriptionsstile das Verständnis von Afroamerikanischem Englisch beeinflussen

Die Auswirkungen von Transkriptionsstilen auf die Genauigkeit des Afroamerikanischen Englisch erkunden.

2025-06-17T09:16:12+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung für seltene Namen verbessern

Diese Methode verbessert die Erkennungsgenauigkeit für seltene Namen in Sprachausgaben.

2025-06-16T03:42:40+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Spracherkennung im Klassenzimmer durch kontinuierliches Pretraining

Ein neuer Ansatz verbessert ASR-Systeme für eine bessere Kommunikation im Klassenzimmer.

2025-06-12T18:44:20+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprachrestaurierung: MaskSR2

MaskSR2 verbessert die Sprachklarheit und -qualität mit innovativen Techniken.

2025-06-11T07:06:40+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Text-zu-Sprache-Technologie

Neue Methode verbessert die Sprachgenerierung in Qualität und Effizienz.

2025-06-07T10:48:10+00:00 ― 4 min Lesedauer

Kryptographie und Sicherheit Neue Methode deckt Schwachstellen von Smartphone-Sensoren auf

Forschung zeigt Risiken in den Bewegungssensoren von Smartphones, was Datenschutzbedenken aufwirft.

2025-06-07T00:09:24+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschrittliche medizinische Kommunikation mit ASR-Technologie

Das MultiMed-Projekt verbessert die automatische Spracherkennung für bessere Kommunikation im Gesundheitswesen.

2025-06-05T06:10:15+00:00 ― 6 min Lesedauer