Neuste Artikel für ASR

Kryptographie und Sicherheit Neue Backdoor-Angriffsmethode für grosse ML-Modelle

Ein ressourcenschonender Ansatz für Backdoor-Angriffe auf fortgeschrittene Machine-Learning-Modelle.

2025-08-07T00:01:36+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte im Federated Learning für Spracherkennung

Frühzeitige Ausstiegsmodelle für effektives föderiertes Lernen in ASR-Systemen nutzen.

2025-08-06T09:48:24+00:00 ― 9 min Lesedauer

Maschinelles Lernen Fortschritte bei automatischer Spracherkennung mit Denoising-Sprachmodellen

Denoising-Sprachmodelle verbessern die Fehlerkorrektur in Sprach-erkennungssystemen mit synthetischen Daten.

2025-08-03T22:34:10+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachverbesserung mit VPIDM

Das neue Modell VPIDM verbessert die Sprachverständlichkeit in lauten Umgebungen.

2025-08-03T16:54:05+00:00 ― 6 min Lesedauer

Robotik Fortschritte bei Desktop-Robotern

Eine Studie über Desktop-Roboter, die natürliche Sprach- und Bilderkennungstechnologien nutzen.

2025-08-03T13:39:45+00:00 ― 13 min Lesedauer

Rechnen und Sprache Die Stabilität von Sprachmodellen gegen Angriffe verbessern

Neue Methoden verbessern die Vorhersagen von Sprachmodellen unter unterschiedlichen Eingabebedingungen.

2025-08-03T07:56:30+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Einführung des 4D-Modells in der Spracherkennung

Ein neues Modell verbessert die Spracherkennung mit mehreren Dekodierungs-Methoden.

2025-08-01T01:44:35+00:00 ― 7 min Lesedauer

Künstliche Intelligenz Neuer Ansatz zur Bewertung multilingualer Modelle

Eine frische Methode zum Testen der Sicherheit von Sprachmodellen und ihrer mehrsprachigen Fähigkeiten.

2025-07-28T02:37:54+00:00 ― 8 min Lesedauer

Künstliche Intelligenz Backdoor-Angriffe in Sprachmodellen abmildern

Eine neue Verteidigungsstrategie für LLMs gegen Backdoor-Angriffe.

2025-07-26T23:22:36+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung der Sprachfehlerkorrektur in ASR-Systemen

Eine neue Methode kombiniert akustische Merkmale und Vertrauenswerte für bessere Fehlerkorrektur.

2025-07-25T20:45:15+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung der chinesischen Spracherkennung durch Pinyin-Regulierung

Diese Studie präsentiert einen Datensatz und eine Methode, um die Genauigkeit der chinesischen ASR mithilfe von Pinyin zu verbessern.

2025-07-25T07:47:55+00:00 ― 7 min Lesedauer

Rechnen und Sprache Fortschritt der Sprachtechnologie für tunesisches Arabisch

Diese Studie bewertet Sprachtechnologie in ressourcenarmen Sprachen wie Tunesisch-Arabisch.

2025-07-21T12:18:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Wir stellen vor: Emilia – Ein neues Datenset zur Sprachgenerierung

Emilia stellt ein vielfältiges Datenset zur Verfügung, um Sprachgenerierungsmodelle zu verbessern.

2025-07-20T09:34:45+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Zahlenformatierung in ASR-Transkripten

Dieser Artikel bespricht, wie man die Formatierung von Zahlen in automatischen Transkripten verbessern kann.

2025-07-14T15:55:35+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte in der Sprachübersetzungstechnologie

Ein neues Modell soll die Qualität der Sprachübersetzung durch integrierte Systeme verbessern.

2025-07-11T02:54:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung mit KI- Zusammenarbeit verbessern

KI-Modelle verbessern die Genauigkeit von Sprach-zu-Text-Umwandlungen.

2025-07-07T09:50:10+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung der Spracherkennung für spezielle Begriffe

Forschung verbessert ASR-Systeme mit Sprachmodellen für bessere Genauigkeit.

2025-07-06T20:41:12+00:00 ― 7 min Lesedauer

Rechnen und Sprache Verbesserung der Spracherkennung durch Kontextgeräuscherkennung Lernen

Eine Methode zur Verbesserung der Spracherkennung in lauten Umgebungen.

2025-07-01T23:28:15+00:00 ― 7 min Lesedauer

Multimedia Fortschritte bei der E-Commerce-Produktabfrage

Eine neue Methode verbessert Produktsuchen über verschiedene Medienformate hinweg.

2025-07-01T08:45:24+00:00 ― 6 min Lesedauer

Künstliche Intelligenz SAGE-RT: Eine neue Methode zur Sicherheit von Sprachmodellen

SAGE-RT erstellt synthetische Daten, um die Sicherheitsbewertungen von Sprachmodellen zu verbessern.

2025-06-28T06:37:42+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Sprachqualitätsbewertung mithilfe von Technologie

Neue Methoden verbessern die Qualitätsbewertung der Stimme für Patienten mit Stimmproblemen.

2025-06-26T07:26:15+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung der Genauigkeit von automatischer Spracherkennung

Ein Blick auf die Messung der Genauigkeit in Spracherkennungssystemen mit neuen Methoden.

2025-06-22T20:50:45+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der automatischen Spracherkennung mit Sprachmodellen

Neue Methode verbessert die ASR-Genauigkeit mit Sprachmodellen für bessere Transkriptionen.

2025-06-21T20:33:15+00:00 ― 4 min Lesedauer

Ton Fortschritte bei der Erkennung von Sprache von mehreren Sprechern

Neue Methoden verbessern die Spracherkennung in schwierigen Situationen mit mehreren Sprechern.

2025-06-20T21:52:55+00:00 ― 5 min Lesedauer

Rechnen und Sprache Gesprächsdaten zur Autismusdiagnose nutzen

Eine neue Methode nutzt Sprachdaten, um Autismusbewertungen zu verbessern.

2025-06-19T19:12:12+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Verbesserung der automatischen Spracherkennung durch Modularität

Die Forschung an modularen ASR-Systemen zielt darauf ab, die Leistung in lauten Umgebungen zu verbessern.

2025-06-16T17:28:35+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung mit Sortformer

Sortformer integriert Sprecherdiarisierung und ASR für eine verbesserte Audioverarbeitung.

2025-06-15T09:05:15+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Spracherkennung in Mehrsprecher-Settings

Ein neuer Ansatz verbessert die ASR, indem er sich auf bestimmte Sprecherdetails konzentriert.

2025-06-11T17:38:15+00:00 ― 6 min Lesedauer

Ton ESPnet-EZ: Sprachmodell-Entwicklung vereinfachen

Ein einfach zu bedienendes Tool, um Sprachmodelle ohne komplexen Code fein abzustimmen.

2025-06-11T15:12:30+00:00 ― 7 min Lesedauer

Robotik Die Verbesserung der Sprachsteuerung von Robotern für bessere Zusammenarbeit

Ein neues Modell hilft Robotern, unklare Anweisungen von Menschen effektiver zu folgen.

2025-06-11T14:53:18+00:00 ― 6 min Lesedauer

Ton Fortschritte in der automatischen Spracherkennung mit CADA-GAN

CADA-GAN verbessert die Leistung von ASR-Systemen in verschiedenen Aufnahmeumgebungen.

2025-06-07T23:45:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der Spracherkennung mit impliziten Techniken

Eine neue Methode verbessert die Sprachinteraktionen, indem sie Erkennungs- und Antwortprozesse integriert.

2025-06-06T03:21:12+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Evaluierung von neuralen Audio-Codecs: Einblicke aus der Codec-SUPERB-Herausforderung

Ein Blick auf die Ergebnisse der Codec-SUPERB-Challenge und die Leistungskennzahlen der Codecs.

2025-06-05T06:58:50+00:00 ― 5 min Lesedauer

Rechnen und Sprache Innovative Spracherkennung für die Malasar-Sprache

Ein Projekt verbessert die Spracherkennung für die Malasar-Sprache mit Tamil-Ressourcen.

2025-05-23T02:48:37+00:00 ― 5 min Lesedauer

Ton Mamba: Fortschritt bei der Spracherkennungstechnologie

Mamba verbessert die Spracherkennung mit Schnelligkeit und Genauigkeit und verändert die Interaktion mit Geräten.

2025-05-19T22:39:54+00:00 ― 4 min Lesedauer

Rechnen und Sprache Bridging Bangla Dialekte: Ein einheitlicher Ansatz

Dieses Projekt hat zum Ziel, die Bangla-Dialekte zu standardisieren, damit die Kommunikation klarer wird.

2025-05-12T19:19:18+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung United-MedASR: Verbesserung der medizinischen Spracherkennung

Ein neues ASR-System verbessert die medizinische Spracherkennung für eine präzise Patientenversorgung.

2025-04-30T00:58:50+00:00 ― 6 min Lesedauer

Rechnen und Sprache Eine neue Methode zur sprecherattributierten Spracherkennung

Verfolgt Sprecher in mehrsprachigen Umgebungen effizient mit automatischer Spracherkennung.

2025-04-20T15:33:18+00:00 ― 7 min Lesedauer

Rechnen und Sprache Spracherkennung mit Pinyin verbessern

Neues Modell verbessert die Genauigkeit der chinesischen Spracherkennung erheblich.

2025-04-15T08:10:03+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neo-Aramäisch retten: Eine Sprache in Gefahr

Bemühungen, die bedrohte neo-arameische Sprache zu dokumentieren und zu erhalten.

2025-04-13T14:26:15+00:00 ― 6 min Lesedauer