Ein ressourcenschonender Ansatz für Backdoor-Angriffe auf fortgeschrittene Machine-Learning-Modelle.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein ressourcenschonender Ansatz für Backdoor-Angriffe auf fortgeschrittene Machine-Learning-Modelle.
― 6 min Lesedauer
Frühzeitige Ausstiegsmodelle für effektives föderiertes Lernen in ASR-Systemen nutzen.
― 9 min Lesedauer
Denoising-Sprachmodelle verbessern die Fehlerkorrektur in Sprach-erkennungssystemen mit synthetischen Daten.
― 7 min Lesedauer
Das neue Modell VPIDM verbessert die Sprachverständlichkeit in lauten Umgebungen.
― 6 min Lesedauer
Eine Studie über Desktop-Roboter, die natürliche Sprach- und Bilderkennungstechnologien nutzen.
― 13 min Lesedauer
Neue Methoden verbessern die Vorhersagen von Sprachmodellen unter unterschiedlichen Eingabebedingungen.
― 7 min Lesedauer
Ein neues Modell verbessert die Spracherkennung mit mehreren Dekodierungs-Methoden.
― 7 min Lesedauer
Eine frische Methode zum Testen der Sicherheit von Sprachmodellen und ihrer mehrsprachigen Fähigkeiten.
― 8 min Lesedauer
Eine neue Verteidigungsstrategie für LLMs gegen Backdoor-Angriffe.
― 5 min Lesedauer
Eine neue Methode kombiniert akustische Merkmale und Vertrauenswerte für bessere Fehlerkorrektur.
― 5 min Lesedauer
Diese Studie präsentiert einen Datensatz und eine Methode, um die Genauigkeit der chinesischen ASR mithilfe von Pinyin zu verbessern.
― 7 min Lesedauer
Diese Studie bewertet Sprachtechnologie in ressourcenarmen Sprachen wie Tunesisch-Arabisch.
― 5 min Lesedauer
Emilia stellt ein vielfältiges Datenset zur Verfügung, um Sprachgenerierungsmodelle zu verbessern.
― 6 min Lesedauer
Dieser Artikel bespricht, wie man die Formatierung von Zahlen in automatischen Transkripten verbessern kann.
― 5 min Lesedauer
Ein neues Modell soll die Qualität der Sprachübersetzung durch integrierte Systeme verbessern.
― 5 min Lesedauer
KI-Modelle verbessern die Genauigkeit von Sprach-zu-Text-Umwandlungen.
― 5 min Lesedauer
Forschung verbessert ASR-Systeme mit Sprachmodellen für bessere Genauigkeit.
― 7 min Lesedauer
Eine Methode zur Verbesserung der Spracherkennung in lauten Umgebungen.
― 7 min Lesedauer
Eine neue Methode verbessert Produktsuchen über verschiedene Medienformate hinweg.
― 6 min Lesedauer
SAGE-RT erstellt synthetische Daten, um die Sicherheitsbewertungen von Sprachmodellen zu verbessern.
― 6 min Lesedauer
Neue Methoden verbessern die Qualitätsbewertung der Stimme für Patienten mit Stimmproblemen.
― 6 min Lesedauer
Ein Blick auf die Messung der Genauigkeit in Spracherkennungssystemen mit neuen Methoden.
― 6 min Lesedauer
Neue Methode verbessert die ASR-Genauigkeit mit Sprachmodellen für bessere Transkriptionen.
― 4 min Lesedauer
Neue Methoden verbessern die Spracherkennung in schwierigen Situationen mit mehreren Sprechern.
― 5 min Lesedauer
Eine neue Methode nutzt Sprachdaten, um Autismusbewertungen zu verbessern.
― 6 min Lesedauer
Die Forschung an modularen ASR-Systemen zielt darauf ab, die Leistung in lauten Umgebungen zu verbessern.
― 4 min Lesedauer
Sortformer integriert Sprecherdiarisierung und ASR für eine verbesserte Audioverarbeitung.
― 5 min Lesedauer
Ein neuer Ansatz verbessert die ASR, indem er sich auf bestimmte Sprecherdetails konzentriert.
― 6 min Lesedauer
Ein einfach zu bedienendes Tool, um Sprachmodelle ohne komplexen Code fein abzustimmen.
― 7 min Lesedauer
Ein neues Modell hilft Robotern, unklare Anweisungen von Menschen effektiver zu folgen.
― 6 min Lesedauer
CADA-GAN verbessert die Leistung von ASR-Systemen in verschiedenen Aufnahmeumgebungen.
― 6 min Lesedauer
Eine neue Methode verbessert die Sprachinteraktionen, indem sie Erkennungs- und Antwortprozesse integriert.
― 5 min Lesedauer
Ein Blick auf die Ergebnisse der Codec-SUPERB-Challenge und die Leistungskennzahlen der Codecs.
― 5 min Lesedauer
Ein Projekt verbessert die Spracherkennung für die Malasar-Sprache mit Tamil-Ressourcen.
― 5 min Lesedauer
Mamba verbessert die Spracherkennung mit Schnelligkeit und Genauigkeit und verändert die Interaktion mit Geräten.
― 4 min Lesedauer
Dieses Projekt hat zum Ziel, die Bangla-Dialekte zu standardisieren, damit die Kommunikation klarer wird.
― 6 min Lesedauer
Ein neues ASR-System verbessert die medizinische Spracherkennung für eine präzise Patientenversorgung.
― 6 min Lesedauer
Verfolgt Sprecher in mehrsprachigen Umgebungen effizient mit automatischer Spracherkennung.
― 7 min Lesedauer
Neues Modell verbessert die Genauigkeit der chinesischen Spracherkennung erheblich.
― 6 min Lesedauer
Bemühungen, die bedrohte neo-arameische Sprache zu dokumentieren und zu erhalten.
― 6 min Lesedauer