Diese Studie befasst sich mit den Herausforderungen, genaue medizinische Begriffe aus geräuschvollen Audios zu erfassen.
― 8 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Diese Studie befasst sich mit den Herausforderungen, genaue medizinische Begriffe aus geräuschvollen Audios zu erfassen.
― 8 min Lesedauer
Eine neue Methode integriert akustische Informationen in Sprachmodelle für eine bessere Spracherkennung.
― 9 min Lesedauer
LLMs verbessern die Genauigkeit bei medizinischen Transkriptionen, was der Patientenversorgung zugutekommt.
― 7 min Lesedauer
Ein neues System, um die Leistung von Audio-Codecs in verschiedenen Anwendungen zu bewerten.
― 7 min Lesedauer
Eine Übersicht über ASR und seine Fortschritte in modernen Anwendungen.
― 4 min Lesedauer
KI verbessert Cochlea-Implantate für besseres Hören und Kommunizieren in schwierigen Umgebungen.
― 7 min Lesedauer
Eine neue Methode verbessert die Sprachauswertung mit kompletten Aufnahmen.
― 7 min Lesedauer
Ein neues Framework zur Bewertung von Grundmodellen bei Sprachaufgaben.
― 8 min Lesedauer
Eine neue Methode erstellt direkt Untertitel und verbessert die Barrierefreiheit für verschiedene Zielgruppen.
― 9 min Lesedauer
Diese Studie bewertet die Leistung von ASR-Systemen bei Personen, die stottern.
― 8 min Lesedauer
Ein universeller Audio-Clip kann fortgeschrittene ASR-Modelle wie Whisper stummschalten.
― 6 min Lesedauer
Verbesserte Spracherkennung für Klassenzimmer mit fortschrittlichen Trainingstechniken verbessert das Lernen.
― 7 min Lesedauer
Das neue Modell VPIDM verbessert die Sprachverständlichkeit in lauten Umgebungen.
― 6 min Lesedauer
Ein neues Modell verbessert die Spracherkennung mit mehreren Dekodierungs-Methoden.
― 7 min Lesedauer
mHuBERT-147 verarbeitet Sprache effizient in mehreren Sprachen.
― 5 min Lesedauer
Die Genauigkeit beim Transkribieren von wissenschaftlichen Präsentationen durch Sprach- und visuelle Integration verbessern.
― 9 min Lesedauer
Eine Studie über die Übersetzung von nigerianischem Englisch für bessere Zugänglichkeit in Nollywood-Filmen.
― 6 min Lesedauer
Neues Modell verbessert die Sprach-zu-Text-Übersetzung mithilfe grosser Sprachmodelle.
― 7 min Lesedauer
Die Verbesserung der Technologie zur Anonymisierung von Sprechern in neun Sprachen, um die Privatsphäre zu gewährleisten.
― 6 min Lesedauer
Neue Methode verbessert die Handhabung von verschiedenen Akzenten in ASR-Systemen durch spezielle Codebücher.
― 6 min Lesedauer
Diese Studie bewertet Sprachtechnologie in ressourcenarmen Sprachen wie Tunesisch-Arabisch.
― 5 min Lesedauer
Mamba zeigt vielversprechende Ergebnisse gegen Transformer bei Sprachaufgaben, besonders bei langen Eingaben.
― 5 min Lesedauer
Lern, wie Kontext die Genauigkeit der automatischen Spracherkennung und die Wörterkennung verbessert.
― 5 min Lesedauer
Die Forschung präsentiert neue Methoden zur Bewertung von Spracherkennungssystemen in Polnisch.
― 6 min Lesedauer
Eine Studie zur Verbesserung der Transkriptionsgenauigkeit durch verbessertes Prompt-Design.
― 6 min Lesedauer
Ein neues Modell soll die Qualität der Sprachübersetzung durch integrierte Systeme verbessern.
― 5 min Lesedauer
Neue Methoden sollen die Erkennung von geflüsterten Sprachäusserungen in automatischen Systemen verbessern.
― 6 min Lesedauer
KI-Modelle verbessern die Genauigkeit von Sprach-zu-Text-Umwandlungen.
― 5 min Lesedauer
Forschung verbessert ASR-Systeme mit Sprachmodellen für bessere Genauigkeit.
― 7 min Lesedauer
Ein neues System verbessert die Spracherkennung, indem es kontextuelle Schlüsselwörter für genauere Ergebnisse verwendet.
― 6 min Lesedauer
Neue Methoden verbessern ASR-Modelle für mehrere Sprachen und bewahren das vorhandene Wissen.
― 6 min Lesedauer
Untersuchung der automatischen Spracherkennung in kanadischen Gerichtssystemen und deren Auswirkungen.
― 7 min Lesedauer
Forschung zeigt, wie LLMs die automatische Spracherkennung in der japanischen Sprache verbessern.
― 6 min Lesedauer
SALSA verbessert die Spracherkennung für Sprachen mit wenig Ressourcen, indem es ASR- und Sprachmodelle integriert.
― 6 min Lesedauer
Untersuchung der Leistung von automatischer Spracherkennung für taube und schwerhörige Nutzer.
― 12 min Lesedauer
Eine neue Methode nutzt Sprachdaten, um Autismusbewertungen zu verbessern.
― 6 min Lesedauer
Untersuchung der neuesten Entwicklungen bei generativen Modellen in verschiedenen Bereichen.
― 6 min Lesedauer
Ein neues Modell kombiniert Spracherkennung und Entitätserkennung für bessere Ergebnisse.
― 6 min Lesedauer
Ein neuer Ansatz verbessert ASR-Systeme für eine bessere Kommunikation im Klassenzimmer.
― 5 min Lesedauer
Dieser Artikel beleuchtet, wie unterschiedliche Eingaben die Spracherkennung verbessern können.
― 5 min Lesedauer