MDA verbessert die Spracherkennung, indem es Modelle für bestimmte Datenbereiche optimiert.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
MDA verbessert die Spracherkennung, indem es Modelle für bestimmte Datenbereiche optimiert.
― 6 min Lesedauer
Eine neue Methode soll ASR-Systeme für Menschen mit Dysarthrie verbessern.
― 5 min Lesedauer
Eine neue Methode verbessert das Verständnis von gesprochenen Befehlen durch Computer mit weniger Beispielen.
― 5 min Lesedauer
Die Verbesserung der Sprecheridentifikation durch die Kombination von Klang und gesprochenen Worten in Audio.
― 6 min Lesedauer
Ein neues System verbessert die Erkennung aktiver Sprecher mit Hilfe von audio- und visuellen Hinweisen.
― 5 min Lesedauer
Eine neue Methode verbessert allgemeine Audio-Modelle für effektive Spracherkennung.
― 7 min Lesedauer
Diese Forschung beschäftigt sich mit dem Vergessen in KI durch kontinuierliches Lernen im Verständnis gesprochener Sprache.
― 8 min Lesedauer
CALLS hat das Ziel, die Fähigkeit von Sprachassistenten zu verbessern, Kundeninteraktionen zu managen.
― 5 min Lesedauer
Neue Methoden nutzen die Sprecheridentität, um die Spracherkennung zu verbessern.
― 5 min Lesedauer
Die Nutzung von Transferlernen aus tschechischen Modellen verbessert die Genauigkeit der slowakischen Spracherkennung.
― 4 min Lesedauer
TTS-Systeme für weniger bekannte Turksprachen mit kasachischen Daten erstellen.
― 5 min Lesedauer
Ein neues Modell verbessert die Sprachisolierung in lauten Umgebungen.
― 5 min Lesedauer
OpenSR verbessert Lippenlese-Modelle mit Audiodaten für mehr Genauigkeit und Zugänglichkeit.
― 7 min Lesedauer
Forschung zeigt ein Modell, um die Korrektur von Unflüssigkeiten in Spracherkennungssystemen zu verbessern.
― 6 min Lesedauer
Eine Studie darüber, wie Sprachfehler das Lernen mit lehrbaren Agenten beeinflussen.
― 6 min Lesedauer
Eine neue Methode verbessert die Spracherkennung für ähnlich klingende Namen.
― 6 min Lesedauer
Neue Methoden verbessern die Flexibilität und Leistung von Modellen bei Audioaufgaben.
― 5 min Lesedauer
Neue Methode verbessert das Verständnis gesprochener Sprache, ohne schriftliche Transkripte zu benötigen.
― 6 min Lesedauer
Die Übersetzungstechnologie für Sprachen mit wenig Ressourcen wie Tamasheq und Quechua verbessern.
― 6 min Lesedauer
BabySLM bewertet, wie gut Maschinen lernen, Sprache basierend auf der Sprache von Kindern zu verstehen.
― 7 min Lesedauer
Verbesserung von Systemen zur stillen Spracherkennung mit neuen Techniken.
― 5 min Lesedauer
Eine neue Methode zum Trainieren von Keyword-Spotting-Modellen mit schwacher Aufsicht in lauten Umgebungen.
― 7 min Lesedauer
Ein neuer Ansatz verbessert die RNN-T-Leistung bei automatischer Spracherkennung.
― 6 min Lesedauer
Erforschen von Methoden zur Verbesserung der mehrsprachigen Spracherkennung in indischen Sprachen.
― 6 min Lesedauer
Entdecke, wie SVVAD die Spracherkennung verbessert, um die Sprecherverifizierung zu optimieren.
― 5 min Lesedauer
Eine neue Methode verbessert das Aussprache-Feedback für Sprachlerner.
― 6 min Lesedauer
Ein neues Rahmenwerk bewertet, wie gut Sprachmodelle sich an bestimmte Aufgaben anpassen.
― 6 min Lesedauer
Forschung verbessert die mehrsprachige Sprachübersetzung mit semantischem Wissen.
― 4 min Lesedauer
Sparq will die Leistung in quantisierten neuronalen Netzwerken mit geringeren Ressourcenbedürfnissen verbessern.
― 4 min Lesedauer
SlothSpeech zeigt Schwächen in Spracherkennungssystemen und bremst sie richtig aus.
― 5 min Lesedauer
EmoMix ermöglicht es, Sprache zu kreieren, die gemischte Emotionen mit präziser Intensität ausdrückt.
― 5 min Lesedauer
Ein neuer Korpus für die Übersetzung von Kantonesisch-Audio in englischen Text.
― 5 min Lesedauer
Entdecke die innovative Multi-Window Masked Autoencoder Methode für verbessertes Audio-Processing.
― 5 min Lesedauer
Ein neues Verfahren verbessert automatische Spracherkennungssysteme für mehr Genauigkeit und Anpassungsfähigkeit.
― 6 min Lesedauer
Kontextbasierte Biasierung verbessert ASR-Systeme und steigert die Genauigkeit bei speziellen Aufgaben.
― 6 min Lesedauer
Diese Studie stellt ein neues System vor, um Aussprachefehler bei Sprachlernern zu erkennen.
― 6 min Lesedauer
Ein neues Modell reduziert die Grösse und verbessert die mehrsprachige Spracherkennung.
― 6 min Lesedauer
Ein neues System verbessert die Spracherkennung in Umgebungen mit mehreren Sprechern.
― 6 min Lesedauer
Diese Studie untersucht die Vorteile der Kombination von Sprachverarbeitung mit visuellen Daten.
― 6 min Lesedauer
Ein Blick darauf, wie Whisper mit verschiedenen arabischen Dialekten und Akzenten umgeht.
― 5 min Lesedauer