Neuste Artikel für Spracherkennung

Audio- und Sprachverarbeitung Modulare Domänenanpassung: Ein neuer Ansatz für die Spracherkennung

MDA verbessert die Spracherkennung, indem es Modelle für bestimmte Datenbereiche optimiert.

2025-11-05T01:24:10+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung für alle Sprecher verbessern

Eine neue Methode soll ASR-Systeme für Menschen mit Dysarthrie verbessern.

2025-11-04T22:58:25+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte beim Lernen gesprochener Wörter mit MAMLCon

Eine neue Methode verbessert das Verständnis von gesprochenen Befehlen durch Computer mit weniger Beispielen.

2025-11-04T22:09:50+00:00 ― 5 min Lesedauer

Rechnen und Sprache Verbesserung der Sprecher-Diarisation durch Wortanalyse

Die Verbesserung der Sprecheridentifikation durch die Kombination von Klang und gesprochenen Worten in Audio.

2025-11-04T18:55:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der aktiven Sprechererkennungstechnologie

Ein neues System verbessert die Erkennung aktiver Sprecher mit Hilfe von audio- und visuellen Hinweisen.

2025-11-04T16:29:45+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung allgemeiner Audio-Modelle für Sprachaufgaben

Eine neue Methode verbessert allgemeine Audio-Modelle für effektive Spracherkennung.

2025-11-04T05:58:10+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritt im Verständnis gesprochener Sprache durch kontinuierliches Lernen

Diese Forschung beschäftigt sich mit dem Vergessen in KI durch kontinuierliches Lernen im Verständnis gesprochener Sprache.

2025-11-04T00:18:05+00:00 ― 8 min Lesedauer

Ton Entwicklung von empathischen Sprachassistenten mit CALLS

CALLS hat das Ziel, die Fähigkeit von Sprachassistenten zu verbessern, Kundeninteraktionen zu managen.

2025-11-03T19:26:35+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung mit schwach überwachtem Lernen

Neue Methoden nutzen die Sprecheridentität, um die Spracherkennung zu verbessern.

2025-11-03T01:37:45+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei der slowakischen Spracherkennung mit tschechischem Wissen

Die Nutzung von Transferlernen aus tschechischen Modellen verbessert die Genauigkeit der slowakischen Spracherkennung.

2025-11-02T21:19:36+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Text-zu-Sprache für Turksprachen

TTS-Systeme für weniger bekannte Turksprachen mit kasachischen Daten erstellen.

2025-11-02T18:20:30+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Spracherkennung mit S4M

Ein neues Modell verbessert die Sprachisolierung in lauten Umgebungen.

2025-11-02T10:14:40+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte in der Lippenlesetechnologie mit OpenSR

OpenSR verbessert Lippenlese-Modelle mit Audiodaten für mehr Genauigkeit und Zugänglichkeit.

2025-11-01T17:48:30+00:00 ― 7 min Lesedauer

Rechnen und Sprache Die Verbesserung der Spracherkennung durch Korrektur von Ungereimtheiten

Forschung zeigt ein Modell, um die Korrektur von Unflüssigkeiten in Spracherkennungssystemen zu verbessern.

2025-11-01T17:32:42+00:00 ― 6 min Lesedauer

Mensch-Computer-Interaktion Die Auswirkungen von Sprachmissverständnissen auf das Lernen mit lehrbaren Agenten

Eine Studie darüber, wie Sprachfehler das Lernen mit lehrbaren Agenten beeinflussen.

2025-11-01T15:42:06+00:00 ― 6 min Lesedauer

Ton Herausforderungen bei der Spracherkennung mit enharmonischen Wörtern angehen

Eine neue Methode verbessert die Spracherkennung für ähnlich klingende Namen.

2025-11-01T14:48:40+00:00 ― 6 min Lesedauer

Maschinelles Lernen Fortschritte im Multi-Task Selbstüberwachten Lernen

Neue Methoden verbessern die Flexibilität und Leistung von Modellen bei Audioaufgaben.

2025-11-01T08:20:00+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte im Verstehen gesprochener Sprache mit diskreten Einheiten

Neue Methode verbessert das Verständnis gesprochener Sprache, ohne schriftliche Transkripte zu benötigen.

2025-11-01T00:14:10+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei der Übersetzung für unterrepräsentierte Sprachen

Die Übersetzungstechnologie für Sprachen mit wenig Ressourcen wie Tamasheq und Quechua verbessern.

2025-10-31T16:39:36+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neuer Massstab für Sprachlernmodelle

BabySLM bewertet, wie gut Maschinen lernen, Sprache basierend auf der Sprache von Kindern zu verstehen.

2025-10-31T11:33:20+00:00 ― 7 min Lesedauer

Ton Fortschritte bei stillen Sprachschnittstellen

Verbesserung von Systemen zur stillen Spracherkennung mit neuen Techniken.

2025-10-31T07:13:55+00:00 ― 5 min Lesedauer

Ton Fortschritte im schwach überwachten Keyword Spotting

Eine neue Methode zum Trainieren von Keyword-Spotting-Modellen mit schwacher Aufsicht in lauten Umgebungen.

2025-10-31T01:33:50+00:00 ― 7 min Lesedauer

Ton Verbesserung von RNN-T-Modellen mit Reinforcement Learning

Ein neuer Ansatz verbessert die RNN-T-Leistung bei automatischer Spracherkennung.

2025-10-30T19:53:45+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei mehrsprachigen Spracherkennungssystemen

Erforschen von Methoden zur Verbesserung der mehrsprachigen Spracherkennung in indischen Sprachen.

2025-10-30T10:10:45+00:00 ― 6 min Lesedauer

Ton Fortschrittliche Sprachaktivitätserkennung mit SVVAD

Entdecke, wie SVVAD die Spracherkennung verbessert, um die Sprecherverifizierung zu optimieren.

2025-10-30T09:22:10+00:00 ― 5 min Lesedauer

Ton Fortschritte in der automatischen Aussprachebewertung

Eine neue Methode verbessert das Aussprache-Feedback für Sprachlerner.

2025-10-30T08:33:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Anpassungsfähigkeit bei Spracherkennungsmodellen messen

Ein neues Rahmenwerk bewertet, wie gut Sprachmodelle sich an bestimmte Aufgaben anpassen.

2025-10-30T06:56:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der mehrsprachigen Sprachübersetzung

Forschung verbessert die mehrsprachige Sprachübersetzung mit semantischem Wissen.

2025-10-30T06:07:50+00:00 ― 4 min Lesedauer

Hardware-Architektur Vorstellung von Sparq: Eine neue Verarbeitungslösung für quantisierte neuronale Netzwerke

Sparq will die Leistung in quantisierten neuronalen Netzwerken mit geringeren Ressourcenbedürfnissen verbessern.

2025-10-30T00:45:54+00:00 ― 4 min Lesedauer

Ton Verlangsamung bei der Spracherkennung: Ein näherer Blick auf SlothSpeech

SlothSpeech zeigt Schwächen in Spracherkennungssystemen und bremst sie richtig aus.

2025-10-29T17:10:30+00:00 ― 5 min Lesedauer

Ton EmoMix: Fortschrittliche emotionale Sprachsynthese

EmoMix ermöglicht es, Sprache zu kreieren, die gemischte Emotionen mit präziser Intensität ausdrückt.

2025-10-29T13:56:10+00:00 ― 5 min Lesedauer

Rechnen und Sprache HK-LegiCoST: Die Brücke zwischen gesprochenem und geschriebenem Kantonesisch

Ein neuer Korpus für die Übersetzung von Kantonesisch-Audio in englischen Text.

2025-10-29T11:59:36+00:00 ― 5 min Lesedauer

Ton MW-MAE: Ein neuer Ansatz fürs Audio-Lernen

Entdecke die innovative Multi-Window Masked Autoencoder Methode für verbessertes Audio-Processing.

2025-10-29T11:30:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der ASR-Technologie durch sequenzielle allgemeine Entropieminimierung

Ein neues Verfahren verbessert automatische Spracherkennungssysteme für mehr Genauigkeit und Anpassungsfähigkeit.

2025-10-29T02:36:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Die Verbesserung der Spracherkennung durch kontextuelle Beeinflussung

Kontextbasierte Biasierung verbessert ASR-Systeme und steigert die Genauigkeit bei speziellen Aufgaben.

2025-10-29T00:58:50+00:00 ― 6 min Lesedauer

Ton Neue Methode zur Verbesserung der Erkennung von Sprachpronunciation

Diese Studie stellt ein neues System vor, um Aussprachefehler bei Sprachlernern zu erkennen.

2025-10-28T21:44:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschrittliche mehrsprachige Spracherkennung mit DistilXLSR

Ein neues Modell reduziert die Grösse und verbessert die mehrsprachige Spracherkennung.

2025-10-28T11:12:55+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei der Spracherkennung für mehrere Sprecher

Ein neues System verbessert die Spracherkennung in Umgebungen mit mehreren Sprechern.

2025-10-28T00:41:20+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Spracheverarbeitung mit visuellem Lernen kombinieren

Diese Studie untersucht die Vorteile der Kombination von Sprachverarbeitung mit visuellen Daten.

2025-10-27T20:38:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Bewertung von Whispers Leistung bei arabischen Dialekten

Ein Blick darauf, wie Whisper mit verschiedenen arabischen Dialekten und Akzenten umgeht.

2025-10-27T13:21:10+00:00 ― 5 min Lesedauer