Neuste Artikel für Spracherkennung

Rechnen und Sprache Fortschritte bei der Erkennung von Sprechakten in Bengali

Eine neue Methode verbessert die Erkennung von Sprechakten in Bengali durch Audio- und Textanalyse.

2025-10-27T10:55:25+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei der Spracherkennung mit dem LASR-Framework

Ein neuer Ansatz verbessert die Sprach- und Sprachidentifikation mit selbstüberwachtem Lernen und Labels.

2025-10-26T08:12:10+00:00 ― 6 min Lesedauer

Ton Verbesserung der Spracherkennung für arabische Dysarthrie

Eine neue Methode verbessert die Spracherkennung für dysarthrische arabische Sprecher.

2025-10-26T07:23:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Innovatives Spracherkennungstool für ressourcenschwache Sprachen

Allophant verbessert die Phonemerkennung für Sprachen mit wenig Daten.

2025-10-26T06:35:00+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Wortzeitbestimmung in Spracherkennungssystemen

Verbesserung der Schätzung der Worttiming in Spracherkennungssystemen für bessere Genauigkeit.

2025-10-26T01:43:30+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Spracherkennung mit fortgeschrittenen Modellen verbessern

Neue Methoden verbessern die Sprachverarbeitung in Sprachmodellen.

2025-10-26T00:54:55+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Alternative Teleskopverschiebung: Eine neue Methode zur Ausrichtung multimodaler Daten

Entdecke eine neue Methode, um verschiedene Datentypen effektiv zu kombinieren.

2025-10-25T22:40:24+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte im selbstüberwachten Lernen für Spracherkennung

Selbstüberwachende Modelle zeigen Einblicke in phonetische und phonemische Unterschiede in der Sprache.

2025-10-25T10:20:25+00:00 ― 5 min Lesedauer

Neurowissenschaften Untersuchung der Gehirnreaktionen auf Sprache: Wichtige Erkenntnisse

Forschung zeigt, wie unser Gehirn Spracheigenschaften beim Verstehen verfolgt.

2025-10-25T09:40:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der gesprochenen Named Entity Erkennung

Diese Studie konzentriert sich darauf, das gesprochene NER durch Transferlernen und E2E-Modelle zu verbessern.

2025-10-24T10:59:30+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Slot-Füllung in Dialogsystemen

Eine neue Methode verbessert aufgabenorientierte Dialogsysteme durch Audio- und Wissensintegration.

2025-10-23T22:13:12+00:00 ― 7 min Lesedauer

Rechnen und Sprache Fortschritte in der automatischen Spracherkennung für norwegische Sprachen

Neueste Forschungen verbessern ASR-Modelle für Norwegisch und steigern die Leistung in Bokmål und Nynorsk.

2025-10-23T21:10:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei zweisprachigen und Code-Switching ASR-Modellen

Neue Methoden verbessern die mehrsprachige Spracherkennung mit bestehenden Datenquellen.

2025-10-23T04:05:20+00:00 ― 7 min Lesedauer

Rechnen und Sprache Verbesserung der Spracherkennung für ressourcenarme Sprachen

Die Forschung konzentriert sich darauf, die Sprachtechnik für Sprachen mit unzureichenden Daten zu verbessern.

2025-10-22T23:13:50+00:00 ― 6 min Lesedauer

Ton Ein Vereinfachter Ansatz für Hybrid HMM bei ASR

In diesem Artikel wird eine neue Methode vorgestellt, um effiziente ASR-Systeme zu entwickeln.

2025-10-22T14:19:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Neuer Datensatz und Modell für mehrsprachige Text-to-Speech

CML-TTS ermöglicht bessere Text-zu-Sprache-Systeme in sieben Sprachen.

2025-10-21T18:04:50+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung für mehrere Sprecher mit SURT 2.0

SURT 2.0 verbessert die Spracherkennung für mehrere Sprecher in Echtzeiteinstellungen.

2025-10-21T05:07:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte im Lernen von automatischer Spracherkennung

Ein neues Verfahren verbessert die Spracherkennungstechnologie, ohne das zuvor erlernte Wissen zu verlieren.

2025-10-20T13:44:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neue Metriken zur Bewertung der Qualität der Spracherkennung

Ein neues Verfahren bewertet ASR-Systeme, ohne dass Referenztexte nötig sind.

2025-10-19T19:07:00+00:00 ― 5 min Lesedauer

Rechnen und Sprache Evaluation der ASR-Qualität ohne Referenztexte

NoRefER bietet eine neue Möglichkeit, die Ergebnisse der Spracherkennung zu bewerten, ohne Transkripte zu benötigen.

2025-10-19T16:41:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Techniken zur Sprachdiarisierung

Neue Methoden verbessern die Sprachsegmentierung in mehrsprachigen Gesprächen.

2025-10-19T02:06:45+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der automatischen Spracherkennung für mehrsprachige Nutzung

Ein neues Framework verbessert die ASR für ressourcenarme Sprachen und mehrsprachige Skalierbarkeit.

2025-10-18T19:38:05+00:00 ― 6 min Lesedauer

Computer Vision und Mustererkennung Lip-lesen verbessern mit Viseme-Training

Eine neue Methode verbessert die Genauigkeit des Lippenlesens mithilfe von Visemen in der Spracherkennung.

2025-10-18T03:42:24+00:00 ― 5 min Lesedauer

Ton Sprachrecognition für taube Nutzer voranbringen

Personalisierte ASR-Systeme verbessern die Kommunikation für DHH-Personen erheblich.

2025-10-18T03:26:25+00:00 ― 6 min Lesedauer

Ton Fortschritte bei Techniken zur Sprecherdiarisierung

Neue Methoden nutzen konversationelle Zusammenfassungen für eine bessere Sprechererkennung.

2025-10-18T00:12:05+00:00 ― 6 min Lesedauer

Rechnen und Sprache Automatisierte Spracherkennung für Sprachlerner verbessern

Verbesserung von Feedback-Systemen für Englischlerner, indem das Cold-Start-Problem angegangen wird.

2025-10-17T16:54:50+00:00 ― 6 min Lesedauer

Multimedia Verbesserung der Zielsprecherextraktion mit visuellen Hinweisen

Ein neues Modell verbessert die Sprachextraktion mit Hilfe von Audio- und visuellen Informationen.

2025-10-17T12:51:55+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Zielsprecher-Extraktionstechnologie

Lern, wie neue Techniken die Sprachverständlichkeit in lauten Umgebungen verbessern.

2025-10-16T10:08:40+00:00 ― 5 min Lesedauer

Rechnen und Sprache Spracherkennung mit Langzeit-Modellen verbessern

Dieser Artikel bespricht neue Modelle, die die Genauigkeit der Spracherkennung verbessern, indem sie längere Kontexte berücksichtigen.

2025-10-15T12:16:55+00:00 ― 6 min Lesedauer

Neuronales und evolutionäres Rechnen Fortschrittliche Spiking-Neurale-Netzwerke durch Verzögerungslernen

Neue Methode verbessert das Lernen in spiking neuronalen Netzwerken durch Anpassungen der Verzögerungen.

2025-10-15T07:25:25+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Geschlechterprivatsphäre in Audio: Neue Erkenntnisse

Forschung hebt Methoden hervor, um die Geschlechterprivatsphäre in gesprochener Audio zu schützen.

2025-10-14T21:42:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Lippen-zu-Sprache-Synthesetechnologie

Neues Framework verbessert die Sprachverständlichkeit von lautlosen Videos durch verbesserte Verarbeitung.

2025-10-13T19:47:45+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Erkennung von gefälschten Audios mit Conformer-Modellen

Forscher entwickeln ein Conformer-Modell, um die Erkennung von gefälschten Audios zu verbessern.

2025-10-13T03:36:05+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschrittliche akustische Wort-Einbettungen für gesprochene Sprache

Forschung zur Verbesserung akustischer Wortembeddings mit semantischem Verständnis und mehrsprachigen Daten.

2025-10-12T14:38:45+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Integration von Sprache mit Sprachmodellen: Die Speech-LLaMA-Methode

Ein neuer Ansatz, der Sprache mit Sprachmodellen kombiniert für bessere Übersetzungen.

2025-10-11T18:24:10+00:00 ― 5 min Lesedauer

Rechnen und Sprache Spracherkennung mit RNN-Transducern verbessern

Neue Methoden verbessern die Genauigkeit der Spracherkennung und beheben häufige Transkriptionsfehler.

2025-10-11T04:38:15+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei der Sprachabsichtsklassifizierung und Slot-Filling

In diesem Artikel wird ein neues Modell zur Identifizierung von Sprachabsicht und Slots untersucht.

2025-10-09T12:09:05+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Spracherkennung ohne Text

Neue Methode verbessert Spracherkennung nur mit Roh-Audiodaten.

2025-10-09T02:26:05+00:00 ― 5 min Lesedauer

Rechnen und Sprache Die Spracherkennung für ältere Menschen verbessern

Eine Studie verbessert die ASR für ältere Sprecher und verwendet dabei innovative Techniken.

2025-10-09T01:37:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Neuer Datensatz soll die hebräische Spracherkennung verbessern

ivrit.ai bietet wichtige Ressourcen zur Verbesserung der Hebräischen ASR-Technologie.

2025-10-08T05:22:55+00:00 ― 7 min Lesedauer