Neuste Artikel für Spracherkennung

Audio- und Sprachverarbeitung Fortschritte im Formanten-Tracking für Sprachverarbeitung

Neue Ein-Schritt-Methoden verbessern die Genauigkeit bei der Formantenverfolgung für Sprachlaute.

2025-09-19T02:16:10+00:00 ― 4 min Lesedauer

Rechnen und Sprache Sprache mit Sprachmodellen verbinden: Die BLSP-Methode

Ein neuer Ansatz verbessert die Integration von Sprache mit Sprachmodellen.

2025-09-18T15:44:35+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung VoxtLM: Ein einheitlicher Ansatz für Sprache und Text

VoxtLM kombiniert Spracherkennung, Synthese, Textgenerierung und Fortsetzung in einem Model.

2025-09-13T11:02:45+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Libriheavy: Ein neuer Datensatz für Spracherkennung

Libriheavy bietet 50.000 Stunden gesprochenes Englisch an, um die Spracherkennungstechnologie zu verbessern.

2025-09-12T18:51:05+00:00 ― 5 min Lesedauer

Ton Spracherkennung mit sanften Eingaben verbessern

Weiche Eingaben verbessern die Spracherkennungstechnologie für bessere Leistung in lauten Umgebungen.

2025-09-10T04:30:10+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte bei Spracherkennung: Anweisungsbefolgende Systeme

Ein neuer Ansatz zur Spracherkennung verbessert die Interaktion mit Nutzern durch flexible Anweisungen.

2025-09-09T08:15:35+00:00 ― 5 min Lesedauer

Ton Die Verbesserung der Spracherkennung mit Testzeittraining

Erkunde, wie TTT die Spracherkennung verbessert, indem es sich an Verteilungsverschiebungen anpasst.

2025-09-08T14:26:45+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Sprache klarer machen mit Dereverberation-Techniken

Lern, wie Dereverberation die Spracherkennung in lauten Umgebungen verbessert.

2025-09-05T12:45:40+00:00 ― 4 min Lesedauer

Ton Fortschritte in Audio- und Spracherkennungsmodellen

Ein neues Modell verbessert das Verständnis von Sprache und Geräuschen gleichzeitig.

2025-09-04T18:08:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Spracherkennung für unterschiedliche Akzente

Die Sprachmodelle verbessern, damit sie verschiedene Akzente besser erkennen und sich anpassen können.

2025-09-04T08:25:15+00:00 ― 5 min Lesedauer

Rechnen und Sprache Spracherkennung für indische Sprachen aufbauen

Ein Projekt zur Verbesserung der Spracherkennung in verschiedenen indischen Sprachen.

2025-09-01T15:10:24+00:00 ― 5 min Lesedauer

Rechnen und Sprache Kallaama-Projekt: Brücke zwischen Sprache und Technologie in der Landwirtschaft

Kallaama erstellt ein Sprachdataset in lokalen Sprachen, um senegalesischen Bauern zu helfen.

2025-08-23T02:43:54+00:00 ― 5 min Lesedauer

Rechnen und Sprache Herausforderungen und Chancen für indigene Sprachen in der NLP

Indigene Sprachen haben's schwer mit Technik, bieten aber reichlich kulturelle Einblicke.

2025-08-21T07:40:36+00:00 ― 6 min Lesedauer

Robotik Evaluierung eines sozialen Roboters im Gesundheitswesen

Eine Studie über den Einsatz von ARI in einer gerontologischen Tagespflegeeinrichtung.

2025-08-20T09:17:36+00:00 ― 6 min Lesedauer

Rechnen und Sprache Die Klassifizierung von Sorani-Kurdischen Unterdialekten durch Audiodaten

Forschung identifiziert und klassifiziert die Sorani-Kurdisch-Dialekte mit Hilfe umfangreicher Audioaufnahmen.

2025-08-14T07:57:50+00:00 ― 6 min Lesedauer

Rechnen und Sprache Generative Fusion Dekodierung: Text Erkennung voranbringen

Eine neue Methode verbessert die Texterkennungsgenauigkeit in verschiedenen Anwendungen.

2025-08-07T22:00:54+00:00 ― 7 min Lesedauer

Mensch-Computer-Interaktion Fortschrittliche Roboterkommunikation: Lösung für überlappende Sprache

Ein neues System verbessert die Interaktionen von Robotern, indem es überlappende Sprache herausfiltert.

2025-08-04T13:57:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der automatischen Spracherkennung mit dynamischem TTA

Neue Methoden verbessern die Spracherkennung in lauten Umgebungen mit adaptiven Techniken.

2025-07-29T13:49:25+00:00 ― 7 min Lesedauer

Rechnen und Sprache Fortschritte in der Übersetzung von Code-Switching-Sprache

Eine neue Methode verbessert die Übersetzung von gemischter Sprache in Englisch.

2025-07-29T09:46:30+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung GigaSpeech 2: Ein neues Dataset für Spracherkennung

GigaSpeech 2 bietet ein riesiges Dataset für Sprachen mit wenig Ressourcen, um die Spracherkennung zu verbessern.

2025-07-29T02:29:15+00:00 ― 5 min Lesedauer

Computer Vision und Mustererkennung Der BabyView-Datensatz: Ein neuer Blick auf das Lernen von Kindern

Ein einzigartiger Datensatz erfasst das tägliche Leben von Kindern, um maschinelles Lernen und das Verständnis von menschlichem Lernen zu verbessern.

2025-07-29T01:16:42+00:00 ― 8 min Lesedauer

Rechnen und Sprache Generative KI-Systeme: Die Zukunft der Inhaltserstellung gestalten

Entdeck, wie Generative KI die Art und Weise verändert, wie wir Inhalte erstellen.

2025-07-24T05:01:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte in der automatischen Spracherkennungstechnologie

Neue Methoden verbessern die Genauigkeit und Effizienz von Spracherkennungssystemen.

2025-07-22T03:41:05+00:00 ― 6 min Lesedauer

Ton Kommunikation voranbringen: Spracherkennung trifft auf Morsecode

Ein neues Modell verbessert die Kommunikation für Menschen mit Behinderungen durch Spracherkennung und Morsecode.

2025-07-18T02:52:00+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Qwen2-Audio: Eine neue Stimme für Technologie

Ein sprachgesteuertes Modell, das die Audio-Interaktion mit Technologie verwandelt.

2025-07-16T00:18:55+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Vibravox: Fortschritt in der Spracherkennungstechnologie

Ein neues Datenset zielt darauf ab, die Sprachaufnahme mit Körpersensoren zu verbessern.

2025-07-15T14:35:55+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Spracherkennung für die polnische Sprache

Die Forschung präsentiert neue Methoden zur Bewertung von Spracherkennungssystemen in Polnisch.

2025-07-14T16:44:10+00:00 ― 6 min Lesedauer

Neuronen und Kognition Fortschritte in der EEG-Technologie zur Sprachwiederherstellung

Forscher verbessern die Sprachdekodierung mit EEG, um Menschen mit Sprachbehinderungen zu helfen.

2025-07-12T16:20:33+00:00 ― 7 min Lesedauer

Rechnen und Sprache Bewertung der Spracherkennung in mehrsprachigen Oralgeschichten

Diese Studie bewertet Spracherkennungssysteme mit verschiedenen Sprachen für Oral History.

2025-07-07T12:29:12+00:00 ― 6 min Lesedauer

Mensch-Computer-Interaktion OpenOmni: Fortschritt bei multimodalen Konversationsagenten

OpenOmni entwickelt flexible Werkzeuge zum Erstellen und Testen von Gesprächsagenten.

2025-07-01T09:40:42+00:00 ― 8 min Lesedauer

Rechnen und Sprache Verbesserung von Techniken zur mehrsprachigen Sprachzusammenfassung

Die Forschung konzentriert sich auf bessere Zusammenfassungen von gesprochenen Gesprächen in verschiedenen Sprachen.

2025-06-29T05:24:24+00:00 ― 6 min Lesedauer

Ton Einführung von NEST: Ein neues Modell zur Sprachverarbeitung

NEST bietet einen schnelleren, effizienteren Ansatz für selbstüberwachte Sprachaufgaben.

2025-06-25T20:06:05+00:00 ― 6 min Lesedauer

Künstliche Intelligenz Spracherkennung durch Fehlervorhersage verbessern

Die Forschung konzentriert sich darauf, Fehler in der Spracherkennung vorherzusagen, um die Genauigkeit zu verbessern.

2025-06-25T10:09:42+00:00 ― 5 min Lesedauer

Rechnen und Sprache Neuer Massstab für die Hindi-Spracherkennung

Forschung verbessert die Spracherkennung für Hindi mit verschiedenen Akzenten.

2025-06-24T05:11:42+00:00 ― 5 min Lesedauer

Ton Fortschritte bei der Sprecherverifikation mit Whisper

Eine neue Methode verbessert die Spracherkennungsgenauigkeit in mehreren Sprachen.

2025-06-22T18:25:00+00:00 ― 6 min Lesedauer

Ton Neuer Datensatz verbessert die Spracherkennungstechnologie

Forscher haben LibriheavyMix entwickelt, um die Spracherkennung in lauten Umgebungen zu verbessern.

2025-06-20T22:41:30+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Evaluierung des Mamba-Modells bei Sprachverarbeitungsaufgaben

Diese Forschung analysiert Mambas Leistung bei Sprachaufgaben und legt den Fokus auf Klangrekonstruktion und -erkennung.

2025-06-14T23:22:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Akustische Landmarken: Ein neues Dataset für Sprachverarbeitung

Forscher entwickeln einen Datensatz, um die Spracherkennung und Analyse-Techniken zu verbessern.

2025-06-13T19:50:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte bei der Spracherkennung für die Faetar-Sprache

Bemühungen, die Sprachtechnologie für die unterversorgte Faetar-Sprache zu verbessern.

2025-06-13T09:18:50+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Spracherkennung mit Sprachmodellen

Eine Studie über die Verwendung von Sprachmodellen zur Korrektur von Fehlern in Spracherkennungssystemen.

2025-06-12T22:47:15+00:00 ― 5 min Lesedauer