Neuste Artikel für Spracherkennung

Ton Fortschritte bei der Sprachrecognition für Zielsprecher

Neues Modell verbessert die Spracherkennung in lauten Umgebungen, indem es sich auf einen einzelnen Sprecher konzentriert.

2025-09-28T08:08:00+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der bilingualen Spracherkennung mit Graphem-Einheiten

Verbesserung hybrider ASR-Systeme für zweisprachige Sprache mit Graphem-Einheiten.

2025-09-27T03:47:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte im gemeinsamen Lernen von Sprache und Text

Ein neues Modell verbessert die Sprach- und Textausrichtung für eine bessere automatische Erkennung.

2025-09-27T02:10:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neue Methoden zur Bewertung von Speaker-Diarization

Frische Metriken zur Bewertung der Sprecherdiarisierung genauigkeit in konversationaler KI vorstellen.

2025-09-26T18:04:30+00:00 ― 7 min Lesedauer

Rechnen und Sprache Fortschritte in der Spracherkennungstechnologie

Neue Methoden verbessern die Genauigkeit und Geschwindigkeit in Spracherkennungssystemen.

2025-09-26T11:35:55+00:00 ― 5 min Lesedauer

Rechnen und Sprache Automatische Spracherkennung mit Texteinspeisung verbessern

Eine neue Methode verbessert die ASR-Leistung durch die Integration von Textdaten.

2025-09-26T07:33:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Spracherkennung mit Texteinspeisung verbessern

Textinjektion hilft, persönliche Informationen zu erkennen, während die Privatsphäre gewahrt bleibt.

2025-09-26T06:44:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Spracherkennung mit mmWave-Technologie

Radio2Text nutzt mmWave-Signale für die Echtzeit-Spracherkennung in lauten Umgebungen.

2025-09-25T22:38:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Graphem-zu-Phonem-Konversion mit neuer Sampling-Methode

Diese Studie verbessert G2P-Modelle, indem sie sich auf fehleranfällige Bereiche während des Trainings konzentriert.

2025-09-25T05:38:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei den Formant-Tracking-Techniken

Entdeck Methoden, die die Genauigkeit beim Formant-Tracking für Sprachanalysen verbessern.

2025-09-24T22:21:05+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte im Sprachmodellieren

Neue Methoden verbessern die Sprachverarbeitung und -erzeugung in Sprachmodellen.

2025-09-19T16:02:05+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Geräuschunterdrückungstechnologie

Neue Techniken verbessern die Audio-Klarheit in lauten Umgebungen.

2025-09-19T15:13:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Few-Shot Keyword Spotting mit Lesesprechdaten

Neue Methoden verbessern die Schlüsselworterkennung mit verfügbaren Lesesprechdaten.

2025-09-19T13:36:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Vertrauensschätzung in der automatischen Spracherkennung

Ein neuer Ansatz verbessert die Vertrauensschätzung in ASR-Systemen für bessere Genauigkeit.

2025-09-15T03:14:28+00:00 ― 5 min Lesedauer

Maschinelles Lernen Herausforderungen bei der Verwendung von Convnets für die Design von Audio-Filterbänken

Diese Studie untersucht Probleme bei der Verwendung von ConvNets zur Erstellung von Audio-Filterbänken.

2025-09-14T14:34:35+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprecher-Diarisation mit Sprachmodellen

Dieser Artikel untersucht Fortschritte in der Sprecherdiarisierung mithilfe von Sprachmodellen für eine bessere Genauigkeit.

2025-09-14T03:14:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung PromptASR: Spracherkennung der nächsten Generation

Neues System verbessert die Spracherkennung mit kontextbezogenen Aufforderungen.

2025-09-13T10:14:10+00:00 ― 4 min Lesedauer

Ton Fortschritte bei den Universal Audio Modellen

EnCodecMAE kombiniert selbstüberwachtes Lernen und Audio-Codecs für bessere Audio-Aufgabenleistung.

2025-09-13T09:25:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Ein neuer Ansatz zur Erkennung von Schlüsselwörtern

Eine flexible Methode zur Erkennung von Schlüsselwörtern in der Sprache über verschiedene Sprachen hinweg.

2025-09-13T06:11:15+00:00 ― 6 min Lesedauer

Ton Neues System verbessert Sprachausgabe bei instabilen Kopfpositionen

PIAVE hilft Maschinen, Stimmen klar zu erfassen, selbst wenn die Sprecher den Kopf drehen.

2025-09-12T19:39:40+00:00 ― 6 min Lesedauer

Ton Ein neues Rahmenwerk für Sprecheranonymisierung

Ein flexibles Framework vorstellen, um die Forschung zur Sprachprivatsphäre zu verbessern.

2025-09-12T05:05:10+00:00 ― 7 min Lesedauer

Rechnen und Sprache Erklärungen für Sprachmodelle verbessern

Eine neue Methode macht es einfacher, Sprachklassifikationsmodelle zu verstehen.

2025-09-12T02:39:25+00:00 ― 7 min Lesedauer

Ton M-AUDIODEC: Ein neuer Weg, Audio zu komprimieren

M-AUDIODEC komprimiert Mehrkanal-Audio und behält dabei die Lautsprecherposition und Qualität.

2025-09-11T16:56:25+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Klangqualität in Hörgeräten verbessern

Forschung zeigt neue Modelle, um die Sprachklarheit in smarten Ohrhörern zu verbessern.

2025-09-11T12:04:55+00:00 ― 5 min Lesedauer

Künstliche Intelligenz Verbesserung des Verständnisses von Robotern für menschliche Anweisungen

Eine neue Methode verbessert die Fähigkeit von Robotern, gesprochene Anweisungen genau zu befolgen.

2025-09-11T08:21:18+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Techniken zur Erkennung gefälschter Sprache

Neue Methoden verbessern unsere Fähigkeit, gefälschte Sprache effektiv zu erkennen.

2025-09-11T02:21:55+00:00 ― 6 min Lesedauer

Ton Spracherkennung durch Personalisierungstechniken verbessern

Eine neue Methode verbessert ASR-Modelle für einzelne Nutzer mithilfe von Quantisierung und Anpassung.

2025-09-10T13:24:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Spracherkennung durch Early-Exit-Modelle

Neue Modelle passen sich an, um die Effizienz und Reaktionsfähigkeit der Spracherkennung zu verbessern.

2025-09-09T21:12:55+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Whisper für ressourcenarme Sprachen verbessern

Die Spracherkennung von Whisper für Vietnamesisch und andere Sprachen mit geringem Ressourcengehalt verbessern.

2025-09-08T03:55:10+00:00 ― 5 min Lesedauer

Neurowissenschaften Verstehen von Sprachverarbeitung in schwierigen Umgebungen

Diese Studie untersucht, wie das Hörvermögen das Sprachverständnis in lauten Umgebungen beeinflusst.

2025-09-07T04:34:28+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung von Audiodaten mit K-Means-Clustering

Mit k-Means-Clustering Audio-Daten optimieren für besseres Model-Training.

2025-09-06T15:28:55+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Effiziente Modellauswahl für Spracherkennung

Eine Methode, um das beste ASR-Modell basierend auf Audio-Features auszuwählen.

2025-09-05T23:17:15+00:00 ― 5 min Lesedauer

Rechnen und Sprache Mein Wissenschafts-Nachhilfe-Projekt: Eine neue Art zu lernen

MyST zielt darauf ab, das Wissenschaftslernen von Kindern durch virtuelles Tutoring zu verbessern.

2025-09-05T09:31:20+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Technologie zur Transkription von Meetings

Ein Blick auf M2MeT 2.0 und seinen Einfluss auf die Transkription von Meetings.

2025-09-05T03:51:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte und Herausforderungen bei Spracherkennungsmodellen

Diese Studie untersucht, wie Modelkompression die Spracherkennung in lauten Umgebungen beeinflusst.

2025-09-04T19:45:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in Audio- und Spracherkennungsmodellen

Ein neues Modell verbessert das Verständnis von Sprache und Geräuschen gleichzeitig.

2025-09-04T18:08:15+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachextraktionstechnologie

Neue Modelle für bessere Spracherkennung in lauten Umgebungen.

2025-09-04T02:45:10+00:00 ― 6 min Lesedauer

Rechnen und Sprache Herausforderungen bei der automatischen Spracherkennung in Langform angehen

Die Forschung konzentriert sich darauf, ASR-Systeme für unsegmentierte Audiodaten zu verbessern.

2025-09-03T13:47:50+00:00 ― 5 min Lesedauer

Rechnen und Sprache Adressierung von Geschlechtervorurteilen in der Spracherkennungstechnologie

Untersuchung von Leistungsunterschieden bei der Spracherkennung zwischen den Geschlechtern.

2025-09-03T12:51:42+00:00 ― 6 min Lesedauer

Rechnen und Sprache Spracherkennung mit grossen Sprachmodellen verbessern

LLMs verbessern die Genauigkeit und Fehlerkorrektur in Spracherkennungssystemen.

2025-09-03T06:30:35+00:00 ― 6 min Lesedauer