Neuste Artikel für Spracherkennung

Ton Fortschrittliche Spracherkennung mit zeitlich gespartem Transducer

Neues Modell verbessert die Erkennungsgeschwindigkeit und den Speicherverbrauch von Sprache.

2025-10-07T23:42:50+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der domänensensitiven Spracherkennungstechnologie

Neue Methoden verbessern die Spracherkennung in bestimmten Bereichen ohne umfangreiche Daten.

2025-10-07T15:37:00+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei akustischen Wortembeddings

Ein neues Modell verbessert, wie Computer gesprochene Sprache verarbeiten.

2025-10-07T04:16:50+00:00 ― 4 min Lesedauer

Rechnen und Sprache Fortschritte in der Spracherkennungstechnologie

Der Bayes-Risiko-Transducer verbessert die Effizienz und Genauigkeit der Spracherkennung.

2025-10-06T21:31:36+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte im gesprochenen Frage-Antworten mit LibriSQA

Neuer Datensatz und Rahmen verbessern die Fähigkeiten zur Beantwortung gesprochener Fragen.

2025-10-06T17:42:30+00:00 ― 5 min Lesedauer

Ton Neues Framework verbessert die Spracherkennung mit Metadaten

Die Integration von Metadaten verbessert die Leistung bei Sprachaufgaben wie der Spracherkennung.

2025-10-06T12:05:10+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Transducer-Modellen für Spracherkennung

Dieser Artikel behandelt die Echtzeitfähigkeiten des Transducer-Modells und die neuesten Verbesserungen.

2025-10-06T11:16:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Themenidentifikation aus Audiodaten

Die Forschung untersucht Methoden zur direkten Identifizierung von Themen aus Audioaufnahmen.

2025-10-05T23:56:25+00:00 ― 5 min Lesedauer

Ton Sprachechnologie mit SCRAPS voranbringen

Ein neues Modell verbindet Phonetik und Akustik für bessere Sprachtechnologie.

2025-10-05T13:24:50+00:00 ― 7 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der aktiven Lautsprechererkennung mit Audio

Forschung zeigt, dass mehrere Mikrofone Vorteile beim Erkennen und Lokalisieren von Sprechern haben.

2025-10-03T11:12:40+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte in der Sprachverbesserung mit PCNN

Ein neues Modell für klarere Sprache in lauten Umgebungen.

2025-10-03T07:58:20+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Sprecherdiarisierung durch Audio-Visuelle Integration

Neue Systeme verbessern die Sprecheridentifikation mit Audio- und visuellen Daten.

2025-10-02T15:46:40+00:00 ― 5 min Lesedauer

Rechnen und Sprache Fortschritte in der Aussprache-Trainingstechnik

Forscher verbessern das Aussprache-Training mit neuen Technologien für Sprachlerner.

2025-10-02T07:40:50+00:00 ― 5 min Lesedauer

Informationsbeschaffung Fortschritte in der Sprachsuche-Technologie

Die Sprachsuche entwickelt sich weiter und verbessert die Spracherkennung, um die Nutzererfahrung zu optimieren.

2025-09-30T17:00:24+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Erkennung von gefälschten Audios mit RAWM

Eine neue Methode verbessert die Erkennung von Fake-Audio durch adaptive Gewichtsanpassung.

2025-09-29T01:08:15+00:00 ― 6 min Lesedauer

Ton Fortschritte bei der Sprachrecognition für Zielsprecher

Neues Modell verbessert die Spracherkennung in lauten Umgebungen, indem es sich auf einen einzelnen Sprecher konzentriert.

2025-09-28T08:08:00+00:00 ― 4 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der bilingualen Spracherkennung mit Graphem-Einheiten

Verbesserung hybrider ASR-Systeme für zweisprachige Sprache mit Graphem-Einheiten.

2025-09-27T03:47:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte im gemeinsamen Lernen von Sprache und Text

Ein neues Modell verbessert die Sprach- und Textausrichtung für eine bessere automatische Erkennung.

2025-09-27T02:10:25+00:00 ― 6 min Lesedauer

Rechnen und Sprache Neue Methoden zur Bewertung von Speaker-Diarization

Frische Metriken zur Bewertung der Sprecherdiarisierung genauigkeit in konversationaler KI vorstellen.

2025-09-26T18:04:30+00:00 ― 7 min Lesedauer

Rechnen und Sprache Fortschritte in der Spracherkennungstechnologie

Neue Methoden verbessern die Genauigkeit und Geschwindigkeit in Spracherkennungssystemen.

2025-09-26T11:35:55+00:00 ― 5 min Lesedauer

Rechnen und Sprache Automatische Spracherkennung mit Texteinspeisung verbessern

Eine neue Methode verbessert die ASR-Leistung durch die Integration von Textdaten.

2025-09-26T07:33:00+00:00 ― 6 min Lesedauer

Rechnen und Sprache Spracherkennung mit Texteinspeisung verbessern

Textinjektion hilft, persönliche Informationen zu erkennen, während die Privatsphäre gewahrt bleibt.

2025-09-26T06:44:25+00:00 ― 6 min Lesedauer

Ton Fortschritte in der Spracherkennung mit mmWave-Technologie

Radio2Text nutzt mmWave-Signale für die Echtzeit-Spracherkennung in lauten Umgebungen.

2025-09-25T22:38:35+00:00 ― 6 min Lesedauer

Rechnen und Sprache Verbesserung der Graphem-zu-Phonem-Konversion mit neuer Sampling-Methode

Diese Studie verbessert G2P-Modelle, indem sie sich auf fehleranfällige Bereiche während des Trainings konzentriert.

2025-09-25T05:38:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei den Formant-Tracking-Techniken

Entdeck Methoden, die die Genauigkeit beim Formant-Tracking für Sprachanalysen verbessern.

2025-09-24T22:21:05+00:00 ― 6 min Lesedauer

Rechnen und Sprache Fortschritte im Sprachmodellieren

Neue Methoden verbessern die Sprachverarbeitung und -erzeugung in Sprachmodellen.

2025-09-19T16:02:05+00:00 ― 5 min Lesedauer

Ton Fortschritte in der Geräuschunterdrückungstechnologie

Neue Techniken verbessern die Audio-Klarheit in lauten Umgebungen.

2025-09-19T15:13:30+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei Few-Shot Keyword Spotting mit Lesesprechdaten

Neue Methoden verbessern die Schlüsselworterkennung mit verfügbaren Lesesprechdaten.

2025-09-19T13:36:20+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Fortschritte bei der Vertrauensschätzung in der automatischen Spracherkennung

Ein neuer Ansatz verbessert die Vertrauensschätzung in ASR-Systemen für bessere Genauigkeit.

2025-09-15T03:14:28+00:00 ― 5 min Lesedauer

Maschinelles Lernen Herausforderungen bei der Verwendung von Convnets für die Design von Audio-Filterbänken

Diese Studie untersucht Probleme bei der Verwendung von ConvNets zur Erstellung von Audio-Filterbänken.

2025-09-14T14:34:35+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung Verbesserung der Sprecher-Diarisation mit Sprachmodellen

Dieser Artikel untersucht Fortschritte in der Sprecherdiarisierung mithilfe von Sprachmodellen für eine bessere Genauigkeit.

2025-09-14T03:14:25+00:00 ― 5 min Lesedauer

Audio- und Sprachverarbeitung PromptASR: Spracherkennung der nächsten Generation

Neues System verbessert die Spracherkennung mit kontextbezogenen Aufforderungen.

2025-09-13T10:14:10+00:00 ― 4 min Lesedauer

Ton Fortschritte bei den Universal Audio Modellen

EnCodecMAE kombiniert selbstüberwachtes Lernen und Audio-Codecs für bessere Audio-Aufgabenleistung.

2025-09-13T09:25:35+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Ein neuer Ansatz zur Erkennung von Schlüsselwörtern

Eine flexible Methode zur Erkennung von Schlüsselwörtern in der Sprache über verschiedene Sprachen hinweg.

2025-09-13T06:11:15+00:00 ― 6 min Lesedauer

Ton Neues System verbessert Sprachausgabe bei instabilen Kopfpositionen

PIAVE hilft Maschinen, Stimmen klar zu erfassen, selbst wenn die Sprecher den Kopf drehen.

2025-09-12T19:39:40+00:00 ― 6 min Lesedauer

Ton Ein neues Rahmenwerk für Sprecheranonymisierung

Ein flexibles Framework vorstellen, um die Forschung zur Sprachprivatsphäre zu verbessern.

2025-09-12T05:05:10+00:00 ― 7 min Lesedauer

Rechnen und Sprache Erklärungen für Sprachmodelle verbessern

Eine neue Methode macht es einfacher, Sprachklassifikationsmodelle zu verstehen.

2025-09-12T02:39:25+00:00 ― 7 min Lesedauer

Ton M-AUDIODEC: Ein neuer Weg, Audio zu komprimieren

M-AUDIODEC komprimiert Mehrkanal-Audio und behält dabei die Lautsprecherposition und Qualität.

2025-09-11T16:56:25+00:00 ― 6 min Lesedauer

Audio- und Sprachverarbeitung Die Klangqualität in Hörgeräten verbessern

Forschung zeigt neue Modelle, um die Sprachklarheit in smarten Ohrhörern zu verbessern.

2025-09-11T12:04:55+00:00 ― 5 min Lesedauer

Künstliche Intelligenz Verbesserung des Verständnisses von Robotern für menschliche Anweisungen

Eine neue Methode verbessert die Fähigkeit von Robotern, gesprochene Anweisungen genau zu befolgen.

2025-09-11T08:21:18+00:00 ― 6 min Lesedauer