Yichen Lu

Ein neues Modell integriert Audio- und Visualdaten für Spracherkennung und Übersetzung.

2025-07-06T20:04:15+00:00 ― 6 min Lesedauer

EVA kombiniert Audio- und visuelle Signale für eine bessere Spracherkennungsgenauigkeit.

2025-06-07T22:08:20+00:00 ― 5 min Lesedauer

Lern, wie AV-ASR Audio und Visuals kombiniert, um die Spracherkennung zu verbessern.

2025-01-24T21:39:36+00:00 ― 6 min Lesedauer