Yihan Wu

EVA combine des signaux audio et visuels pour une meilleure précision de reconnaissance vocale.

2025-06-07T22:08:20+00:00 ― 5 min lire

ESPnet-Codec améliore l'entraînement et l'évaluation des codecs neuronaux pour l'audio et la parole.

2025-06-03T03:09:30+00:00 ― 9 min lire

Découvrez comment l'AV-ASR combine audio et visuels pour améliorer la reconnaissance vocale.

2025-01-24T21:39:36+00:00 ― 7 min lire