Ruihua Song

ViCo améliore la création de commentaires captivants pour les vidéos en ligne.

2025-10-05T12:44:30+00:00 ― 7 min lire

Un nouveau cadre améliore la précision des légendes d'images et réduit les erreurs.

2025-06-20T09:09:36+00:00 ― 7 min lire

EVA combine des signaux audio et visuels pour une meilleure précision de reconnaissance vocale.

2025-06-07T22:08:20+00:00 ― 5 min lire

ESPnet-Codec améliore l'entraînement et l'évaluation des codecs neuronaux pour l'audio et la parole.

2025-06-03T03:09:30+00:00 ― 9 min lire

Une nouvelle méthode améliore les interactions réalistes dans les animations de personnages.

2025-02-05T11:49:12+00:00 ― 7 min lire

Découvrez comment l'AV-ASR combine audio et visuels pour améliorer la reconnaissance vocale.

2025-01-24T21:39:36+00:00 ― 7 min lire