LipVoicer génère une voix claire à partir de vidéos silencieuses en utilisant des méthodes de lecture labiale avancées.
― 7 min lire
La science de pointe expliquée simplement
LipVoicer génère une voix claire à partir de vidéos silencieuses en utilisant des méthodes de lecture labiale avancées.
― 7 min lire
Présentation d'une méthode flexible pour reconnaître les mots-clés dans la parole à travers les langues.
― 7 min lire
Les chercheurs améliorent la performance des modèles en augmentant la variété des données grâce à des méthodes d'augmentation novatrices.
― 7 min lire
Un nouveau modèle combine la reconnaissance vocale et la reconnaissance d'entités pour de meilleurs résultats.
― 7 min lire
Nouveau modèle permet une transcription vocale plus rapide sans sacrifier la précision.
― 5 min lire