Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes# Graphisme# Apprentissage automatique

Avancées dans la technologie d'animation faciale

FDLS simplifie la création d'animations de personnages numériques réalistes grâce à l'apprentissage profond.

― 7 min lire


Innovation en animationInnovation en animationfacialetechniques avancées.personnages numériques grâce à desFDLS améliore le réalisme des
Table des matières

Créer des animations réalistes pour des personnages numériques dans les films et les jeux, c'est vraiment compliqué. Ça implique de faire bouger des humains ou des créatures synthétiques et d'exprimer des émotions de manière crédible. Un gros défi, c'est de transférer les performances des vrais acteurs sur ces personnages numériques tout en gardant tout expressif et fidèle au style de l'acteur. C'est là que le Facial Deep Learning Solver (FDLS) entre en jeu, offrant une solution à certains de ces défis grâce à des techniques d'apprentissage profond.

Le Besoin d'Animation Réaliste

Dans le secteur du divertissement, la demande pour des personnages numériques réalistes augmente. Pour y arriver, les studios utilisent souvent des performances capturées d'acteurs réels, permettant aux personnages numériques d'hériter des traits de personnalité uniques de ces acteurs. Cependant, capturer la performance d'un acteur avec précision n'est pas facile. Plusieurs facteurs peuvent influencer la façon dont un personnage numérique représente les expressions faciales et la personnalité de l'acteur, comme la complexité des modèles utilisés et les limites de données disponibles.

Vue d'ensemble du FDLS

FDLS est un système conçu pour résoudre les problèmes rencontrés dans l'animation faciale. Il tire parti de l'apprentissage profond pour produire des animations faciales de haute qualité avec moins d'efforts manuels. Le système permet aux artistes d'éditer et de guider la production à différentes étapes, ce qui leur donne le contrôle créatif nécessaire pour des résultats efficaces.

Comprendre le Processus

Données de Capture de mouvement

Pour entraîner le FDLS, la première étape est de transformer les données brutes de capture de mouvement en informations utiles. Cela implique de créer des caractéristiques qui représentent les différents aspects des mouvements faciaux de l'acteur. Les caractéristiques sont conçues pour capturer des points d'ancrage faciaux importants, ce qui aide à comprendre comment le visage bouge.

Mouvement de la Mâchoire comme Point de Départ

Un élément essentiel lors de l'animation des visages est le mouvement de la mâchoire. La mâchoire influence l'apparence des différentes expressions faciales. FDLS résout d'abord le mouvement de la mâchoire avant de prédire les expressions faciales plus fines. Cette approche reflète la façon dont les artistes finalisent généralement l'animation de la mâchoire avant de passer aux autres détails.

Implication de l'Artiste

FDLS encourage l'interaction des artistes grâce à une méthode dite "humain dans la boucle". Cela signifie que les artistes peuvent vérifier, ajuster et améliorer la performance à différentes étapes. Cette implication est cruciale car elle garantit que l'animation finale respecte la vision artistique tout en atteignant une précision technique.

Résolution Fiable des Performances

Avec FDLS, une animation fiable peut être réalisée avec un minimum de données d'entraînement. Le système peut s'adapter aux petits changements de la structure faciale d'un acteur au fil du temps. Cette flexibilité est importante car le visage d'un acteur peut changer d'un jour à l'autre. FDLS permet aux animateurs de produire des animations de haute qualité tout en laissant de la place pour les modifications si nécessaire.

Caractéristiques de Conception du FDLS

Le système FDLS inclut plusieurs caractéristiques conçues pour améliorer la résolution des animations faciales :

Caractéristiques Basées sur des Graphes

Au lieu de se fier uniquement à des données de position simples, FDLS utilise des caractéristiques graphiques qui capturent les relations entre différents marqueurs faciaux. Cela crée une représentation plus riche des mouvements faciaux, permettant au modèle de mieux performer même avec des données d'entraînement limitées.

Processus de Formation

FDLS a un processus de formation structuré qui lui permet d'apprendre à partir de différents types de données. Un aspect important est la génération de données d'entraînement en utilisant des marqueurs synthétiques. Ceux-ci sont créés à partir de l'expression faciale neutre d'un acteur, permettant au système d'apprendre comment les expressions changent par rapport à cette base neutre.

Augmentation des Données

Pour aider le modèle à mieux généraliser, l'augmentation des données est utilisée. Cela implique d'ajouter de la variabilité aux données d'entraînement, ce qui aide à éviter le surapprentissage. En effectuant de petits ajustements sur les marqueurs, le système apprend à gérer un éventail plus large de mouvements faciaux.

Sélection d'Échantillons Salients

Au lieu d'utiliser chaque exemple d'entraînement, FDLS introduit une technique qui ne sélectionne que les échantillons les plus informatifs. Cela garantit que le système apprend efficacement à partir d'exemples divers, tout en réduisant les données inutiles qui pourraient troubler le processus d'apprentissage.

Pipeline de Résolution d'Animation

Le pipeline FDLS se compose de trois étapes principales : préparation des données, entraînement et résolution pour l'animation.

Préparation des Données

En commençant par la génération de données synthétiques, la première étape consiste à créer des tuples d'entraînement à partir des points d'ancrage faciaux de l'acteur. Cela fournit une base sur laquelle le système peut apprendre.

Étape de Formation

Dans l'étape de formation, les caractéristiques extraites sont introduites dans des réseaux de neurones conçus pour apprendre comment mapper la performance de l'acteur en expressions numériques. Cette étape est cruciale pour que le système reconnaisse précisément les diverses expressions faciales.

Étape de Résolution

Enfin, lors de l'étape de résolution, le modèle entraîné est appliqué à de nouvelles données de performance. C'est à cette étape que le modèle génère l'animation réelle basée sur ce qu'il a appris. Des techniques de post-traitement peuvent être appliquées pour affiner davantage les résultats, garantissant que les animations atteignent la qualité souhaitée.

Gestion des Variations

Tout au long de la production, de petits changements dans l'apparence d'un acteur peuvent se produire. FDLS prend en compte ces variations grâce à une méthode d'alignement de forme. En sélectionnant des poses clés comme ancres, le système peut ajuster les résultats pour s'adapter à l'apparence actuelle de l'acteur sans nécessiter de reformation complète du réseau.

Ajustement Fin et Édition

Une fois que l'animation initiale a été générée, les artistes peuvent intervenir pour effectuer des ajustements fins. Ce processus leur permet de réaliser des ajustements spécifiques, en améliorant les expressions pour mieux correspondre à la performance prévue. En minimisant l'erreur entre l'animation résolue et la performance capturée, le produit final peut atteindre un niveau de précision plus élevé.

Conclusion

Le système FDLS représente une avancée importante dans le domaine de l'animation faciale. Sa combinaison de méthodes d'apprentissage profond, d'implication artistique et de traitement robuste des données en fait un outil puissant pour les animateurs. Alors que la demande pour des animations réalistes continue de croître, des systèmes comme FDLS seront essentiels pour répondre à ces besoins tout en permettant flexibilité créative et expression artistique.

Directions Futures

À l'avenir, des améliorations pourraient inclure l'intégration de sources de données supplémentaires telles que les contours des lèvres ou des informations de profondeur pour améliorer la précision des expressions. En évoluant et en s'adaptant constamment, FDLS peut rester à la pointe de la technologie dans l'animation des personnages numériques.

Créer des personnages numériques réalistes est un défi majeur, et FDLS offre une solution sophistiquée qui comble le fossé entre les exigences techniques et la vision artistique. À mesure que l'industrie continue d'évoluer, des systèmes comme celui-ci joueront un rôle crucial dans la façonnement de l'avenir de l'animation et de la narration.

Source originale

Titre: FDLS: A Deep Learning Approach to Production Quality, Controllable, and Retargetable Facial Performances

Résumé: Visual effects commonly requires both the creation of realistic synthetic humans as well as retargeting actors' performances to humanoid characters such as aliens and monsters. Achieving the expressive performances demanded in entertainment requires manipulating complex models with hundreds of parameters. Full creative control requires the freedom to make edits at any stage of the production, which prohibits the use of a fully automatic ``black box'' solution with uninterpretable parameters. On the other hand, producing realistic animation with these sophisticated models is difficult and laborious. This paper describes FDLS (Facial Deep Learning Solver), which is Weta Digital's solution to these challenges. FDLS adopts a coarse-to-fine and human-in-the-loop strategy, allowing a solved performance to be verified and edited at several stages in the solving process. To train FDLS, we first transform the raw motion-captured data into robust graph features. Secondly, based on the observation that the artists typically finalize the jaw pass animation before proceeding to finer detail, we solve for the jaw motion first and predict fine expressions with region-based networks conditioned on the jaw position. Finally, artists can optionally invoke a non-linear finetuning process on top of the FDLS solution to follow the motion-captured virtual markers as closely as possible. FDLS supports editing if needed to improve the results of the deep learning solution and it can handle small daily changes in the actor's face shape. FDLS permits reliable and production-quality performance solving with minimal training and little or no manual effort in many cases, while also allowing the solve to be guided and edited in unusual and difficult cases. The system has been under development for several years and has been used in major movies.

Auteurs: Wan-Duo Kurt Ma, Muhammad Ghifary, J. P. Lewis, Byungkuk Choi, Haekwang Eom

Dernière mise à jour: 2023-09-26 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2309.14897

Source PDF: https://arxiv.org/pdf/2309.14897

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires