Simple Science

La science de pointe expliquée simplement

# Informatique# Vision par ordinateur et reconnaissance des formes# Intelligence artificielle# Graphisme

Avancées dans la création d'avatars humains réalistes

Une nouvelle méthode permet de créer des avatars humains détaillés et dynamiques.

― 9 min lire


Des avatars réalistesDes avatars réalistesfont peau neuve.réalisme et la flexibilité des avatars.Une approche hybride améliore le
Table des matières

Créer des avatars humains réalistes qui peuvent bouger et changer de vêtements est devenu un domaine de recherche super intéressant. L’objectif est de faire en sorte que ces avatars ressemblent vraiment à des gens, avec des détails précis pour leurs corps, visages, cheveux et vêtements. Les chercheurs cherchent des moyens de représenter ces avatars dans un espace tridimensionnel. Différentes méthodes ont été testées, mais chacune a ses forces et faiblesses.

Le Défi de la Création d'Avatars

Quand on crée des avatars, il est essentiel de bien associer les différentes parties du corps humain. Par exemple, le mouvement des vêtements est différent de celui des cheveux. Les méthodes traditionnelles qui utilisent des formes 3D (appelées maillages) fonctionnent bien pour certaines parties, comme le visage et le corps, mais moins pour d'autres, comme les cheveux fluides ou les vêtements lâches. C'est parce que les cheveux et les vêtements ont des formes complexes qui ne sont pas faciles à représenter avec de simples maillages.

Une Nouvelle Approche : Avatars Désentrelacés

Pour surmonter ces défis, une nouvelle méthode appelée Avatars Désentrelacés a été développée. Cette approche combine deux types de représentations 3D différentes : explicites (comme les maillages) et implicites (comme les champs de radiance neurale). La partie explicite est utilisée pour le corps et le visage, tandis que la partie implicite modélise les cheveux et les vêtements. Cette combinaison permet d’obtenir plus de détails et de réalisme lors de la création d’avatars.

Comment Ça Marche

Le processus commence avec une vidéo normale, souvent juste un feed d’une seule caméra. Le système des Avatars Désentrelacés prend cette vidéo et la traite. Il sépare les différentes composantes de l’avatar : le corps, les vêtements, les cheveux et le visage. Grâce à une méthode hybride, le système peut capturer les différentes propriétés des vêtements et des cheveux tout en gardant un look réaliste pour le corps.

Les Deux Applications Clés

Le système des Avatars Désentrelacés a deux principales utilisations. D’abord, il peut séparer le corps des vêtements, et ensuite, il peut séparer le visage des cheveux. De cette façon, chaque élément peut être détaillé et animé individuellement, permettant des changements de vêtements ou de coiffures tout en gardant le corps identique.

Le Rôle des Champs de Radiance Neurale

Les champs de radiance neurale, ou NeRFs, aident à représenter les cheveux et les vêtements parce qu’ils peuvent capturer les détails complexes bien mieux que les maillages. Ces champs prennent plusieurs images et apprennent à créer un espace 3D où ces détails peuvent être rendus. Cela donne des sorties visuelles de haute qualité qui ont l'air très réalistes.

Pourquoi le Désentrelacement Est Important

Créer un bon avatar ne se limite pas à le rendre attrayant ; il s'agit aussi de s'assurer que chaque partie bouge et se comporte correctement. Par exemple, la façon dont une personne bouge son corps sera différente de la façon dont ses cheveux flottent ou dont ses vêtements se déplacent. En désentrelacant ces composants, on peut obtenir un meilleur contrôle et une meilleure animation.

  1. Indépendance de Pose : En séparant les différentes parties, l’avatar peut être réutilisé dans différents environnements ou poses sans perdre en qualité.
  2. Modélisation Dynamique : Chaque partie peut être animée selon ses propriétés uniques, ce qui donne des mouvements réalistes.
  3. Propriétés des Matériaux : Différents matériaux reflètent la lumière différemment. En modélisant le corps, les cheveux et les vêtements séparément, le rendu peut tenir compte de ces différences, donnant un aspect plus vivant.

L'Approche Hybride vs. Méthodes Traditionnelles

La plupart des méthodes traditionnelles tendent à utiliser soit des maillages, soit des représentations neurales pour créer des avatars. Cela peut poser problème, car chaque partie pourrait ne pas être représentée de la meilleure manière. L’approche hybride, en revanche, tire parti des forces des deux méthodes :

  • Maillages : Ils sont efficaces pour modéliser la structure des visages et des corps.
  • NeRFs : Ils excellent dans la capture des apparences détaillées, surtout pour des structures complexes comme les vêtements ou les cheveux.

Cette combinaison a montré des promesses dans diverses applications, y compris les essayages virtuels et les jeux vidéo.

Méthodes Existantes et leurs Limitations

Les méthodes actuelles pour créer des avatars peuvent être divisées en deux catégories : les méthodes explicites qui utilisent des maillages et les méthodes implicites qui reposent sur des réseaux neuraux. Les méthodes explicites peuvent produire une bonne géométrie faciale mais ont souvent du mal avec les détails. Les méthodes implicites peuvent créer de superbes visuels mais ont des difficultés avec la géométrie et l’expression des formes corporelles.

Les Méthodes Explicites

Les méthodes explicites utilisent des modèles morphables 3D ou des représentations de forme statistique. Celles-ci sont bénéfiques pour reconstruire des visages mais ne gèrent généralement pas bien les vêtements complexes ou les cheveux. Même si elles peuvent bien capter la structure de base, elles manquent de détails nécessaires pour des caractéristiques fines.

Les Méthodes Implicites

D’un autre côté, les méthodes implicites utilisent des représentations neurales. Elles peuvent offrir des visuels époustouflants, mais elles ont souvent besoin de beaucoup de données pour l'entraînement et ne peuvent pas bien fonctionner avec des poses inconnues. Ainsi, elles finissent souvent par manquer des détails cruciaux pour des applications réelles où la variabilité est élevée.

Le Cadre des Avatars Désentrelacés

Le cadre des Avatars Désentrelacés rassemble de manière significative la modélisation explicite et implicite. Il utilise un design spécifique qui incorpore :

  1. Rendu Volumétrique Différentiable : Cela permet d’affiner les modèles de manière efficace en fonction des données capturées à partir de vidéos.
  2. Entraînement de Bout en Bout : Le système peut apprendre directement à partir des données sans avoir besoin de références 3D, facilitant la capture d'avatars réalistes.
  3. Haute fidélité : Les composants faciaux et corporels peuvent être rendus avec beaucoup de détails, avec des mouvements et un aspect réalistes.

Le Processus de Création d'Avatars Désentrelacés

Créer un avatar désentrelacé implique plusieurs étapes :

  1. Capture d'Entrée : Une vidéo simple est prise comme entrée initiale.
  2. Segmentation : Les différentes parties de l'avatar, comme les cheveux, les vêtements et le corps, doivent être identifiées. Cela aide à séparer les caractéristiques efficacement.
  3. Modélisation : En utilisant à la fois des méthodes explicites et implicites, le cadre commence à construire l’avatar.
  4. Rendu : Enfin, le modèle combiné est rendu, permettant des animations et des changements réalistes.

Avantages du Modèle Hybride

Le modèle hybride apporte plusieurs avantages à la création d'avatars :

  1. Flexibilité : Les utilisateurs peuvent changer de vêtements ou de coiffures sans affecter les autres composants.
  2. Haute Qualité : L'utilisation de NeRFs améliore la fidélité visuelle des vêtements et des cheveux, rendant les avatars plus vivants.
  3. Plage Dynamique : Le système peut afficher des expressions et des poses variées, rendant les avatars plus vivants et interactifs.

Applications des Avatars Désentrelacés

L'avènement de cette technologie ouvre la voie à de nombreuses applications :

  • Essayages Virtuels : Les gens peuvent voir comment différents vêtements rendent sur leurs avatars avant de faire un achat.
  • Jeux Vidéo : Créer des personnages qui peuvent changer d'apparence et de poses en temps réel ajoute une couche de personnalisation.
  • Téléprésence : Dans les réunions virtuelles, les avatars peuvent imiter les mouvements réels, rendant les interactions plus naturelles.

Résultats Pratiques

La recherche a conduit à des mises en œuvre pratiques qui montrent à quel point cette méthode est efficace dans des scénarios réels :

  1. Transfert de Vêtements : Les utilisateurs peuvent essayer différents vêtements virtuellement, où les vêtements s'adaptent parfaitement à leurs avatars.
  2. Coiffure : De même, les utilisateurs peuvent changer de coiffure, voyant comment différents styles leur vont sans aucun engagement dans le monde réel.
  3. Personnalisation dans les Jeux : Les joueurs peuvent concevoir leurs personnages en fonction de leur apparence réelle ou expérimenter des styles imaginatifs.

Directions Futures

Alors que la recherche continue, plusieurs domaines restent à explorer pour améliorer encore la technologie :

  1. Amélioration de la Segmentation : De meilleurs algorithmes pour identifier les différentes parties amélioreront la qualité globale de la sortie.
  2. Expansion à Plus de Poses : Des ensembles de données plus variés peuvent aider les modèles à apprendre à représenter les avatars dans diverses poses plus efficacement.
  3. Robustesse contre les Erreurs : Développer des techniques pour gérer les erreurs de segmentation améliorera la qualité visuelle finale des avatars.

Conclusion

Le développement des Avatars Désentrelacés en utilisant des méthodes hybrides marque un pas en avant significatif dans la création d'avatars humains réalistes. En combinant les forces des techniques de modélisation explicites et implicites, il devient possible de créer des avatars qui peuvent changer de vêtements et de styles tout en maintenant une haute fidélité dans les représentations visuelles. Cette approche innovante ouvre des possibilités passionnantes pour diverses applications, préparant le terrain pour l'avenir des avatars animés dans les environnements virtuels.

Source originale

Titre: Learning Disentangled Avatars with Hybrid 3D Representations

Résumé: Tremendous efforts have been made to learn animatable and photorealistic human avatars. Towards this end, both explicit and implicit 3D representations are heavily studied for a holistic modeling and capture of the whole human (e.g., body, clothing, face and hair), but neither representation is an optimal choice in terms of representation efficacy since different parts of the human avatar have different modeling desiderata. For example, meshes are generally not suitable for modeling clothing and hair. Motivated by this, we present Disentangled Avatars~(DELTA), which models humans with hybrid explicit-implicit 3D representations. DELTA takes a monocular RGB video as input, and produces a human avatar with separate body and clothing/hair layers. Specifically, we demonstrate two important applications for DELTA. For the first one, we consider the disentanglement of the human body and clothing and in the second, we disentangle the face and hair. To do so, DELTA represents the body or face with an explicit mesh-based parametric 3D model and the clothing or hair with an implicit neural radiance field. To make this possible, we design an end-to-end differentiable renderer that integrates meshes into volumetric rendering, enabling DELTA to learn directly from monocular videos without any 3D supervision. Finally, we show that how these two applications can be easily combined to model full-body avatars, such that the hair, face, body and clothing can be fully disentangled yet jointly rendered. Such a disentanglement enables hair and clothing transfer to arbitrary body shapes. We empirically validate the effectiveness of DELTA's disentanglement by demonstrating its promising performance on disentangled reconstruction, virtual clothing try-on and hairstyle transfer. To facilitate future research, we also release an open-sourced pipeline for the study of hybrid human avatar modeling.

Auteurs: Yao Feng, Weiyang Liu, Timo Bolkart, Jinlong Yang, Marc Pollefeys, Michael J. Black

Dernière mise à jour: 2023-09-12 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2309.06441

Source PDF: https://arxiv.org/pdf/2309.06441

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires