Un système d'IA transforme des croquis en portraits anime
Un nouvel outil d'IA aide les utilisateurs à créer des portraits d'anime bien finis à partir de croquis brouillons.
― 7 min lire
Table des matières
Cet article parle d'un nouveau système qui aide les utilisateurs à créer des portraits d'anime à partir de croquis sommaires. Dessiner des personnages d'anime peut être compliqué, surtout pour les débutants, car les croquis manquent souvent de détails. Ce système vise à combler le fossé entre les croquis bruts et les portraits d'anime de haute qualité en utilisant des techniques d'intelligence artificielle (IA). Le processus consiste à affiner les croquis pendant que les utilisateurs dessinent, les transformant en images d'anime soignées, coup par coup.
Le Challenge de Dessiner des Anime
L'anime est un style artistique très populaire avec ses caractéristiques uniques. Contrairement au dessin réaliste, l'anime utilise des lignes et des formes plus abstraites. Ça complique la création d'images de qualité à partir de croquis incomplets. Les méthodes traditionnelles fonctionnent mieux avec des dessins complets, laissant aux utilisateurs peu d'options quand ils partent d'esquisses vagues. L'objectif de ce système est d'aider les utilisateurs à recevoir des conseils utiles pendant qu'ils esquissent, même si leurs ébauches ne sont pas complètement formées.
Notre Nouvelle Approche
Pour relever ces défis, nous avons développé une méthode qui utilise une technologie appelée StyleGAN. Cette technique nous permet de manipuler les images de manière à mieux correspondre aux croquis des utilisateurs. Le processus que nous avons conçu se déroule en deux étapes principales. Dans la première étape, nous formons un encodeur d'image en utilisant des images d'anime existantes. Dans la deuxième étape, nous utilisons ces informations pour aider les utilisateurs pendant qu'ils dessinent, permettant aux croquis de guider l'IA dans la génération de portraits d'anime.
Qu'est-ce que StyleGAN ?
StyleGAN est un outil en IA qui aide à créer des images de haute qualité. Il fait ça en utilisant quelque chose appelé un Espace latent, qui est comme une carte des caractéristiques décrivant différents aspects d'une image. En manipulant cet espace latent, on peut ajuster les caractéristiques de l'image générée pour qu'elles correspondent au croquis de l'utilisateur. Cette flexibilité est essentielle pour produire des résultats variés qui s'alignent avec les intentions de l'utilisateur.
Comprendre le Processus de Dessin
Le processus de dessin commence par l'utilisateur qui trace des traits sur une toile numérique. Chaque trait peut changer l'image que l'IA génère en temps réel. Notre système est conçu pour reconnaître comment chaque trait contribue à l'image globale. Il aide les utilisateurs à créer un portrait d'anime étape par étape, en veillant à ce que le résultat corresponde le plus possible à ce que l'utilisateur a dessiné.
Désentrelacement au Niveau des Traits
Une partie critique de notre méthode est ce que nous appelons le désentrelacement au niveau des traits. Cela signifie que pendant que les utilisateurs dessinent, le système peut identifier les éléments séparés de leurs croquis et les relier à des caractéristiques spécifiques dans l'image finale d'anime. Par exemple, quand un utilisateur dessine les yeux, l'IA sait se concentrer sur le fait de correspondre à la forme et au style des yeux dans le portrait d'anime généré.
Le Processus de Formation en Deux Étapes
Nous avons conçu un processus de formation en deux étapes pour notre système d'IA.
Étape Un : Formation de l'Encodeur d'Image
Dans la première étape, nous créons un encodeur d'image formé avec des images d'anime existantes. Cet encodeur apprend à traduire les portraits d'anime complétés dans l'espace latent. En gros, il apprend à représenter différentes caractéristiques d'un visage d'anime d'une manière que le système peut utiliser plus tard.
Étape Deux : Formation de l'Encodeur de Croquis
Dans la deuxième étape, nous développons un encodeur de croquis. Cet encodeur apprend à convertir les croquis dans le même espace latent utilisé par l'encodeur d'image. Il simule le processus de dessin en générant des croquis étape par étape. Ainsi, pendant que les utilisateurs ajoutent des traits, l'encodeur adapte les caractéristiques d'anime correspondantes simultanément.
Génération de Conseils Pendant le Dessin
Une fois la formation terminée, les utilisateurs peuvent commencer à dessiner. Le système leur fournit des images de guidance qui changent en temps réel. Les utilisateurs dessinent un croquis brut, et notre IA génère un portrait d'anime correspondant qui reflète les traits les plus récents. Ce retour immédiat aide les utilisateurs à rester concentrés et à voir comment leurs idées peuvent évoluer en art de haute qualité.
L'Interface Utilisateur
L'interface utilisateur est conçue pour être conviviale. Elle enregistre automatiquement tous les traits et leur ordre, permettant à la guidance générée d'accompagner le dessin de l'utilisateur sans accroc. Les utilisateurs peuvent choisir entre différents modes de guidance. La guidance détaillée montre un portrait complet comme un prompt, tandis que la guidance sommaire se concentre sur des sections spécifiques du visage pendant que l'utilisateur dessine.
Tester le Système
Pour évaluer notre système, nous avons réalisé une série de tests pour mesurer son efficacité. Nous avons utilisé des méthodes qualitatives et quantitatives.
Étude Utilisateur
Un groupe de participants a été invité à utiliser le système et à créer des portraits d'anime. Ils ont partagé leurs expériences et donné des retours sur la convivialité, le soutien à la créativité et la satisfaction générale. Les participants ont exprimé que le système était bénéfique car il leur permettait de visualiser le résultat même si leurs compétences en dessin étaient limitées.
Comparaison des Résultats
Nous avons comparé les images générées avec notre approche à celles créées par des méthodes traditionnelles. En utilisant une métrique appelée Fréchet Inception Distance (FID), nous avons mesuré à quel point les images générées étaient similaires aux croquis d'entrée. Un score FID plus bas indique que les images sont mieux assorties.
Avantages du Système
Les utilisateurs ont constaté que le système améliorait considérablement leur expérience de dessin de portraits d'anime. En recevant des conseils en temps réel pendant qu'ils esquissaient, ils pouvaient créer des images de haute qualité, même s'ils commençaient avec des esquisses sommaires. Les retours des utilisateurs ont indiqué que l'assistance IA favorisait la créativité et les encourageait à expérimenter davantage avec leurs dessins.
Limitations et Directions Futures
Bien que les résultats soient prometteurs, notre système a quelques limitations. Un problème principal est que les données d'entraînement étaient principalement constituées de portraits d'anime féminins, ce qui a conduit à un manque de diversité dans les résultats générés. Explorer comment générer divers styles et améliorer la représentation des cheveux sera essentiel pour de futures améliorations.
Conclusion
Notre système innovant de génération de portraits d'anime fournit une assistance précieuse aux utilisateurs pendant le processus de dessin. En tirant parti de l'IA et d'une méthode de formation bien structurée, nous permettons aux utilisateurs de transformer des croquis bruts en art d'anime soigné. L'efficacité du système est évidente grâce aux retours des utilisateurs, et nous sommes impatients d'améliorer ses capacités pour soutenir un éventail plus large de styles artistiques et améliorer la fonctionnalité globale.
Titre: AniFaceDrawing: Anime Portrait Exploration during Your Sketching
Résumé: In this paper, we focus on how artificial intelligence (AI) can be used to assist users in the creation of anime portraits, that is, converting rough sketches into anime portraits during their sketching process. The input is a sequence of incomplete freehand sketches that are gradually refined stroke by stroke, while the output is a sequence of high-quality anime portraits that correspond to the input sketches as guidance. Although recent GANs can generate high quality images, it is a challenging problem to maintain the high quality of generated images from sketches with a low degree of completion due to ill-posed problems in conditional image generation. Even with the latest sketch-to-image (S2I) technology, it is still difficult to create high-quality images from incomplete rough sketches for anime portraits since anime style tend to be more abstract than in realistic style. To address this issue, we adopt a latent space exploration of StyleGAN with a two-stage training strategy. We consider the input strokes of a freehand sketch to correspond to edge information-related attributes in the latent structural code of StyleGAN, and term the matching between strokes and these attributes stroke-level disentanglement. In the first stage, we trained an image encoder with the pre-trained StyleGAN model as a teacher encoder. In the second stage, we simulated the drawing process of the generated images without any additional data (labels) and trained the sketch encoder for incomplete progressive sketches to generate high-quality portrait images with feature alignment to the disentangled representations in the teacher encoder. We verified the proposed progressive S2I system with both qualitative and quantitative evaluations and achieved high-quality anime portraits from incomplete progressive sketches. Our user study proved its effectiveness in art creation assistance for the anime style.
Auteurs: Zhengyu Huang, Haoran Xie, Tsukasa Fukusato, Kazunori Miyata
Dernière mise à jour: 2023-06-12 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2306.07476
Source PDF: https://arxiv.org/pdf/2306.07476
Licence: https://creativecommons.org/licenses/by/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.