Avanzando i ritratti 3D con AgileGAN3D
Un nuovo metodo crea ritratti 3D dettagliati da una sola foto.
― 5 leggere min
Indice
Creare Ritratti 3D da una sola foto è una bella sfida. Mentre la gente riesce a trasformare immagini 2D in forme stilose, fare lo stesso per i ritratti 3D è ancora complicato. La principale difficoltà è la mancanza di immagini 3D di buona qualità per l'addestramento. Qui presentiamo un nuovo metodo chiamato AgileGAN3D che può prendere una foto normale e trasformarla in un ritratto 3D stiloso e dettagliato. Questo metodo richiede solo circa 20 immagini 2D normali come riferimento per lo stile.
La Sfida dei Ritratti 3D
La gente cerca più di un'immagine semplice di se stessa; vuole rappresentazioni creative e artistiche. Gli stili dei ritratti sono cambiati nel tempo, evolvendosi per includere arte astratta e cartoni animati. Mentre è facile realizzare ritratti stilizzati in 2D, trasformare un semplice selfie in un'opera d'arte 3D dettagliata è ancora un problema irrisolto. Il nostro metodo è unico perché può produrre questi ritratti 3D usando solo una foto dell'utente e pochi esempi di stile.
La principale sfida è la mancanza di dati 3D diversificati e di alta qualità. Di solito, i sistemi di avatar 3D si basano su molti asset grafici, che potrebbero non catturare la varietà vista nei volti reali. Di conseguenza, tali sistemi spesso producono risultati meno personalizzati.
Il Ruolo dei Modelli Generativi
Recenti modelli generativi hanno dimostrato di poter creare una vasta gamma di immagini grazie ai loro ampi Dati di addestramento. Tuttavia, trasformare ritratti artistici 2D in forme 3D continua a essere un problema. Lavori precedenti hanno avuto qualche successo con oggetti 3D generali, ma la qualità necessaria per i ritratti 3D non è ancora raggiunta.
Il nostro modello, AgileGAN3D, attinge ai progressi nei modelli che comprendono la geometria e possono creare immagini 3D di alta qualità da foto 2D normali. Raffinando ulteriormente il processo, puntiamo a rendere più facile creare ritratti 3D personalizzati.
Metodi Proposti
AgileGAN3D comprende diversi passaggi chiave per creare ritratti 3D di alta qualità con dettagli utilizzando solo alcune immagini di stile.
Passo 1: Creazione di Riferimenti di Stile
Per affrontare il problema della mancanza di dati di addestramento stilizzati, prima raccogliamo riferimenti di stile. Utilizziamo metodi esistenti usati per la stilizzazione 2D per creare molte immagini stilizzate aggiuntive basate su foto reali, assicurandoci di ottenere dati accurati sulla posizione della fotocamera quando sono state scattate queste immagini. Questi dati sono essenziali per i passaggi successivi.
Passo 2: Addestramento del Modello
Successivamente, perfezioniamo un modello 3D utilizzando le immagini stilizzate aggiuntive che abbiamo creato. Questo affinamento consente al modello di apprendere e generare ritratti 3D stilosi dai riferimenti di stile 2D. L'addestramento si concentra sul garantire che i ritratti siano belli da più angolazioni.
Passo 3: Codifica delle Immagini
Per trasformare un'immagine normale in un modello 3D, dobbiamo inserirla in uno spazio specifico che catturi bene le sue caratteristiche. Questo processo preserva l'identità della persona nella foto mentre consente la stilizzazione 3D.
Passo 4: Apprendimento Guidato
Per migliorare la qualità dei ritratti, utilizziamo l'apprendimento trasferito guidato. Questo passaggio aiuta ad allineare le immagini generate con i riferimenti di stile 2D originali, riducendo eventuali artefatti visivi che possono sorgere durante il processo di generazione.
Risultati e Prestazioni
Gli esperimenti con AgileGAN3D mostrano che crea efficacemente ritratti 3D dettagliati e stilosi. Il modello funziona bene con varie rappresentazioni di genere, forme del viso e pettinature, dimostrando di poter gestire diverse condizioni di illuminazione mantenendo risultati di alta qualità.
Confrontando AgileGAN3D con altri metodi, il nostro approccio si distingue per il mantenimento dei dettagli e della somiglianza. I ritratti generati tramite il nostro metodo mostrano una qualità e una preservazione dell'identità superiori ad altre tecniche.
Studi sugli Utenti
Per valutare le prestazioni di AgileGAN3D, abbiamo condotto studi sugli utenti insieme a valutazioni quantitative. I partecipanti hanno notato un miglioramento nella qualità dei ritratti generati dal nostro metodo rispetto ad altri. L'abbinamento di immagini reali con esempi stilizzati ha permesso rappresentazioni più accurate dei soggetti.
Limitazioni
Anche se il nostro metodo produce risultati impressionanti, ci sono ancora aree che possono essere migliorate. Alcuni problemi includono una tendenza dei ritratti generati a mostrare direzioni dello sguardo irrealistiche e occasionali perdite di dettaglio in accessori come occhiali e cappelli. Queste sfide derivano principalmente dalla limitata diversità nei dati di addestramento.
Impatto Sociale
Il nostro lavoro mira a migliorare la qualità della stilizzazione dei ritratti 3D, fornendo uno strumento per l'espressione creativa. Tuttavia, è importante essere cauti su come venga utilizzata questa tecnologia. C'è il potenziale per un uso improprio, come la creazione di immagini ingannevoli, il che solleva questioni etiche.
Conclusione
AgileGAN3D rappresenta un significativo passo avanti nella creazione di ritratti 3D di alta qualità da una singola foto dell'utente. Utilizzando un numero ridotto di esempi di stile 2D, introduce un metodo per affrontare le sfide in questo campo. Questo progresso non solo migliora l'espressione artistica ma apre anche possibilità per varie applicazioni, come la creazione di profili dinamici e contenuti personalizzati in ambienti virtuali. Continuando a perfezionare questa tecnologia, speriamo di affrontare le limitazioni esistenti e garantire un uso responsabile nella società.
Titolo: AgileGAN3D: Few-Shot 3D Portrait Stylization by Augmented Transfer Learning
Estratto: While substantial progresses have been made in automated 2D portrait stylization, admirable 3D portrait stylization from a single user photo remains to be an unresolved challenge. One primary obstacle here is the lack of high quality stylized 3D training data. In this paper, we propose a novel framework \emph{AgileGAN3D} that can produce 3D artistically appealing and personalized portraits with detailed geometry. New stylization can be obtained with just a few (around 20) unpaired 2D exemplars. We achieve this by first leveraging existing 2D stylization capabilities, \emph{style prior creation}, to produce a large amount of augmented 2D style exemplars. These augmented exemplars are generated with accurate camera pose labels, as well as paired real face images, which prove to be critical for the downstream 3D stylization task. Capitalizing on the recent advancement of 3D-aware GAN models, we perform \emph{guided transfer learning} on a pretrained 3D GAN generator to produce multi-view-consistent stylized renderings. In order to achieve 3D GAN inversion that can preserve subject's identity well, we incorporate \emph{multi-view consistency loss} in the training of our encoder. Our pipeline demonstrates strong capability in turning user photos into a diverse range of 3D artistic portraits. Both qualitative results and quantitative evaluations have been conducted to show the superior performance of our method. Code and pretrained models will be released for reproduction purpose.
Autori: Guoxian Song, Hongyi Xu, Jing Liu, Tiancheng Zhi, Yichun Shi, Jianfeng Zhang, Zihang Jiang, Jiashi Feng, Shen Sang, Linjie Luo
Ultimo aggiornamento: 2023-03-24 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2303.14297
Fonte PDF: https://arxiv.org/pdf/2303.14297
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.