Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Visione artificiale e riconoscimento di modelli# Multimedia

Nuovo Metodo per Trasformare Volti in Schizzi Artistici

Un nuovo approccio trasforma le foto del viso in disegni simili a esseri umani usando tecniche avanzate.

― 6 leggere min


Faccia a Schizzo: UnFaccia a Schizzo: UnNuovo Metodoinnovative.schizzi artistici grazie a tecnicheTrasformare le immagini facciali in
Indice

Creare schizzi artistici a partire da foto di volti è stata una sfida complicata nel campo dell'intelligenza artificiale. Questo processo, noto come sintesi di schizzi facciali (FSS), mira a prendere una foto del viso di una persona e trasformarla in un disegno che sembri fatto da un artista umano. I metodi tradizionali per generare schizzi spesso si basano su immagini bidimensionali semplici, ma i veri artisti usano tecniche più complesse che includono la comprensione delle forme tridimensionali. Questa comprensione della profondità e della struttura è fondamentale per creare schizzi realistici.

In questo lavoro, presentiamo un nuovo metodo chiamato Adattamento Dinamico Ispirato all'Umano (HIDA). Questo approccio migliora la qualità degli schizzi considerando sia le forme 3D che le apparenze 2D in modo più dinamico. Il nostro metodo utilizza diversi stili di disegno che sono coerenti in tutto lo schizzo, imitano il modo in cui gli artisti umani creano le loro opere. Osservando come disegnano gli artisti, puntiamo a migliorare la qualità e la varietà degli schizzi generati dai computer.

L'importanza della Geometria 3D nello schizzo

Gli artisti spesso usano contorni e ombreggiature per rappresentare oggetti tridimensionali. Quando un artista umano disegna un volto, guarda la profondità e la forma, non solo le caratteristiche superficiali. Usano diverse tecniche di ombreggiatura per rappresentare luce e texture. Ad esempio, gli artisti possono ombreggiare un naso per mostrare la sua forma o usare contorni per distinguere le caratteristiche facciali. Questa percezione della profondità consente loro di creare schizzi che catturano l'essenza di un volto, non solo la sua immagine piatta.

Nella FSS, riconoscere la forma 3D del viso può migliorare notevolmente il disegno finale. Incorporando le mappe di profondità, che sono rappresentazioni visive di quanto siano profonde o elevate diverse aree di un volto, possiamo guidare il processo di schizzo. Questo aggiunge un livello di realismo agli schizzi e li rende più espressivi.

L'approccio dell'artista allo schizzo

Per costruire il nostro metodo, abbiamo esaminato da vicino come gli artisti umani affrontano il loro lavoro. Abbiamo scoperto che di solito considerano vari fattori quando creano schizzi:

  1. Geometria locale: Gli artisti usano contorni astratti per definire le forme principali e aggiungono ombreggiature per indicare la profondità. Questo consente loro di trasmettere forme tridimensionali.

  2. Rappresentazione 2D: Colori, texture e illuminazione sono anch'essi fondamentali. Gli artisti umani variano le loro tecniche per catturare diverse apparenze, adattando il loro approccio a seconda di come la luce colpisce il soggetto.

  3. Stili multipli: Diversi artisti hanno stili unici, che possono includere modi diversi di ombreggiare o contornare. Ad esempio, alcuni possono usare linee più morbide mentre altri potrebbero preferire contrasti più forti.

  4. Coerenza: Nonostante queste variazioni, un artista di solito mantiene uno stile coerente all'interno di un singolo pezzo di lavoro. Questo significa che tutte le parti del disegno condividono una texture e un aspetto simile, che unisce l'opera.

Comprendendo come gli artisti pensano e lavorano, possiamo creare un programma informatico più efficace che genera schizzi che non sono solo accurati ma anche visivamente accattivanti.

Il metodo HIDA

Il nostro metodo Adattamento Dinamico Ispirato all'Umano (HIDA) combina geometria 3D e dettagli 2D per produrre schizzi di alta qualità. I componenti principali del nostro framework HIDA includono un aggiustamento dinamico delle caratteristiche basato su profondità, aspetto e stile.

Attivazione Dinamica

Una delle innovazioni chiave nel nostro metodo è la creazione di una nuova funzione di attivazione chiamata Informative ACON (InfoACON). Questa funzione consente al computer di decidere in modo più flessibile quando attivare determinate caratteristiche in base all'input ricevuto. Fondamentalmente, aiuta a determinare quando disegnare determinate linee o applicare ombreggiature, permettendo un approccio più simile a quello di un artista.

Normalizzazione dinamica

Un'altra caratteristica importante di HIDA è la normalizzazione dinamica, chiamata DySPADE. Questo processo regola il modo in cui le caratteristiche delle immagini vengono elaborate in base ai dettagli specifici dell'input. Utilizzando caratteristiche sia dalla mappa di profondità che dallo stile dell'immagine di input, possiamo creare un output più coeso e realistico.

Generazione di contorni deformabili

Per replicare il modo in cui lavorano gli artisti umani, il nostro metodo include quello che si chiama Generazione di Contorni Deformabili (DOG). Questo metodo ci consente di allineare caratteristiche a diverse scale, creando contorni che sono astratti ma distinti. Invece di semplicemente tracciare una foto, DOG permette allo schizzo di output di catturare l'essenza del volto in modo più artistico.

Esperimenti e risultati

Per valutare il nostro metodo HIDA, abbiamo condotto una serie di esperimenti utilizzando vari dataset. Questi includevano foto facciali impegnative con diversi stili, sfondi e condizioni di illuminazione. Abbiamo confrontato i nostri risultati con metodi esistenti per vedere quanto bene HIDA si comporta.

Confronti quantitativi

Abbiamo misurato le prestazioni di HIDA utilizzando vari criteri per valutare la qualità degli schizzi generati. Queste metriche includevano il realismo degli schizzi e quanto bene corrispondessero a quelli disegnati da artisti umani. I risultati hanno mostrato che il nostro metodo ha superato significativamente le tecniche precedenti. HIDA ha prodotto schizzi che non erano solo visivamente accattivanti ma preservavano anche le caratteristiche originali dei volti.

Valutazioni qualitative

Oltre ai confronti numerici, abbiamo anche condotto studi sugli utenti per raccogliere feedback soggettivi sui nostri schizzi. I partecipanti hanno visto schizzi sintetizzati insieme a disegni originali di artisti e sono stati invitati a scegliere quale preferivano. Remarkabilmente, oltre il 70% degli utenti ha preferito gli schizzi generati dal nostro metodo, evidenziando la sua efficacia nel creare opere d'arte accattivanti.

Capacità di generalizzazione

Uno dei punti di forza del metodo HIDA è la sua capacità di generalizzare attraverso vari contesti. Abbiamo applicato il nostro modello addestrato a volti catturati in situazioni spontanee, come la fotografia di strada, e scene naturali. I risultati hanno dimostrato che HIDA potrebbe produrre schizzi di alta qualità indipendentemente dalle condizioni dell'immagine originale. Questa robustezza consente applicazioni più ampie oltre a semplici foto di ritratti controllati.

Applicazione oltre i ritratti

Oltre a creare schizzi da immagini facciali, il nostro metodo può essere adattato ad altri compiti artistici. Abbiamo esplorato il suo utilizzo nella generazione di disegni a penna e altre forme di traduzione di immagini. I risultati hanno mostrato che HIDA potrebbe generare schizzi distintivi e accurati adatti a vari stili artistici, riaffermando la sua versatilità.

Conclusione

In sintesi, il nostro metodo Adattamento Dinamico Ispirato all'Umano rappresenta un notevole progresso nel campo della sintesi di schizzi facciali. Incorporando principi derivati da come gli artisti umani creano schizzi, possiamo produrre disegni di alta qualità e coerenti nello stile a partire da foto. La nostra ricerca rivela il potenziale di combinare la percezione della profondità con aggiustamenti dinamici nell'elaborazione delle immagini per ottenere risultati impressionanti.

Le implicazioni del nostro lavoro si estendono a future applicazioni sia nell'intelligenza artificiale che nella comunità artistica. Man mano che continuiamo a perfezionare i nostri metodi ed esplorare nuove possibilità, siamo entusiasti delle contribuzioni che HIDA può portare al mondo dell'arte digitale.

Fonte originale

Titolo: Human-Inspired Facial Sketch Synthesis with Dynamic Adaptation

Estratto: Facial sketch synthesis (FSS) aims to generate a vivid sketch portrait from a given facial photo. Existing FSS methods merely rely on 2D representations of facial semantic or appearance. However, professional human artists usually use outlines or shadings to covey 3D geometry. Thus facial 3D geometry (e.g. depth map) is extremely important for FSS. Besides, different artists may use diverse drawing techniques and create multiple styles of sketches; but the style is globally consistent in a sketch. Inspired by such observations, in this paper, we propose a novel Human-Inspired Dynamic Adaptation (HIDA) method. Specially, we propose to dynamically modulate neuron activations based on a joint consideration of both facial 3D geometry and 2D appearance, as well as globally consistent style control. Besides, we use deformable convolutions at coarse-scales to align deep features, for generating abstract and distinct outlines. Experiments show that HIDA can generate high-quality sketches in multiple styles, and significantly outperforms previous methods, over a large range of challenging faces. Besides, HIDA allows precise style control of the synthesized sketch, and generalizes well to natural scenes and other artistic styles. Our code and results have been released online at: https://github.com/AiArt-HDU/HIDA.

Autori: Fei Gao, Yifan Zhu, Chang Jiang, Nannan Wang

Ultimo aggiornamento: 2023-08-31 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2309.00216

Fonte PDF: https://arxiv.org/pdf/2309.00216

Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili