Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões

Avançando Retratos 3D com o AgileGAN3D

Um novo método cria retratos 3D detalhados a partir de uma única foto.

― 5 min ler


Transformando Fotos emTransformando Fotos emRetratos 3Dinovadoras.criação de retratos com técnicasO AgileGAN3D tá revolucionando a
Índice

Criar Retratos 3D a partir de uma única foto é uma tarefa difícil. Enquanto as pessoas já conseguem transformar imagens 2D em formas estilizadas, fazer o mesmo com retratos 3D ainda é complicado. A principal razão pra isso é a falta de boas imagens 3D de qualidade pra treinamento. Aqui, apresentamos um novo método chamado AgileGAN3D, que pode pegar uma foto normal e transformá-la em um retrato 3D estiloso com detalhes finos. Esse método precisa só de cerca de 20 imagens 2D normais como referência de estilo.

O Desafio dos Retratos 3D

A galera quer mais do que uma simples imagem de si mesma; eles buscam representações criativas e artísticas. Os estilos de retrato mudaram ao longo do tempo, evoluindo pra incluir arte abstrata e de desenho animado. Enquanto é fácil fazer retratos estilizados em 2D, transformar um único selfie em uma obra de arte 3D detalhada ainda é um problema. Nosso método é único porque consegue produzir esses retratos 3D usando apenas uma foto do usuário e alguns exemplos de estilo.

O grande desafio é a falta de dados 3D diversos e de alta qualidade. Normalmente, os sistemas de avatar 3D dependem de muitos ativos gráficos, que podem não captar a variedade que vemos nas aparências da vida real. Por isso, esses sistemas costumam dar resultados menos personalizados.

O Papel dos Modelos Generativos

Modelos generativos recentes mostraram que conseguem criar uma ampla gama de imagens graças aos seus grandes Dados de Treinamento. No entanto, transformar retratos artísticos 2D em formas 3D continua sendo um problema. Trabalhos anteriores tiveram algum sucesso com objetos 3D gerais, mas a qualidade necessária para retratos 3D ainda não foi alcançada.

Nosso modelo, AgileGAN3D, se baseia em avanços em modelos que entendem geometria e podem criar imagens 3D de alta qualidade a partir de fotos 2D normais. Ao refinar ainda mais o processo, queremos facilitar a criação de retratos 3D personalizados.

Métodos Propostos

AgileGAN3D inclui várias etapas importantes pra criar retratos 3D de alta qualidade com características detalhadas usando apenas algumas imagens de estilo.

Etapa 1: Criando Referências de Estilo

Pra resolver o problema da falta de dados de treinamento estilizados, primeiro juntamos referências de estilo. Usamos métodos existentes de estilização 2D pra criar muitas imagens estilizadas adicionais baseadas em fotos reais, garantindo que consigamos dados precisos sobre a posição da câmera quando essas imagens foram tiradas. Esses dados são essenciais pras próximas etapas.

Etapa 2: Treinando o Modelo

Em seguida, ajustamos um modelo 3D usando as imagens estilizadas adicionais que criamos. Esse ajuste permite que o modelo aprenda e gere retratos 3D estilosos a partir das referências de estilo 2D. O treinamento se foca em garantir que os retratos fiquem bons de vários ângulos.

Etapa 3: Codificando Imagens

Pra transformar uma imagem normal em um modelo 3D, precisamos inseri-la em um espaço específico que capte bem suas características. Esse processo preserva a identidade da pessoa na foto enquanto permite que a estilização 3D aconteça.

Etapa 4: Aprendizado Guiado

Pra melhorar a qualidade dos retratos, usamos aprendizado transferido guiado. Essa etapa ajuda a alinhar as imagens geradas com as referências de estilo 2D originais, reduzindo quaisquer artefatos visuais que possam surgir durante o processo de geração.

Resultados e Desempenho

Experimentos com AgileGAN3D mostram que ele cria retratos 3D estilosos e detalhados de forma eficaz. O modelo se sai bem em várias representações de gênero, formatos de rosto e estilos de cabelo, mostrando que consegue lidar com diferentes condições de iluminação enquanto mantém resultados de alta qualidade.

Comparando AgileGAN3D com outros métodos, fica claro que nossa abordagem se destaca em termos de manter detalhes e semelhança. Os retratos gerados pelo nosso método têm uma qualidade e preservação da identidade superiores a outras técnicas.

Estudos com Usuários

Pra avaliar o desempenho do AgileGAN3D, fizemos estudos com usuários junto com avaliações quantitativas. Os participantes notaram uma melhora na qualidade dos retratos gerados pelo nosso método em comparação a outros. O emparelhamento de imagens reais com exemplos estilizados permitiu retratos mais precisos dos sujeitos.

Limitações

Embora nosso método produza resultados impressionantes, ainda há áreas que podem ser melhoradas. Alguns problemas incluem uma tendência dos retratos gerados a mostrarem direções de olhar irreais e perda ocasional de detalhes em acessórios como óculos e chapéus. Esses desafios surgem principalmente da diversidade limitada nos dados de treinamento.

Impacto Social

Nosso trabalho visa melhorar a qualidade da estilização de retratos 3D, fornecendo uma ferramenta pra expressão criativa. Porém, é importante ter cautela sobre como essa tecnologia é usada. Há potencial pra uso indevido, como criar imagens enganadoras, o que levanta considerações éticas.

Conclusão

AgileGAN3D representa um avanço significativo na criação de retratos 3D de alta qualidade a partir de uma única foto do usuário. Usando um pequeno número de exemplos de estilo 2D, ele introduz um método pra enfrentar os desafios nessa área. Esse avanço não só melhora a expressão artística, mas também abre possibilidades pra várias aplicações, como criar perfis dinâmicos e conteúdo personalizado em ambientes virtuais. À medida que continuamos a refinar essa tecnologia, esperamos abordar limitações existentes e garantir um uso responsável na sociedade.

Fonte original

Título: AgileGAN3D: Few-Shot 3D Portrait Stylization by Augmented Transfer Learning

Resumo: While substantial progresses have been made in automated 2D portrait stylization, admirable 3D portrait stylization from a single user photo remains to be an unresolved challenge. One primary obstacle here is the lack of high quality stylized 3D training data. In this paper, we propose a novel framework \emph{AgileGAN3D} that can produce 3D artistically appealing and personalized portraits with detailed geometry. New stylization can be obtained with just a few (around 20) unpaired 2D exemplars. We achieve this by first leveraging existing 2D stylization capabilities, \emph{style prior creation}, to produce a large amount of augmented 2D style exemplars. These augmented exemplars are generated with accurate camera pose labels, as well as paired real face images, which prove to be critical for the downstream 3D stylization task. Capitalizing on the recent advancement of 3D-aware GAN models, we perform \emph{guided transfer learning} on a pretrained 3D GAN generator to produce multi-view-consistent stylized renderings. In order to achieve 3D GAN inversion that can preserve subject's identity well, we incorporate \emph{multi-view consistency loss} in the training of our encoder. Our pipeline demonstrates strong capability in turning user photos into a diverse range of 3D artistic portraits. Both qualitative results and quantitative evaluations have been conducted to show the superior performance of our method. Code and pretrained models will be released for reproduction purpose.

Autores: Guoxian Song, Hongyi Xu, Jing Liu, Tiancheng Zhi, Yichun Shi, Jianfeng Zhang, Zihang Jiang, Jiashi Feng, Shen Sang, Linjie Luo

Última atualização: 2023-03-24 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2303.14297

Fonte PDF: https://arxiv.org/pdf/2303.14297

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes