Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões# Gráficos

Sistema de IA transforma esboços em retratos de anime

Uma nova ferramenta de IA ajuda os usuários a criar retratos de anime bem acabados a partir de esboços simples.

― 6 min ler


Criação de Retratos deCriação de Retratos deAnime com IAde qualidade com a ajuda da IA.Transforme esboços em retratos de anime
Índice

Este artigo fala sobre um novo sistema que ajuda os usuários a criarem retratos de anime a partir de esboços simples. Desenhar anime pode ser complicado, especialmente para iniciantes, já que os esboços muitas vezes não têm detalhes. Esse sistema tem como objetivo fechar a lacuna entre os esboços rudimentares e retratos de anime de alta qualidade usando técnicas de inteligência artificial (IA). O processo envolve aprimorar os esboços enquanto os usuários desenham, transformando-os em imagens de anime polidas, traço por traço.

O Desafio de Desenhar Anime

Anime é um estilo de arte popular com características únicas. Diferente do desenho realista, anime usa linhas e formas mais abstratas. Isso dificulta a criação de imagens de alta qualidade a partir de esboços incompletos. Métodos tradicionais funcionam melhor com desenhos completos, deixando os usuários com opções limitadas quando começam com contornos grosseiros. O objetivo desse sistema é ajudar os usuários a receber orientações úteis enquanto esboçam, mesmo quando seus rascunhos não estão totalmente formados.

Nossa Nova Abordagem

Para enfrentar esses desafios, desenvolvemos um método que usa uma tecnologia chamada StyleGAN. Essa técnica nos permite manipular imagens de uma maneira que se ajusta melhor aos esboços dos usuários. O processo que criamos envolve duas etapas principais. Na primeira etapa, treinamos um codificador de imagem usando imagens de anime existentes. Na segunda etapa, usamos essas informações para ajudar os usuários enquanto desenham, permitindo que os esboços guiem a IA na geração de retratos de anime.

O que é StyleGAN?

StyleGAN é uma ferramenta de IA que ajuda a criar imagens de alta qualidade. Ela faz isso usando algo chamado Espaço Latente, que é como um mapa de características que descrevem diferentes aspectos de uma imagem. Ao manipular esse espaço latente, conseguimos ajustar as características da imagem gerada para corresponder ao esboço do usuário. Essa flexibilidade é essencial para produzir resultados variados que se alinhem com as intenções do usuário.

Entendendo o Processos de Desenho

O processo de desenho começa com o usuário fazendo traços em uma tela digital. Cada traço pode mudar a imagem que a IA gera em tempo real. Nosso sistema é projetado para reconhecer como cada traço contribui para a imagem final. Ele ajuda os usuários a criar um retrato de anime passo a passo, garantindo que a saída corresponda ao que o usuário desenhou o mais próximo possível.

Desentrelaçamento de Nível de Traço

Uma parte crítica do nosso método é algo que chamamos de desentrelaçamento de nível de traço. Isso significa que, enquanto os usuários desenham, o sistema pode identificar elementos separados de seus esboços e relacioná-los a características específicas na imagem final de anime. Por exemplo, quando um usuário desenha os olhos, a IA sabe focar em combinar a forma e o estilo dos olhos no retrato de anime gerado.

O Processo de Treinamento em Duas Etapas

Criamos um processo de treinamento em duas etapas para nosso sistema de IA.

Etapa Um: Treinando o Codificador de Imagem

Na primeira etapa, criamos um codificador de imagem treinado com imagens de anime existentes. Esse codificador aprende a traduzir retratos de anime completos para o espaço latente. Basicamente, ele aprende como representar diferentes características de um rosto de anime de uma maneira que o sistema pode usar depois.

Etapa Dois: Treinando o Codificador de Esboço

Na segunda etapa, desenvolvemos um codificador de esboço. Esse codificador aprende a converter esboços para o mesmo espaço latente que o codificador de imagem usa. Ele simula o processo de desenho gerando esboços passo a passo. Assim, conforme os usuários adicionam traços, o codificador adapta as características de anime correspondentes simultaneamente.

Gerando Orientação Durante o Desenho

Uma vez que o treinamento está completo, os usuários podem começar a desenhar. O sistema fornece imagens de orientação que mudam em tempo real. Os usuários desenham um esboço grosso, e nossa IA gera um retrato de anime correspondente que reflete os traços mais recentes. Esse retorno imediato ajuda os usuários a permanecerem focados e ver como suas ideias podem evoluir para uma arte de alta qualidade.

A Interface do Usuário

A interface do usuário é projetada para ser amigável. Ela registra automaticamente todos os traços e sua ordem, permitindo que o guia gerado acompanhe o desenho do usuário de forma fluida. Os usuários podem escolher entre diferentes modos de orientação. A orientação detalhada mostra um retrato completo como um prompt, enquanto a orientação áspera foca em seções específicas do rosto enquanto o usuário desenha.

Testando o Sistema

Para avaliar nosso sistema, realizamos uma série de testes para medir sua eficácia. Usamos métodos qualitativos e quantitativos.

Estudo de Usuários

Um grupo de participantes foi convidado a usar o sistema e criar retratos de anime. Eles compartilharam suas experiências e deram feedback sobre usabilidade, suporte à criatividade e satisfação geral. Os participantes perceberam que o sistema era útil porque permitia visualizar o resultado, mesmo que suas habilidades de desenho fossem limitadas.

Comparando Resultados

Comparámos as imagens geradas usando nossa abordagem com aquelas criadas por métodos tradicionais. Usando uma métrica conhecida como Distância de Início Fréchet (FID), medimos a semelhança das imagens geradas com os esboços de entrada. Um FID mais baixo indica que as imagens estão melhor correspondidas.

Benefícios do Sistema

Os usuários acharam que o sistema melhorou significativamente sua experiência de desenhar retratos de anime. Recebendo orientação em tempo real enquanto esboçavam, conseguiram criar imagens de alta qualidade, mesmo começando com contornos grosseiros. O feedback dos usuários indicou que a assistência da IA estimulou a criatividade e os incentivou a experimentar mais com seus desenhos.

Limitações e Direções Futuras

Embora os resultados sejam promissores, nosso sistema tem algumas limitações. Um problema principal é que os dados de treinamento consistiam principalmente de retratos de anime femininos, resultando em uma falta de diversidade nos resultados gerados. Explorar como gerar vários estilos e melhorar a representação de cabelos será essencial para melhorias futuras.

Conclusão

Nosso inovador sistema de geração de retratos de anime oferece assistência valiosa aos usuários durante o processo de desenho. Ao aproveitar a IA e um método de treinamento bem estruturado, conseguimos transformar esboços grosseiros em arte de anime polida. A eficácia do sistema é evidente a partir do feedback dos usuários, e estamos animados para aprimorar suas capacidades para suportar uma gama mais ampla de estilos artísticos e melhorar a funcionalidade geral.

Fonte original

Título: AniFaceDrawing: Anime Portrait Exploration during Your Sketching

Resumo: In this paper, we focus on how artificial intelligence (AI) can be used to assist users in the creation of anime portraits, that is, converting rough sketches into anime portraits during their sketching process. The input is a sequence of incomplete freehand sketches that are gradually refined stroke by stroke, while the output is a sequence of high-quality anime portraits that correspond to the input sketches as guidance. Although recent GANs can generate high quality images, it is a challenging problem to maintain the high quality of generated images from sketches with a low degree of completion due to ill-posed problems in conditional image generation. Even with the latest sketch-to-image (S2I) technology, it is still difficult to create high-quality images from incomplete rough sketches for anime portraits since anime style tend to be more abstract than in realistic style. To address this issue, we adopt a latent space exploration of StyleGAN with a two-stage training strategy. We consider the input strokes of a freehand sketch to correspond to edge information-related attributes in the latent structural code of StyleGAN, and term the matching between strokes and these attributes stroke-level disentanglement. In the first stage, we trained an image encoder with the pre-trained StyleGAN model as a teacher encoder. In the second stage, we simulated the drawing process of the generated images without any additional data (labels) and trained the sketch encoder for incomplete progressive sketches to generate high-quality portrait images with feature alignment to the disentangled representations in the teacher encoder. We verified the proposed progressive S2I system with both qualitative and quantitative evaluations and achieved high-quality anime portraits from incomplete progressive sketches. Our user study proved its effectiveness in art creation assistance for the anime style.

Autores: Zhengyu Huang, Haoran Xie, Tsukasa Fukusato, Kazunori Miyata

Última atualização: 2023-06-12 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2306.07476

Fonte PDF: https://arxiv.org/pdf/2306.07476

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes