Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões

Transformando Esboços em Imagens Realistas

Um novo método cria imagens de alta qualidade a partir de esboços simples, independentemente da habilidade de desenho.

― 5 min ler


Transformação de EsboçoTransformação de Esboçoem Fotoimagens de alta qualidade sem esforço.Novo método transforma esboços em
Índice

As pessoas fazem esboços por vários motivos, seja por diversão, planejamento ou para expressar ideias. Mas nem todo mundo manda bem no desenho. Este texto apresenta um novo método pra transformar esboços simples ou abstratos em imagens realistas. O objetivo é criar imagens de Alta qualidade a partir de esboços, mesmo que esses esboços não sejam bem feitos.

Como Funciona

Tradicionalmente, pra transformar um esboço em uma foto, precisa de um mapa de contorno detalhado, que é um contorno preciso das formas. Nosso método é diferente porque consegue trabalhar com esboços feitos à mão livre e não precisa de um contorno perfeito. Isso torna o processo acessível pra todo mundo, independente da habilidade de desenho.

Usamos uma abordagem de treinamento especial chamada modelo de codificador-decodificador desacoplado. Basicamente, treinamos uma parte do modelo pra entender o esboço e outra parte, chamada decodificador, gera a foto final. O decodificador é baseado em um sistema chamado StyleGAN, que é projetado pra criar fotos realistas a partir de padrões aprendidos em imagens existentes.

Fechando a Lacuna

Um dos principais desafios nessa tarefa é a diferença entre esboços e fotos. Esboços podem ser bem rústicos e abstratos, enquanto fotos são super detalhadas e realistas. Pra resolver isso, criamos um mapeador de esboços. Esse mapeador aprende a conectar esboços às características correspondentes no espaço fotográfico do StyleGAN. Usando um conjunto de pares de exemplos de esboços e fotos, nosso modelo aprende como converter um esboço em uma foto realista.

Também focamos em melhorar a forma como nosso modelo lida com a ambiguidade nos esboços. Como os esboços podem variar muito em estilo e detalhamento, introduzimos estratégias pra tornar nosso modelo mais flexível. Um dos métodos consiste em gerar diferentes partes da foto final com base em quão detalhado é o esboço. Isso permite que o modelo ofereça uma variedade de imagens possíveis, dependendo da complexidade do esboço.

Vantagens do Nosso Método

Nossa abordagem tem várias vantagens principais:

  1. Imagens Realistas: Usar o StyleGAN garante que as imagens produzidas sejam de alta qualidade e pareçam realistas.
  2. Flexibilidade: O modelo consegue lidar bem com esboços rústicos, gerando imagens que ainda representam bem o objeto pretendido.
  3. Saída Controlada: Os usuários podem influenciar o quão próxima a foto gerada fica do seu esboço. Por exemplo, eles podem escolher manter certas características semelhantes ou permitir uma interpretação mais criativa.
  4. Menos Sensibilidade ao Ruído: Nosso método consegue ainda produzir bons resultados mesmo que os esboços tenham linhas extras ou estejam incompletos.

Comparação com Métodos Existentes

Muitos métodos mais antigos de transformação de esboços em imagens dependiam de regras rígidas sobre como os esboços deveriam ser. Esses métodos muitas vezes produziam resultados ruins quando enfrentavam esboços feitos à mão livre, já que esperavam um alto nível de precisão no desenho. Em contraste, nossa abordagem foi feita pra funcionar com qualquer tipo de esboço, independentemente da qualidade.

Comparamos nosso método com outros na área. Enquanto muitos métodos existentes tinham dificuldade com esboços abstratos, nosso modelo produzia resultados melhores consistentemente. As imagens eram mais realistas e capturavam o significado pretendido por trás dos esboços.

Aplicações

A capacidade de gerar imagens realistas a partir de esboços tem várias aplicações. Pode ser usada em áreas como:

  1. Design: Designers podem visualizar ideias rapidamente sem precisar criar ilustrações detalhadas.
  2. Educação: Professores podem usar essa tecnologia pra ajudar alunos a expressar sua criatividade sem se preocupar com habilidades artísticas.
  3. Jogos e Animação: Conceitos podem ser rapidamente transformados em ativos visuais, acelerando o processo de desenvolvimento.

Resultados

Em nossos testes, descobrimos que as imagens geradas pelo nosso modelo eram frequentemente elogiadas pela qualidade. Participantes do nosso estudo avaliaram as imagens como muito boas quando pedimos pra comparar com outros métodos.

Também fizemos experimentos onde pedimos às pessoas pra fazer esboços e depois usamos nosso modelo pra gerar imagens. Os resultados mostraram que nosso modelo refletia com precisão as ideias dos participantes, impressionando muitos deles.

Controle Fino

Uma das características únicas do nosso método é a capacidade de permitir controle fino sobre a saída. Os usuários podem escolher vários níveis de detalhe e realismo nas imagens com base em seus esboços. Isso significa que alguém que fornece um esboço rústico ainda pode receber uma imagem significativa, enquanto alguém que desenha com mais detalhe pode esperar que sua imagem reflita esse detalhe.

Lidando com Esboços Abstratos

Reconhecemos que os esboços podem ter muitas formas, desde os altamente detalhados até os bem abstratos. Nosso modelo consegue se ajustar a essas diferenças usando uma estratégia que prevê múltiplos resultados potenciais para um dado esboço. Essa abordagem permite que nosso método atenda a diferentes estilos de desenho, garantindo que os usuários recebam imagens relevantes a partir de seus esboços.

Resumo

Esse novo método de transformar esboços em imagens realistas representa um grande avanço. Ele torna possível que qualquer um crie imagens de alta qualidade a partir de seus desenhos sem precisar de habilidades artísticas avançadas. Usando um processo de treinamento especializado, desenvolvemos um modelo que entende as nuances dos esboços e pode produzir resultados impressionantes, independente da qualidade deles.

Em conclusão, a capacidade de gerar imagens fotorealistas a partir de esboços abre muitas possibilidades pra expressão criativa e aplicações práticas em várias áreas. Essa tecnologia vai empoderar mais pessoas a compartilhar suas ideias visualmente e tornar os processos de design mais eficientes.

Fonte original

Título: Picture that Sketch: Photorealistic Image Generation from Abstract Sketches

Resumo: Given an abstract, deformed, ordinary sketch from untrained amateurs like you and me, this paper turns it into a photorealistic image - just like those shown in Fig. 1(a), all non-cherry-picked. We differ significantly from prior art in that we do not dictate an edgemap-like sketch to start with, but aim to work with abstract free-hand human sketches. In doing so, we essentially democratise the sketch-to-photo pipeline, "picturing" a sketch regardless of how good you sketch. Our contribution at the outset is a decoupled encoder-decoder training paradigm, where the decoder is a StyleGAN trained on photos only. This importantly ensures that generated results are always photorealistic. The rest is then all centred around how best to deal with the abstraction gap between sketch and photo. For that, we propose an autoregressive sketch mapper trained on sketch-photo pairs that maps a sketch to the StyleGAN latent space. We further introduce specific designs to tackle the abstract nature of human sketches, including a fine-grained discriminative loss on the back of a trained sketch-photo retrieval model, and a partial-aware sketch augmentation strategy. Finally, we showcase a few downstream tasks our generation model enables, amongst them is showing how fine-grained sketch-based image retrieval, a well-studied problem in the sketch community, can be reduced to an image (generated) to image retrieval task, surpassing state-of-the-arts. We put forward generated results in the supplementary for everyone to scrutinise.

Autores: Subhadeep Koley, Ayan Kumar Bhunia, Aneeshan Sain, Pinaki Nath Chowdhury, Tao Xiang, Yi-Zhe Song

Última atualização: 2023-03-30 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2303.11162

Fonte PDF: https://arxiv.org/pdf/2303.11162

Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes