Avanços em Modelagem 3D de Humanos com INS
Um novo método melhora a modelagem 3D realista de humanos vestidos.
― 6 min ler
Índice
Criar modelos 3D realistas e flexíveis de humanos vestidos a partir de imagens escaneadas e poses diferentes é complicado. As técnicas atuais para mudar as poses desses modelos enfrentam vários problemas. Elas costumam depender de um método chamado Linear Blend Skinning (LBS), que não é muito flexível e pode exigir muito processamento para criar novas poses. Além disso, esses métodos geralmente perdem detalhes importantes sobre como as superfícies dos modelos se alinham em diferentes poses.
Para resolver essas questões, foi introduzido um novo método chamado Invertible Neural Skinning (INS). Esse método ajuda a manter os alinhamentos das superfícies dos modelos e permite movimentos mais complexos. A ideia é aprender como as poses humanas mudam enquanto garante que os modelos possam permanecer fiéis à sua forma original.
Contexto
No passado, os pesquisadores tentavam construir modelos de humanos usando formas e texturas fixas. Esses modelos precisavam de regras específicas para representar o movimento do corpo de forma precisa. Avanços recentes mudaram o foco para métodos baseados em dados para construir representações humanas mais flexíveis. Porém, muitos desses novos métodos têm dificuldades em lidar com roupas e como elas se movimentam.
O problema está na definição das poses. Normalmente, as poses são descritas por um esqueleto feito de ossos, e o LBS é usado para ajustar as coordenadas da malha com base nesses ossos. No entanto, quando se trata de roupas soltas ou movimentos corporais complexos, o LBS pode falhar e levar a representações ruins.
Desafios dos Métodos Tradicionais
Muitos métodos existentes extraem uma nova malha para cada pose diferente, o que pode ser lento. Isso também significa que as conexões entre poses diferentes podem ser perdidas, levando a uma falta de consistência na aparência do modelo.
As limitações do LBS aparecem mais claramente com roupas fluídas e tecido corporal. Em modelos paramétricos, os ajustes são feitos usando correções lineares básicas que funcionam bem para formas simples, mas não são suficientes para movimentos complexos de roupas.
A Nova Abordagem
A nova abordagem, INS, usa Redes Neurais Invertíveis (INN). Essas redes podem criar uma ligação direta entre sua entrada (a pose atual) e sua saída (a nova pose) enquanto aprendem como mudar as formas desses modelos. Ao manter as conexões entre as poses, o INS permite animações mais detalhadas e precisas.
O INS apresenta uma Rede Invertível Condicionada pela Pose (PIN) para aprender como as poses mudam. Essa rede trabalha junto com um módulo LBS para criar um sistema de reposição abrangente que é eficiente e eficaz. Com isso, o INS não só acelera o tempo de processamento, mas também preserva as relações entre diferentes formas de superfície em várias poses.
Como o INS Funciona
O INS é projetado para funcionar em três partes principais:
Rede Invertível Condicionada pela Pose (PIN): Essa rede aprende como deformar a malha com base na pose. Ela usa duas PINs colocadas ao redor do módulo LBS. A primeira PIN captura mudanças antes da operação LBS, enquanto a segunda funciona depois. Esse método permite ajustes feitos de forma mais rápida e precisa.
Módulo LBS Diferenciável: Essa é a parte que realiza a reposição real do modelo com base nos pesos aprendidos da PIN. Ajuda a combinar as informações dos espaços canônicos e deformados.
Representação Canônica: Essa parte do sistema mantém uma versão "neutra" do modelo que não depende de nenhuma pose específica. Ao precisar extrair essa malha apenas uma vez, o sistema pode gerar novas poses rapidamente sem começar do zero.
Avaliação e Resultados
O INS foi testado em comparação com métodos existentes e mostrou melhorias significativas. Em particular, superou técnicas de reposição anteriores como o SNARF em termos de velocidade e precisão.
Ao olhar para humanos vestidos, o INS forneceu melhores resultados em termos de qualidade de superfície e velocidade. Ele também lidou melhor com poses mais complexas e manteve as correspondências de superfície, ou seja, os detalhes foram mantidos consistentes entre diferentes quadros.
Análise de Desempenho
Um aspecto importante do INS é como mantém os detalhes de roupas e pele. Usando tanto as PINs quanto o módulo LBS, ele pode representar detalhes intrincados como rugas e movimento do tecido muito melhor do que os métodos tradicionais. Isso significa que as animações parecem muito mais realistas e naturais.
A vantagem de velocidade do INS vem do seu design. Como ele precisa apenas de uma extração de malha única e pode reutilizar essa informação para várias poses, ele opera muito mais rápido. Métodos antigos que precisam extrair uma nova malha para cada pose podem se tornar lentos e complicados, especialmente quando muitas mudanças são necessárias.
Importância da Pesquisa
Ser capaz de criar modelos realistas de humanos para ambientes virtuais é crucial para aplicações em jogos, filmes e realidade virtual. O INS permite a criação de personagens mais dinâmicos e realistas, o que pode melhorar muito a experiência do usuário nessas áreas.
Os avanços feitos com o INS também refletem as mudanças em como os modelos 3D são criados. À medida que os pesquisadores se afastam dos modelos paramétricos rígidos, métodos como o INS pavimentam o caminho para o uso de abordagens baseadas em dados que aprendem com exemplos do mundo real.
Direções Futuras
Embora o INS represente um avanço significativo, ainda há espaço para melhorias. Trabalhos futuros poderiam se concentrar em otimizar o processo de busca de correspondência, permitindo reposições ainda mais rápidas e eficientes. Desenvolver novos tipos de redes que possam lidar com texturas e iluminação diretamente de imagens poderia melhorar ainda mais como esses modelos são criados e animados.
Além disso, explorar como criar esses modelos usando menos dados iniciais ou a partir de filmagens de vídeo poderia ampliar as aplicações potenciais dessa pesquisa. À medida que as técnicas melhoram, elas podem ser aplicadas a uma lista cada vez maior de usos, desde design de tecidos digitais até simulações educativas e de treinamento.
Conclusão
Em conclusão, o trabalho sobre Invertible Neural Skinning abre novas portas para a criação de modelos 3D animáveis e realistas de humanos vestidos. Ao enfrentar as limitações dos métodos tradicionais, o INS não só melhora o desempenho, mas também estabelece as bases para futuras inovações em modelagem e animação 3D. Com sua capacidade de preservar detalhes e acelerar os tempos de processamento, o INS provavelmente desempenhará um papel fundamental na evolução de como representamos e animamos humanos digitais em várias aplicações.
Título: Invertible Neural Skinning
Resumo: Building animatable and editable models of clothed humans from raw 3D scans and poses is a challenging problem. Existing reposing methods suffer from the limited expressiveness of Linear Blend Skinning (LBS), require costly mesh extraction to generate each new pose, and typically do not preserve surface correspondences across different poses. In this work, we introduce Invertible Neural Skinning (INS) to address these shortcomings. To maintain correspondences, we propose a Pose-conditioned Invertible Network (PIN) architecture, which extends the LBS process by learning additional pose-varying deformations. Next, we combine PIN with a differentiable LBS module to build an expressive and end-to-end Invertible Neural Skinning (INS) pipeline. We demonstrate the strong performance of our method by outperforming the state-of-the-art reposing techniques on clothed humans and preserving surface correspondences, while being an order of magnitude faster. We also perform an ablation study, which shows the usefulness of our pose-conditioning formulation, and our qualitative results display that INS can rectify artefacts introduced by LBS well. See our webpage for more details: https://yashkant.github.io/invertible-neural-skinning/
Autores: Yash Kant, Aliaksandr Siarohin, Riza Alp Guler, Menglei Chai, Jian Ren, Sergey Tulyakov, Igor Gilitschenski
Última atualização: 2023-03-04 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2302.09227
Fonte PDF: https://arxiv.org/pdf/2302.09227
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.