Simple Science

Ciencia de vanguardia explicada de forma sencilla

# Informática# Visión por Computador y Reconocimiento de Patrones# Gráficos

Avances en modelado humano 3D con INS

Un nuevo método mejora la modelación 3D realista de humanos vestidos.

― 6 minilectura


INS: Cambiando elINS: Cambiando elModelado 3D de Humanosmodelos 3D vestidos.Nuevo método mejora la reposición de
Tabla de contenidos

Crear modelos 3D realistas y flexibles de humanos vestidos a partir de imágenes escaneadas y diferentes poses es complicado. Las técnicas actuales para cambiar las poses de estos modelos enfrentan varios problemas. A menudo dependen de un método llamado Linear Blend Skinning (LBS), que no es muy flexible y puede requerir mucho procesamiento para crear nuevas poses. Además, estos métodos suelen perder detalles importantes sobre cómo se alinean las superficies de los modelos en diferentes poses.

Para abordar estos problemas, se introduce un nuevo método llamado Invertible Neural Skinning (INS). Este método ayuda a mantener las alineaciones de las superficies de los modelos y permite movimientos más complejos. La idea es aprender cómo cambian las poses humanas mientras se asegura que los modelos puedan mantenerse fieles a su forma original.

Contexto

En el pasado, los investigadores intentaban construir modelos de humanos usando formas y texturas fijas. Estos modelos necesitaban reglas específicas para representar el movimiento del cuerpo con precisión. Los avances recientes han cambiado hacia métodos basados en datos para construir representaciones humanas más flexibles. Sin embargo, muchos de estos nuevos métodos luchan con la ropa y cómo se mueve.

El problema radica en cómo se definen las poses. Típicamente, las poses se describen con un esqueleto hecho de huesos, y se utiliza LBS para ajustar las coordenadas de la malla según estos huesos. Sin embargo, cuando se trata de ropa suelta o movimientos corporales complejos, LBS puede quedarse corto y llevar a representaciones pobres.

Desafíos de los Métodos Tradicionales

Muchos métodos existentes extraen una nueva malla para cada pose diferente, lo que puede ser lento. Esto también significa que las conexiones entre diferentes poses pueden perderse, lo que lleva a una falta de consistencia en cómo aparece el modelo.

Las limitaciones de LBS se muestran más claramente con ropa fluida y tejido corporal. En los modelos paramétricos, se hacen ajustes usando correcciones lineales básicas que funcionan bien para formas simples, pero no son suficientes para movimientos complejos de ropa.

El Nuevo Enfoque

El nuevo enfoque, INS, utiliza Redes Neurales Invertibles (INN). Estas redes pueden crear un vínculo directo entre su entrada (la pose actual) y su salida (la nueva pose) mientras aprenden a cambiar las formas de estos modelos. Al mantener las conexiones entre poses, INS permite animaciones más detalladas y precisas.

INS presenta una Red Invertible Condicionada por Poses (PIN) para aprender cómo cambian las poses. Esta red trabaja junto a un módulo LBS para crear un sistema de reposes integral que es eficiente y efectivo. Al hacer esto, INS no solo acelera el tiempo de procesamiento, sino que también preserva las relaciones entre diferentes formas de superficie en varias poses.

Cómo Funciona INS

INS está diseñado para trabajar en tres partes principales:

  1. Red Invertible Condicionada por Poses (PIN): Esta red aprende a deformar la malla según la pose. Utiliza dos PINs colocados alrededor del módulo LBS. El primer PIN captura cambios antes de la operación LBS, mientras que el segundo trabaja después. Este método permite hacer ajustes de manera más rápida y precisa.

  2. Módulo LBS Diferenciable: Esta es la parte que realiza la reposes real del modelo en base a los pesos aprendidos del PIN. Ayuda a combinar la información de los espacios canónicos y deformados.

  3. Representación Canónica: Esta parte del sistema mantiene una versión "neutral" del modelo que no depende de ninguna pose específica. Al necesitar extraer esta malla solo una vez, el sistema puede generar nuevas poses rápidamente sin empezar desde cero.

Evaluación y Resultados

INS fue probado contra métodos existentes y mostró mejoras significativas. En particular, superó técnicas de reposes anteriores como SNARF tanto en velocidad como en precisión.

Al observar humanos vestidos, INS proporcionó mejores resultados en términos de calidad de superficie y velocidad. También manejó poses más complejas y mantuvo correspondencias de superficie, lo que significa que los detalles se mantuvieron consistentes en diferentes frames.

Análisis de Desempeño

Un aspecto importante de INS es cómo mantiene los detalles de la ropa y la piel. Al usar tanto los PINs como el módulo LBS, puede representar detalles intrincados como arrugas y movimiento de la tela mucho mejor que los métodos tradicionales. Esto significa que las animaciones se ven mucho más realistas y naturales.

La ventaja de velocidad de INS proviene de su diseño. Dado que solo requiere una extracción de malla única y puede reutilizar esa información para múltiples poses, funciona mucho más rápido. Los métodos más antiguos que necesitan extraer una nueva malla para cada pose pueden volverse lentos y engorrosos, especialmente cuando se necesitan muchos cambios.

Importancia de la Investigación

Poder crear modelos realistas de humanos para entornos virtuales es crucial para aplicaciones en juegos, cine y realidad virtual. INS permite la creación de personajes más dinámicos y realistas, lo que puede mejorar enormemente la experiencia del usuario en estos campos.

Los avances logrados con INS también reflejan los cambios en la forma en que se crean los modelos 3D. A medida que los investigadores se alejan de modelos paramétricos rígidos, métodos como INS marcan el camino hacia enfoques basados en datos que aprenden de ejemplos del mundo real.

Direcciones Futuras

Aunque INS representa un paso significativo hacia adelante, aún hay margen de mejora. El trabajo futuro podría centrarse en optimizar el proceso de búsqueda de correspondencias, lo que permitiría reposes aún más rápidas y eficientes. Desarrollar nuevos tipos de redes que puedan manejar texturas y iluminación directamente desde imágenes podría mejorar aún más cómo se crean y animan estos modelos.

Además, explorar cómo crear estos modelos usando menos datos iniciales o a partir de metraje de video podría ampliar las aplicaciones potenciales de esta investigación. A medida que las técnicas mejoren, pueden aplicarse a una lista en constante crecimiento de usos, desde diseño de telas digitales hasta simulaciones educativas y de entrenamiento.

Conclusión

En conclusión, el trabajo en Invertible Neural Skinning abre nuevas puertas para crear modelos 3D realistas y animables de humanos vestidos. Al abordar las limitaciones de los métodos tradicionales, INS no solo mejora el rendimiento, sino que también sienta las bases para futuras innovaciones en modelado y animación 3D. Con su capacidad para preservar detalles y acelerar tiempos de procesamiento, INS probablemente jugará un papel clave en la evolución de cómo representamos y animamos humanos digitales en varias aplicaciones.

Fuente original

Título: Invertible Neural Skinning

Resumen: Building animatable and editable models of clothed humans from raw 3D scans and poses is a challenging problem. Existing reposing methods suffer from the limited expressiveness of Linear Blend Skinning (LBS), require costly mesh extraction to generate each new pose, and typically do not preserve surface correspondences across different poses. In this work, we introduce Invertible Neural Skinning (INS) to address these shortcomings. To maintain correspondences, we propose a Pose-conditioned Invertible Network (PIN) architecture, which extends the LBS process by learning additional pose-varying deformations. Next, we combine PIN with a differentiable LBS module to build an expressive and end-to-end Invertible Neural Skinning (INS) pipeline. We demonstrate the strong performance of our method by outperforming the state-of-the-art reposing techniques on clothed humans and preserving surface correspondences, while being an order of magnitude faster. We also perform an ablation study, which shows the usefulness of our pose-conditioning formulation, and our qualitative results display that INS can rectify artefacts introduced by LBS well. See our webpage for more details: https://yashkant.github.io/invertible-neural-skinning/

Autores: Yash Kant, Aliaksandr Siarohin, Riza Alp Guler, Menglei Chai, Jian Ren, Sergey Tulyakov, Igor Gilitschenski

Última actualización: 2023-03-04 00:00:00

Idioma: English

Fuente URL: https://arxiv.org/abs/2302.09227

Fuente PDF: https://arxiv.org/pdf/2302.09227

Licencia: https://creativecommons.org/licenses/by/4.0/

Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.

Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.

Más de autores

Artículos similares