Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões

Avanços nas Técnicas de Renderização 3D de Humanos

Novos métodos melhoram a renderização de humanos em vídeos com obstruções.

― 7 min ler


Inovações em Modelos 3DInovações em Modelos 3Dde Humanosocluídas.renderização de figuras humanasNovas técnicas enfrentam desafios na
Índice

Renderizar modelos 3D de humanos em movimento a partir de vídeos feitos com uma só câmera não é fácil. Isso fica ainda mais complicado quando objetos bloqueiam a visão da câmera, dificultando a obtenção de uma imagem completa. Apesar dos avanços na tecnologia, renderizar humanos com precisão nessas situações ainda é um desafio.

Muitas técnicas existentes têm dificuldades com obstruções. Um grande problema é que elas geralmente se baseiam em um sistema simples que tenta combinar pontos nas partes visíveis do corpo com pontos no vídeo. Isso pode resultar em grandes lacunas no modelo quando partes do corpo estão escondidas. Outro problema surge porque muitos métodos não consideram regras ou informações extras que poderiam ajudar a preencher as lacunas onde algumas partes do corpo não estão visíveis.

Para solucionar esses problemas, novas técnicas foram propostas. Esses métodos usam uma abordagem de Renderização Neural que lida melhor com cenas onde o corpo humano está parcialmente escondido. Eles fazem isso combinando formas geométricas que formam o corpo com informações sobre quais partes estão visíveis. Testando esses novos métodos em vídeos simulados e reais, os pesquisadores mostraram que eles têm um desempenho melhor que as técnicas tradicionais.

Criar representações 3D de humanos a partir de uma série de quadros de vídeo é importante em várias áreas, como robótica e saúde. O desafio está em conseguir recriar o corpo humano em detalhes, incluindo sua forma e movimento, a partir de dados incompletos. Muitas vezes é difícil capturar a mesma pessoa de ângulos diferentes ao mesmo tempo, então usar uma câmera só é o método mais comum.

A maioria dos métodos atuais para renderizar humanos não aborda o que acontece quando algumas partes do corpo estão bloqueadas. Eles tendem a assumir que a pessoa filmada está completamente visível. Mas na vida real, obstáculos costumam bloquear a visão, o que pode bagunçar o processo de renderização. Por causa disso, se os pesquisadores tentarem aplicar esses métodos existentes a vídeos onde partes do corpo estão escondidas, os resultados costumam ser ruins.

Em uma cena ideal, a câmera consegue ver todo o corpo humano claramente. No entanto, no mundo real, objetos podem bloquear a visão, dificultando a criação de uma boa renderização da pessoa. Isso leva a problemas adicionais porque muitos métodos não consideram as formas geométricas que compõem o corpo humano.

A maioria dos métodos tradicionais foca nas partes visíveis do corpo e ignora as áreas ocultas. Isso leva a resultados inesperados e faz com que a renderização final pareça irrealista. Se o modelo não tiver informações suficientes para preencher as partes obstruídas, pode gerar artefatos-falhas indesejadas na renderização.

Para melhorar a forma como humanos são renderizados em vídeos onde partes estão ocultas, novas técnicas foram criadas levando em conta essas obstruções. Uma das inovações chave envolve uma nova abordagem de renderização que observa uma área mais ampla do corpo em vez de focar só em pontos específicos. Isso permite que o processo de renderização faça suposições melhores sobre o que pode estar acontecendo nas áreas obstruídas.

Usando um método de renderização baseado em superfície, a nova abordagem consegue puxar mais dados sobre a forma do corpo humano e quais partes estão visíveis. Isso facilita a geração de uma imagem completa do corpo humano, mesmo quando algumas áreas não estão visíveis. O novo método dá atenção às áreas do corpo que são vistas com mais frequência, permitindo renderizações mais precisas e realistas.

Os pesquisadores também introduziram uma nova função de perda que incentiva o modelo a manter uma forma corporal completa, mesmo quando algumas partes estão escondidas. Usando essas técnicas, a qualidade das imagens renderizadas melhora significativamente.

Para testar os novos métodos, os pesquisadores usaram vários conjuntos de dados. Um conjunto continha vídeos de pessoas realizando diferentes atividades. Esses vídeos foram capturados sem obstáculos no caminho, e os pesquisadores simularam obstruções bloqueando partes do vídeo. Isso ajudou a entender como os novos métodos funcionaram em condições controladas.

Outro conjunto focou em vídeos de pessoas interagindo com diferentes objetos em cenários do mundo real. Esses vídeos naturalmente tinham obstruções devido à presença de objetos, dando aos pesquisadores a oportunidade de ver como os novos métodos lidariam com essas complicações.

Em ambos os experimentos, os novos métodos de renderização foram avaliados em relação às técnicas anteriores. Para avaliações qualitativas, os pesquisadores analisaram a qualidade visual dos humanos renderizados. Para avaliações quantitativas, usaram métricas como relação sinal-ruído de pico e similaridade estrutural.

Os resultados mostraram que os novos métodos superaram significativamente as técnicas existentes. Para casos com obstruções simuladas, a nova abordagem conseguiu renderizar uma geometria mais completa e produzir menos efeitos indesejados. Em situações do mundo real, os novos métodos também mostraram melhor detalhe e qualidade geral, mesmo quando muitas partes do corpo estavam escondidas.

Através da avaliação de diferentes aspectos do processo de renderização, os pesquisadores descobriram que as novas técnicas não só melhoraram as áreas visíveis do modelo humano, mas também forneceram soluções para preencher as partes ocultas. A abordagem usou informações sobre a superfície do corpo humano e padrões de Visibilidade para criar uma imagem mais completa.

Essa pesquisa demonstra o potencial dessas novas técnicas de renderização para avançar o campo da modelagem 3D de humanos. As descobertas mostram que é possível criar renderizações mais realistas de humanos em condições desafiadoras, como quando partes do corpo estão bloqueadas da vista.

Ao levar em conta a importância tanto da geometria quanto da visibilidade do corpo, esses novos métodos abrem caminho para melhores resultados de renderização em várias áreas, desde entretenimento até aplicações do mundo real, como realidade virtual ou robótica.

Além disso, ainda há muito espaço para mais investigações. Embora os novos métodos tenham se mostrado eficazes, ainda existem alguns desafios, como artefatos sutis que podem ocorrer devido à menor quantidade de dados de treinamento nas áreas obstruídas. Trabalhos futuros poderiam se concentrar em refinar as metodologias para minimizar essas questões e tornar o processo de renderização ainda melhor.

No geral, esse estudo representa um avanço significativo na renderização de humanos em várias condições e abre portas para mais melhorias na tecnologia usada para criar representações realistas do corpo humano usando uma única câmera. Ao continuar refinando esses métodos, os pesquisadores esperam expandir os limites do que é alcançável no mundo da modelagem e renderização 3D.

Fonte original

Título: Rendering Humans from Object-Occluded Monocular Videos

Resumo: 3D understanding and rendering of moving humans from monocular videos is a challenging task. Despite recent progress, the task remains difficult in real-world scenarios, where obstacles may block the camera view and cause partial occlusions in the captured videos. Existing methods cannot handle such defects due to two reasons. First, the standard rendering strategy relies on point-point mapping, which could lead to dramatic disparities between the visible and occluded areas of the body. Second, the naive direct regression approach does not consider any feasibility criteria (ie, prior information) for rendering under occlusions. To tackle the above drawbacks, we present OccNeRF, a neural rendering method that achieves better rendering of humans in severely occluded scenes. As direct solutions to the two drawbacks, we propose surface-based rendering by integrating geometry and visibility priors. We validate our method on both simulated and real-world occlusions and demonstrate our method's superiority.

Autores: Tiange Xiang, Adam Sun, Jiajun Wu, Ehsan Adeli, Li Fei-Fei

Última atualização: 2023-08-08 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2308.04622

Fonte PDF: https://arxiv.org/pdf/2308.04622

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes