Avanços na Criação de Ambientes Virtuais
Novos métodos melhoram a edição de cenas 3D e a experiência do usuário em VR.
Hannah Schieber, Jacob Young, Tobias Langlotz, Stefanie Zollmann, Daniel Roth
― 8 min ler
Índice
A ideia de vivenciar cópias virtuais de lugares reais fascina a galera há muito tempo. Tem muitos locais incríveis pelo mundo que valem a pena ser capturados e explorados. As pessoas querem ver esses lugares de longe, documentá-los ou usá-los na educação ou em jogos. Mas, criar experiências virtuais de alta qualidade muitas vezes precisa de artistas 3D habilidosos ou equipamentos caros como scanners a laser.
Recentemente, os avanços tecnológicos permitem agora a criação de mundos 3D só com fotos. Essas tecnologias conseguem criar representações detalhadas de objetos ou até cenas inteiras. Um método específico chamado Gaussian Splatting (GS) é super útil, já que reduz o tempo para criar essas visuais, sendo perfeito para Realidade Virtual (VR).
Usando GS em VR, os usuários podem explorar ambientes quase realistas. Outra técnica chamada Novel View Synthesis (NVS) torna possível produzir imagens de novos ângulos sem precisar capturar essas partes específicas diretamente. Essa técnica é valiosa para VR, onde os usuários podem querer explorar áreas fora do caminho original da câmera.
Desafios nos Métodos Existentes
Embora o GS seja uma ferramenta poderosa, os ambientes criados com ele costumam ser difíceis de modificar. Para ajustar cenas ou adicionar novos Ativos 3D, é importante conseguir segmentar os Gaussians por tipo. Os métodos atuais de Segmentação de Gaussians geralmente focam em tipos de cena específicos, como arranjos circulares onde a câmera se move em torno de um objeto. Mas esses métodos não funcionam bem para cenas externas maiores e mais complexas, onde os objetos podem não ser facilmente categorizáveis.
Para resolver esse problema, foi proposta uma nova abordagem chamada Semantics-Controlled Gaussian Splatting (SCGS). Esse método permite separar elementos maiores de cenas em ambientes naturais que não são controlados ou definidos pelo movimento da câmera. O SCGS facilita a edição de cenas e a extração de partes para uso em VR.
Com essa nova abordagem, um conjunto de dados desafiador para ambientes externos foi criado, que vai além das limitações dos arranjos circulares tradicionais. Esse conjunto de dados mostra melhor qualidade visual e de segmentação comparado aos padrões atuais. Um estudo foi realizado para comparar as experiências dos usuários entre um vídeo regular, GS simples e SCGS em VR. Os resultados mostraram que os usuários preferiram o SCGS, confirmando que esse novo método melhora a experiência de forma significativa.
Tecnologia Por Trás da Cena
A abordagem SCGS visa melhorar a forma como os ambientes virtuais são gerados. Ela permite a criação de ativos 3D em grande escala adequados para diversas aplicações de VR. Ao combinar GS com segmentação semântica, esse método proporciona uma experiência mais fluida ao interagir com espaços virtuais.
No mundo da VR, surgem inúmeras possibilidades empolgantes. Isso vai de permitir que os usuários substituam partes de uma cena, como água ou céus estáticos, por ativos 3D dinâmicos que podem responder a ações do usuário. Por exemplo, um usuário poderia trocar um céu nublado em uma cena capturada por um céu azul claro, melhorando a experiência visual geral.
Com o SCGS, editar cenas se torna muito mais fácil. Usuários podem substituir ou remover grandes áreas da cena sem atrapalhar a integridade de objetos vizinhos. Essa capacidade é especialmente crítica para cenas externas onde características podem parecer semelhantes, dificultando a segmentação tradicional.
A Necessidade de um Novo Conjunto de Dados
A maioria dos conjuntos de dados de segmentação existentes foca em cenas internas controladas ou caminhos de câmera circulares. Eles não oferecem a mesma complexidade que as cenas externas possuem. Portanto, um novo conjunto de dados foi criado para capturar ambientes externos, apresentando elementos desafiadores como superfícies refletivas, árvores e água.
Esse conjunto de dados foi gravado usando várias câmeras Insta360 e captura diversas atividades como caiaque. O objetivo era obter poses de câmera abrangentes para garantir múltiplos ângulos de cada cena. O conjunto de dados foi rotulado usando classes conhecidas para permitir uma análise semântica.
Para garantir uma avaliação justa, o conjunto de dados é dividido em duas categorias: NVS puro, que inclui imagens tiradas de um ângulo padrão, e um conjunto que inclui comparações completas com métodos tradicionais. Isso permite que os pesquisadores compreendam melhor como o NVS funciona em vários cenários.
Como o SCGS Funciona
A técnica SCGS começa extraindo imagens de streams de vídeo contínuos e estimando as posições da câmera para estabelecer uma nuvem de pontos. Essa nuvem de pontos serve como base para a representação GS. Para melhorar a filtragem em 3D, um modelo semântico é aplicado para processar os dados de forma eficaz.
Durante o treinamento do modelo 3D Gaussian, perdas são utilizadas para ajustar a cena nos espaços RGB e semânticos. O objetivo é criar uma representação que possa ser visualizada de diferentes maneiras, permitindo a extração e modificação de partes específicas conforme necessário.
Esse método se desvia das abordagens convencionais que normalmente exigem classificadores separados para segmentação. Em vez disso, através do pipeline SCGS, IDs de classe são atribuídos diretamente durante o treinamento, o que simplifica bastante o processo. Isso garante que os elementos da cena possam ser identificados e editados de forma mais direta.
Melhorando a Qualidade e Usabilidade da Cena
O foco principal do SCGS é oferecer qualidade de segmentação superior, dando aos usuários a opção de modificar o ambiente. Diferente dos métodos anteriores, o SCGS permite a remoção seletiva de classes dentro de uma cena 3D, permitindo uma experiência virtual mais personalizada.
Essa capacidade se torna especialmente útil ao lidar com grandes cenas onde remover um objeto menor requer consideração cuidadosa. Em arranjos tradicionais, métodos complexos como cascas convexas são frequentemente usados, o que pode levar a alterações indesejadas na cena. O método SCGS simplifica esse processo, tornando a remoção de grandes componentes da cena tanto eficiente quanto precisa.
Além disso, a melhor qualidade de segmentação do método significa que os aspectos visuais da cena são preservados, melhorando a experiência virtual geral. Como resultado, o SCGS é útil para diversas aplicações além de apenas criar ambientes virtuais, incluindo áreas como turismo, educação e jogos interativos.
Experiência do Usuário
Estudos com usuários foram realizados para analisar quão eficaz é a técnica SCGS em comparação com métodos tradicionais de GS. Ao dar aos participantes a oportunidade de se mover livremente em um ambiente virtual, os pesquisadores puderam obter insights sobre preferências e interações.
Durante os estudos, os usuários foram expostos a diferentes ambientes criados com GS simples e SCGS. Os participantes relataram que o SCGS proporcionou uma maior sensação de presença e realismo, fazendo a experiência virtual parecer mais imersiva. Eles também apreciaram a interatividade oferecida pela integração de ativos 3D dinâmicos, como água em movimento e reflexos.
O feedback indicou que, embora os participantes tenham gostado das cenas aprimoradas pelo SCGS, também notaram áreas a melhorar, como a incorporação de som para aumentar ainda mais a imersão. Os resultados do estudo sugerem que os usuários geralmente preferem os elementos dinâmicos trazidos pelo SCGS, levando a uma experiência de VR mais envolvente.
Conclusão
Em resumo, o método SCGS marca um avanço significativo na geração de ambientes virtuais, especialmente para cenas externas que apresentam desafios únicos. Ao permitir uma segmentação eficaz e precisa dos elementos da cena, os usuários têm mais liberdade para modificar e explorar paisagens virtuais, criando uma experiência mais rica.
O desenvolvimento de um conjunto de dados desafiador para ambientes externos juntamente com o SCGS expandiu os horizontes do que é possível em VR, abrindo caminho para novos avanços. À medida que a tecnologia continua a evoluir, o SCGS promete não apenas para jogos e aplicações educacionais, mas também para aprimorar experiências culturais através do turismo virtual.
Os estudos indicam uma preferência clara pelo SCGS em termos de experiências dos usuários, estabelecendo uma base para pesquisas contínuas em melhorar ambientes virtuais. Trabalhos futuros poderiam explorar elementos ainda mais interativos e integrar design de som para criar experiências virtuais totalmente imersivas.
No fim das contas, o SCGS capacita os usuários a interagir com ambientes virtuais em grande escala de forma mais eficaz, levando a experiências aprimoradas em entretenimento, educação e além. Ao combinar técnicas avançadas com design cuidadoso, o futuro da VR parece promissor e cheio de potencial.
Título: Semantics-Controlled Gaussian Splatting for Outdoor Scene Reconstruction and Rendering in Virtual Reality
Resumo: Advancements in 3D rendering like Gaussian Splatting (GS) allow novel view synthesis and real-time rendering in virtual reality (VR). However, GS-created 3D environments are often difficult to edit. For scene enhancement or to incorporate 3D assets, segmenting Gaussians by class is essential. Existing segmentation approaches are typically limited to certain types of scenes, e.g., ''circular'' scenes, to determine clear object boundaries. However, this method is ineffective when removing large objects in non-''circling'' scenes such as large outdoor scenes. We propose Semantics-Controlled GS (SCGS), a segmentation-driven GS approach, enabling the separation of large scene parts in uncontrolled, natural environments. SCGS allows scene editing and the extraction of scene parts for VR. Additionally, we introduce a challenging outdoor dataset, overcoming the ''circling'' setup. We outperform the state-of-the-art in visual quality on our dataset and in segmentation quality on the 3D-OVS dataset. We conducted an exploratory user study, comparing a 360-video, plain GS, and SCGS in VR with a fixed viewpoint. In our subsequent main study, users were allowed to move freely, evaluating plain GS and SCGS. Our main study results show that participants clearly prefer SCGS over plain GS. We overall present an innovative approach that surpasses the state-of-the-art both technically and in user experience.
Autores: Hannah Schieber, Jacob Young, Tobias Langlotz, Stefanie Zollmann, Daniel Roth
Última atualização: 2024-09-24 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2409.15959
Fonte PDF: https://arxiv.org/pdf/2409.15959
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.