Simple Science

Ciência de ponta explicada de forma simples

# Informática# Visão computacional e reconhecimento de padrões# Inteligência Artificial# Geometria computacional

Avanços nas Técnicas de Correspondência de Formas em 3D

Um novo método melhora a comparação de formas 3D usando malhas e nuvens de pontos.

― 7 min ler


Inovações emInovações emCorrespondência de Formas3Dtarefas de correspondência de formas.Novos métodos melhoram a precisão nas
Índice

Combinar formas 3D é importante em várias áreas, como visão computacional e gráficos. Isso envolve descobrir quais partes de uma forma correspondem a partes de outra forma. Essa tarefa já é estudada há um bom tempo, mas ainda é complicada, especialmente quando lidamos com formas não rígidas, que podem mudar de forma de várias maneiras. O desafio fica ainda maior quando os dados têm ruído ou quando as formas têm estruturas diferentes.

Existem duas maneiras comuns de representar formas 3D: malhas triangulares e Nuvens de Pontos. Malhas triangulares fornecem informações detalhadas sobre a estrutura da forma, enquanto nuvens de pontos são frequentemente usadas na coleta de dados do mundo real, como de scanners a laser. No entanto, as nuvens de pontos não têm os detalhes estruturais encontrados nas malhas, o que pode tornar a correspondência menos precisa.

Para melhorar a correspondência de ambos os tipos de dados, uma nova abordagem combina malhas triangulares e nuvens de pontos em uma estrutura de aprendizado auto-supervisionada. Esse método gera melhores resultados de correspondência, aproveitando os pontos fortes de ambas as representações.

Visão Geral do Método

O método proposto utiliza uma combinação de malhas triangulares e nuvens de pontos para o treinamento. Ele desenvolve uma técnica forte para combinar formas sem precisar de informações de verdade de correspondências. O treinamento usa informações de ambas as representações, permitindo resultados de correspondência mais robustos.

A abordagem envolve duas partes principais: o uso de Mapas Funcionais para malhas e uma perda contrastiva para criar uma conexão entre os dois tipos de dados. Mapas funcionais se referem a uma maneira matemática de codificar a relação entre duas formas. A perda contrastiva incentiva o aprendizado de características que são consistentes em ambas as representações.

O método pode lidar com diferentes cenários: combinando malhas triangulares, nuvens de pontos completas e até nuvens de pontos parcialmente observadas. Ao treinar com ambos os tipos de dados, ele alcança uma correspondência melhor, mesmo em condições desafiadoras.

Desafios na Correspondência de Formas

Ao combinar formas 3D, vários desafios aparecem. Um grande problema é a variabilidade devido a deformações das formas. As formas podem dobrar, esticar ou comprimir, tornando difícil encontrar correspondências diretas. Outro problema é o ruído nos dados, que pode vir de várias fontes, como erros de medição ou fatores ambientais.

Técnicas projetadas para malhas triangulares costumam ter dificuldade quando aplicadas a nuvens de pontos. Usar métodos baseados em malhas diretamente nas nuvens de pontos pode levar a uma queda significativa no desempenho devido às diferenças na estrutura dos dados. É necessária uma melhoria nos métodos que conseguem lidar com ambas as representações para alcançar maior precisão na correspondência.

Estrutura de Treinamento

A estrutura de treinamento empregada neste método é auto-supervisionada, ou seja, não depende de dados rotulados manualmente para aprender correspondências. Em vez disso, usa uma combinação de malhas e nuvens de pontos correspondentes para o treinamento.

O extrator de características desempenha um papel crucial. Ele aprende a extrair características de malhas e nuvens de pontos. Essas características são então usadas para construir uma matriz de correspondência, mostrando como os pontos de uma forma correspondem aos pontos da outra.

Além disso, a estrutura incorpora uma regularização de mapa funcional para melhorar a qualidade da correspondência. Essa regularização ajuda a manter as propriedades estruturais das formas enquanto aprende, levando a correspondências mais precisas.

Resultados

O novo método demonstra sua eficácia em vários conjuntos de dados de referência, mostrando resultados promissores em vários cenários de correspondência. Ele supera métodos existentes, incluindo aqueles que requerem correspondências de verdade e aqueles baseados apenas em nuvens de pontos ou malhas triangulares.

Correspondência de Formas Completa

O método foi testado em conjuntos de dados padrão especificamente projetados para correspondência de formas. Nesses testes, ele obteve resultados melhores em comparação com métodos tradicionais baseados em malhas e nuvens de pontos. O erro geodésico médio, uma medida de precisão da correspondência, melhorou significativamente.

Além disso, o método se mostrou robusto mesmo quando ruído foi adicionado às nuvens de pontos. Essa capacidade é particularmente importante em aplicações do mundo real, onde a qualidade dos dados pode variar.

Generalização Entre Conjuntos de Dados

Outra vantagem do método é sua capacidade de generalizar entre diferentes conjuntos de dados. Ao ser treinado em um conjunto de dados com formas sintéticas, ele teve um bom desempenho em conjuntos de dados do mundo real sem precisar de re-treinamento extensivo. Essa característica destaca a flexibilidade e eficácia do método em condições diversas.

Correspondência de Formas Parciais

A estrutura também aborda a questão da correspondência de formas parciais, onde apenas subconjuntos das formas estão disponíveis. Testes mostraram que o método poderia corresponder com precisão essas representações incompletas, o que é comum em cenários do mundo real, como a digitalização 3D.

Correspondência de Visões Parciais

Uma capacidade interessante desse método é combinar visões parciais de formas com formas completas. Essa situação ocorre frequentemente na prática quando lidamos com dados incompletos. Os resultados indicaram que o método poderia encontrar correspondências com precisão, mesmo quando partes da forma estavam faltando.

Aplicações em Imagens Médicas

Para demonstrar seu potencial no mundo real, o método foi aplicado a imagens médicas. Aqui, formas pulmonares 3D foram reconstruídas a partir de máscaras de segmentação de pulmão obtidas de tomografias. A abordagem conseguiu combinar essas formas com nuvens de pontos parciais dos dados de imagem.

Essa aplicação destaca a utilidade do método em áreas onde a correspondência de formas 3D é crucial, como na saúde. A correspondência precisa pode apoiar melhores diagnósticos e planos de tratamento com base em dados de imagem médica.

Limitações e Trabalhos Futuros

Embora o método mostre grande potencial, ele tem algumas limitações. Ele pode ter dificuldades com outliers severos, onde os pontos de dados não se encaixam bem na estrutura esperada da forma. Em cenários com ruídos ou distorções significativas, a precisão da correspondência pode diminuir.

Além disso, a estrutura atual não leva plenamente em conta a invariância à rotação. Embora o processo de treinamento possa incluir rotação aleatória das formas para melhorar a robustez, pode haver mais melhorias nessa área.

Pesquisas futuras podem se concentrar em melhorar o manuseio de outliers e aprimorar a invariância à rotação. À medida que a correspondência de formas continua a evoluir, incorporar técnicas mais sofisticadas pode expandir a aplicabilidade e o desempenho do método proposto.

Conclusão

Resumindo, a nova estrutura de aprendizado auto-supervisionada para correspondência multimodal de formas não rígidas aborda muitos desafios no campo. Ao usar efetivamente tanto malhas triangulares quanto nuvens de pontos, ela alcança correspondências precisas e robustas em diferentes cenários, incluindo formas completas, parciais e com ruído.

Os resultados indicam que essa abordagem não apenas supera os métodos existentes, mas também tem um grande potencial para aplicações no mundo real, especialmente em áreas como imagem médica, onde a correspondência precisa de formas é vital. À medida que a pesquisa avança, os avanços nessa área provavelmente levarão a soluções ainda mais inovadoras para os desafios da correspondência de formas.

Fonte original

Título: Self-Supervised Learning for Multimodal Non-Rigid 3D Shape Matching

Resumo: The matching of 3D shapes has been extensively studied for shapes represented as surface meshes, as well as for shapes represented as point clouds. While point clouds are a common representation of raw real-world 3D data (e.g. from laser scanners), meshes encode rich and expressive topological information, but their creation typically requires some form of (often manual) curation. In turn, methods that purely rely on point clouds are unable to meet the matching quality of mesh-based methods that utilise the additional topological structure. In this work we close this gap by introducing a self-supervised multimodal learning strategy that combines mesh-based functional map regularisation with a contrastive loss that couples mesh and point cloud data. Our shape matching approach allows to obtain intramodal correspondences for triangle meshes, complete point clouds, and partially observed point clouds, as well as correspondences across these data modalities. We demonstrate that our method achieves state-of-the-art results on several challenging benchmark datasets even in comparison to recent supervised methods, and that our method reaches previously unseen cross-dataset generalisation ability.

Autores: Dongliang Cao, Florian Bernard

Última atualização: 2023-03-20 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2303.10971

Fonte PDF: https://arxiv.org/pdf/2303.10971

Licença: https://creativecommons.org/licenses/by-nc-sa/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes