Avancées dans les techniques d'appariement de formes 3D
Une nouvelle méthode améliore l'appariement de formes 3D en utilisant des maillages et des nuages de points.
― 8 min lire
Table des matières
Faire correspondre des formes 3D est super important dans plein de domaines, comme la vision par ordinateur et les graphismes. Ça consiste à trouver quelles parties d'une forme correspondent à celles d'une autre forme. Ce truc, on l'étudie depuis longtemps, mais ça reste compliqué, surtout avec des formes non rigides qui peuvent changer de forme de plein de façons. Le défi devient encore plus grand quand les données sont bruyantes ou quand les structures des formes sont différentes.
Il y a deux manières courantes de représenter les formes 3D : les maillages triangulaires et les Nuages de points. Les maillages triangulaires donnent des infos détaillées sur la structure de la forme, alors que les nuages de points sont souvent utilisés pour collecter des données dans le monde réel, comme avec des scanners laser. Par contre, les nuages de points manquent des détails structurels qu'on trouve dans les maillages, ce qui peut rendre les correspondances moins précises.
Pour améliorer la correspondance entre ces deux types de données, une nouvelle approche combine les maillages triangulaires et les nuages de points dans un cadre d'Apprentissage auto-supervisé. Cette méthode permet d'obtenir de meilleurs résultats en utilisant les atouts des deux représentations.
Aperçu de la méthode
La méthode proposée utilise une combinaison de maillages triangulaires et de nuages de points pour l'entraînement. Elle développe une méthode solide pour faire correspondre les formes sans avoir besoin d'infos vérifiées sur les correspondances. L'entraînement utilise les infos des deux représentations, ce qui permet d'obtenir des résultats de correspondance plus robustes.
L'approche comprend deux parties principales : l'utilisation de Cartes fonctionnelles pour les maillages et une Perte contrastive pour créer un lien entre les deux types de données. Les cartes fonctionnelles sont une façon mathématique d'encodage des relations entre deux formes. La perte contrastive pousse à apprendre des caractéristiques qui sont cohérentes entre les deux représentations.
La méthode peut gérer différents scénarios : faire correspondre des maillages triangulaires, des nuages de points complets et même des nuages de points partiellement observés. En s'entraînant sur les deux types de données, elle atteint une meilleure correspondance, même dans des conditions difficiles.
Défis de la correspondance de formes
Quand il s'agit de faire correspondre des formes 3D, plusieurs défis se posent. Un gros souci est la variabilité due aux déformations des formes. Les formes peuvent se plier, s'étirer ou se comprimer, rendant difficile la recherche de correspondances directes. Un autre problème est le bruit dans les données, qui peut venir de diverses sources comme des erreurs de mesure ou des facteurs environnementaux.
Les techniques conçues pour les maillages triangulaires peinent souvent quand on les applique aux nuages de points. Utiliser directement des méthodes basées sur les maillages sur des nuages de points peut engendrer des chutes de performance à cause des différences dans la structure des données. Des méthodes améliorées qui peuvent gérer les deux représentations sont nécessaires pour atteindre une meilleure précision de correspondance.
Cadre d'entraînement
Le cadre d'entraînement utilisé dans cette méthode est auto-supervisé, ce qui veut dire qu'il ne dépend pas de données étiquetées manuellement pour apprendre des correspondances. Au lieu de ça, il utilise une combinaison de maillages et de nuages de points correspondants pour l'entraînement.
L'extracteur de caractéristiques joue un rôle crucial. Il apprend à extraire des caractéristiques à partir des maillages et des nuages de points. Ces caractéristiques sont ensuite utilisées pour construire une matrice de correspondance, montrant comment les points d'une forme correspondent à ceux de l'autre.
En plus, le cadre intègre une régularisation de carte fonctionnelle pour améliorer la qualité de la correspondance. Cette régularisation aide à maintenir les propriétés structurelles des formes tout en apprenant, menant à des correspondances plus précises.
Résultats
La nouvelle méthode montre son efficacité sur plusieurs ensembles de données de référence, affichant des résultats prometteurs dans divers scénarios de correspondance. Elle surpasse les méthodes existantes, y compris celles qui nécessitent des correspondances vérifiées et celles basées uniquement sur des nuages de points ou des maillages triangulaires.
Correspondance complète de formes
La méthode a été testée sur des ensembles de données standards spécialement conçus pour la correspondance de formes. Dans ces tests, elle a atteint de meilleurs résultats comparés aux méthodes traditionnelles basées sur des maillages ou des nuages de points. L'erreur géodésique moyenne, une mesure de la précision de correspondance, s'est significativement améliorée.
De plus, la méthode s'est montrée robuste même lorsqu'on a ajouté du bruit aux nuages de points. Cette capacité est particulièrement importante dans les applications réelles où la qualité des données peut varier.
Généralisation cross-dataset
Un autre avantage de la méthode est sa capacité à généraliser à travers différents ensembles de données. En s'entraînant sur un ensemble de données avec des formes synthétiques, elle a bien fonctionné sur des ensembles de données réelles sans nécessiter de réentraînement extensif. Cette caractéristique met en avant la flexibilité et l'efficacité de la méthode dans des conditions variées.
Correspondance partielle de formes
Le cadre traite aussi le problème de la correspondance de formes partielles, où seules des sous-ensembles des formes sont disponibles. Les tests ont montré que la méthode pouvait faire correspondre ces représentations incomplètes avec précision, ce qui est courant dans des scénarios réels comme le scan 3D.
Correspondance de vues partielles
Une capacité intéressante de cette méthode est de faire correspondre des vues partielles de formes à des formes complètes. Cette situation se produit souvent dans la pratique lorsqu'on manipule des données incomplètes. Les résultats ont indiqué que la méthode pouvait trouver des correspondances avec précision, même quand certaines parties de la forme étaient manquantes.
Applications en imagerie médicale
Pour montrer son potentiel dans le monde réel, la méthode a été appliquée à des images médicales. Ici, des formes pulmonaires 3D ont été reconstruites à partir de masques de segmentation pulmonaire obtenus à partir de scans CT. L'approche a réussi à faire correspondre ces formes avec des nuages de points partiels des données d'imagerie.
Cette application souligne l'utilité de la méthode dans des domaines où la correspondance de formes 3D est cruciale, comme la santé. Une correspondance précise peut soutenir de meilleurs diagnostics et plans de traitement basés sur des données d'imagerie médicale.
Limitations et travaux futurs
Bien que la méthode montre un grand potentiel, elle a quelques limitations. Elle peut avoir du mal avec des valeurs aberrantes sévères, où des points de données ne correspondent pas bien à la structure de forme attendue. Dans les scénarios avec beaucoup de bruit ou de distorsions, la précision de correspondance peut diminuer.
De plus, le cadre actuel ne prend pas complètement en compte l'invariance par rapport à la rotation. Bien que le processus d'entraînement puisse inclure des rotations aléatoires des formes pour améliorer la robustesse, il pourrait y avoir de nouvelles améliorations dans ce domaine.
Les recherches futures pourraient se concentrer sur l'amélioration du traitement des valeurs aberrantes et le renforcement de l'invariance de rotation. Alors que la correspondance de formes continue d'évoluer, intégrer des techniques plus sophistiquées pourrait élargir l'applicabilité et les performances de la méthode proposée.
Conclusion
Pour résumer, le nouveau cadre d'apprentissage auto-supervisé pour la correspondance de formes non rigides multimodales répond à de nombreux défis dans le domaine. En utilisant efficacement à la fois des maillages triangulaires et des nuages de points, il atteint une correspondance précise et robuste dans différents scénarios, y compris des formes complètes, partielles et bruyantes.
Les résultats montrent que cette approche surpasse non seulement les méthodes existantes mais promet également de grandes applications dans le monde réel, particulièrement dans des domaines comme l'imagerie médicale où la correspondance précise des formes est vitale. À mesure que la recherche continue, les avancées dans ce domaine mèneront probablement à des solutions encore plus innovantes pour les défis de correspondance de formes.
Titre: Self-Supervised Learning for Multimodal Non-Rigid 3D Shape Matching
Résumé: The matching of 3D shapes has been extensively studied for shapes represented as surface meshes, as well as for shapes represented as point clouds. While point clouds are a common representation of raw real-world 3D data (e.g. from laser scanners), meshes encode rich and expressive topological information, but their creation typically requires some form of (often manual) curation. In turn, methods that purely rely on point clouds are unable to meet the matching quality of mesh-based methods that utilise the additional topological structure. In this work we close this gap by introducing a self-supervised multimodal learning strategy that combines mesh-based functional map regularisation with a contrastive loss that couples mesh and point cloud data. Our shape matching approach allows to obtain intramodal correspondences for triangle meshes, complete point clouds, and partially observed point clouds, as well as correspondences across these data modalities. We demonstrate that our method achieves state-of-the-art results on several challenging benchmark datasets even in comparison to recent supervised methods, and that our method reaches previously unseen cross-dataset generalisation ability.
Auteurs: Dongliang Cao, Florian Bernard
Dernière mise à jour: 2023-03-20 00:00:00
Langue: English
Source URL: https://arxiv.org/abs/2303.10971
Source PDF: https://arxiv.org/pdf/2303.10971
Licence: https://creativecommons.org/licenses/by-nc-sa/4.0/
Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.
Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.