Simple Science

La science de pointe expliquée simplement

# Mathématiques# Vision par ordinateur et reconnaissance des formes# Intelligence artificielle# Probabilité

Nouvelle méthode pour l'enregistrement de nuages de points non supervisé

Une nouvelle approche aligne des nuages de points 3D sans données étiquetées.

― 7 min lire


Nuages de points : PasNuages de points : Pasbesoin d'étiquettescoûteuses.Aligner des données 3D sans étiquettes
Table des matières

L'enregistrement de nuages de points, c'est un processus qui permet d'aligner deux ensembles de points 3D qui peuvent se chevaucher partiellement. C'est super important dans plein de domaines, comme la robotique, la réalité augmentée et la conduite autonome. Par contre, les méthodes existantes demandent souvent des données étiquetées pour être vraiment efficaces.

Pour résoudre ces problèmes, une nouvelle approche a été développée qui ne nécessite aucune donnée étiquetée. Cette méthode utilise un modèle statistique pour apprendre à enregistrer des nuages de points qui ne se chevauchent que partiellement.

Vue d'ensemble de l'approche

La nouvelle méthode est basée sur l'apprentissage de distributions de probabilité à partir des nuages de points. En appliquant un algorithme spécial appelé l'Algorithme de Sinkhorn, la méthode peut établir des connexions entre les différentes parties des deux nuages de points.

Le processus d'apprentissage est guidé par trois principaux types de pertes qui s'assurent que le modèle apprend à faire cela efficacement : la cohérence interne, la cohérence croisée et la perte contrastive locale. Ces composants fonctionnent ensemble pour assurer que les caractéristiques apprises à partir des nuages de points soient cohérentes, même en cas de chevauchement partiel.

Qu'est-ce que l'enregistrement de nuages de points ?

L'enregistrement de nuages de points vise à trouver la meilleure transformation qui peut aligner deux nuages de points dans un seul système de coordonnées. C'est particulièrement utile dans les applications où des données 3D sont collectées sous différents angles ou par différents capteurs.

Le processus d'enregistrement nécessite souvent de faire correspondre des points d'un nuage à ceux d'un autre. Mais quand les nuages n'ont qu'un chevauchement partiel, ça devient compliqué. Dans beaucoup de méthodes actuelles, le succès de l'enregistrement dépend d'avoir accès à des données étiquetées, ce qui est souvent difficile à obtenir.

Défis avec les méthodes existantes

Il y a deux types principaux de méthodes d'enregistrement de nuages de points : sans correspondance et basées sur la correspondance.

  1. Méthodes sans correspondance : Ces méthodes examinent les caractéristiques globales des nuages de points et essaient de minimiser les différences entre eux. Mais ces techniques échouent souvent dans des scénarios réels où les nuages ne se chevauchent pas complètement.

  2. Méthodes basées sur la correspondance : Ces méthodes essaient de trouver des points individuels dans un nuage qui correspondent à ceux d'un autre. Le problème, c'est que si les nuages ont des densités de points très différentes ou des motifs répétitifs, c'est difficile de faire des correspondances fiables.

En plus, beaucoup de méthodes existantes ont besoin de beaucoup de données étiquetées pour l'entraînement, ce qui peut prendre beaucoup de temps et coûter cher à rassembler.

Solution proposée

Pour aborder ces problèmes, un nouveau cadre d'apprentissage non supervisé a été proposé. Cette méthode permet l'enregistrement de nuages de points avec des chevauchements partiels sans avoir besoin de données étiquetées.

Les principales innovations de cette méthode incluent :

  • Apprendre des distributions de probabilité à partir des nuages de points.
  • Utiliser l'algorithme de Sinkhorn pour établir des connexions entre les distributions.
  • Concevoir des fonctions de perte qui aident le modèle à apprendre de manière non supervisée.

Apprentissage des distributions de probabilité

Le cadre commence par utiliser un réseau spécialisé pour apprendre les distributions de probabilité des nuages de points. Chaque nuage de points est modélisé comme un mélange de distributions gaussiennes. Ça veut dire que les points dans le nuage sont considérés comme provenant d'une collection de courbes en cloche qui se chevauchent.

Les paramètres de ces distributions sont appris durant le processus d'entraînement. De cette manière, le modèle peut capturer la structure sous-jacente de chaque nuage de points de manière précise.

L'algorithme de Sinkhorn

Une fois que les distributions de probabilité sont apprises, l'algorithme de Sinkhorn est utilisé pour établir des correspondances entre les deux nuages de points. Cet algorithme aide à faire correspondre différentes parties des nuages tout en maintenant les propriétés des distributions.

L'algorithme de Sinkhorn fonctionne en ajustant les correspondances en fonction des poids des distributions, s'assurant que les correspondances apprises sont significatives même lorsque les nuages de points ne se chevauchent que partiellement.

Fonctions de perte pour l'apprentissage non supervisé

Trois fonctions de perte sont conçues pour améliorer le processus d'apprentissage :

  1. Perte de cohérence interne : Cette perte encourage les distributions de probabilité apprises des nuages de points à être les mêmes dans les espaces de coordonnées et de caractéristiques. En s'assurant que les deux distributions correspondent, le modèle apprend à maintenir la cohérence dans ses caractéristiques.

  2. Perte de cohérence croisée : Cette perte se concentre sur s'assurer que les points de deux nuages partiellement superposés qui appartiennent au même cluster partagent le même centroïde de cluster. Cela aide le modèle à apprendre des caractéristiques qui sont invariantes aux transformations.

  3. Perte contrastive locale : Cette perte aide à encourager le modèle à apprendre des caractéristiques qui sont non seulement distinctes mais qui prennent aussi en compte la structure locale des nuages de points. C'est important car beaucoup d'objets réels ne sont pas complètement visibles, et les caractéristiques locales peuvent fournir des informations précieuses.

Évaluation de la méthode

La performance de la méthode proposée est évaluée sur plusieurs ensembles de données disponibles publiquement, dont 3DMatch, 3DLoMatch, ModelNet et ModelLoNet. Les résultats montrent que la nouvelle méthode surpasse les approches non supervisées existantes et rivalise même avec certaines méthodes supervisées en termes de précision.

Ensembles de données de test

  • 3DMatch : Cet ensemble de données comprend diverses scènes intérieures avec des fragments de nuages de points partiellement superposés.
  • 3DLoMatch : Semblable à 3DMatch, cet ensemble de données contient aussi des scènes intérieures mais avec un chevauchement moyen plus bas.
  • ModelNet : Cet ensemble contient des modèles CAO de plusieurs catégories, permettant de tester la méthode sur différents types d'objets.
  • ModelLoNet : Une variation de ModelNet mais avec de moindres chevauchements entre les modèles.

Métriques de performance

La performance de la méthode est mesurée à l'aide de plusieurs métriques, y compris :

  • Erreur de rotation relative (RRE) : Cela mesure la précision de la transformation de rotation.
  • Erreur de translation relative (RTE) : Cela mesure la précision de la transformation de translation.
  • Rappel d'enregistrement (RR) : C'est le pourcentage de paires de nuages de points où l'erreur de transformation est en dessous d'un certain seuil.

Les résultats indiquent que la méthode proposée atteint un rappel d'enregistrement plus élevé et des erreurs de rotation et de translation plus faibles par rapport aux méthodes existantes.

Conclusion

En résumé, le cadre d'enregistrement probabiliste profond et non supervisé proposé offre une solution robuste pour aligner des nuages de points avec des chevauchements partiels. En s'appuyant sur des distributions de probabilité et des fonctions de perte innovantes, la méthode s'attaque efficacement aux limitations des approches existantes qui dépendent fortement des données étiquetées.

Cette avancée a d'énormes implications pour des applications en robotique, réalité augmentée et d'autres domaines nécessitant un alignement précis des données 3D. La méthode non seulement performe bien sur des ensembles de données de référence, mais elle montre aussi une polyvalence pour traiter des scénarios réels où obtenir des données étiquetées peut être un vrai défi.

Les futures orientations de cette recherche incluent des améliorations supplémentaires du cadre, des applications potentielles dans d'autres domaines de la vision par ordinateur, et l'exploration d'algorithmes plus efficaces pour des tâches d'enregistrement de nuages de points à grande échelle.

Source originale

Titre: Unsupervised Deep Probabilistic Approach for Partial Point Cloud Registration

Résumé: Deep point cloud registration methods face challenges to partial overlaps and rely on labeled data. To address these issues, we propose UDPReg, an unsupervised deep probabilistic registration framework for point clouds with partial overlaps. Specifically, we first adopt a network to learn posterior probability distributions of Gaussian mixture models (GMMs) from point clouds. To handle partial point cloud registration, we apply the Sinkhorn algorithm to predict the distribution-level correspondences under the constraint of the mixing weights of GMMs. To enable unsupervised learning, we design three distribution consistency-based losses: self-consistency, cross-consistency, and local contrastive. The self-consistency loss is formulated by encouraging GMMs in Euclidean and feature spaces to share identical posterior distributions. The cross-consistency loss derives from the fact that the points of two partially overlapping point clouds belonging to the same clusters share the cluster centroids. The cross-consistency loss allows the network to flexibly learn a transformation-invariant posterior distribution of two aligned point clouds. The local contrastive loss facilitates the network to extract discriminative local features. Our UDPReg achieves competitive performance on the 3DMatch/3DLoMatch and ModelNet/ModelLoNet benchmarks.

Auteurs: Guofeng Mei, Hao Tang, Xiaoshui Huang, Weijie Wang, Juan Liu, Jian Zhang, Luc Van Gool, Qiang Wu

Dernière mise à jour: 2023-03-23 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2303.13290

Source PDF: https://arxiv.org/pdf/2303.13290

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Plus d'auteurs

Articles similaires