Neue Methode zur unüberwachten Registrierung von Punktwolken
Ein neuer Ansatz bringt 3D-Punktwolken ohne beschriftete Daten in Einklang.
― 5 min Lesedauer
Inhaltsverzeichnis
Die Registrierung von Punktwolken ist ein Prozess, der verwendet wird, um zwei Sätze von 3D-Punkten auszurichten, die sich teilweise überlappen können. Das ist in vielen Bereichen wichtig, wie zum Beispiel in der Robotik, Augmented Reality und beim autonomen Fahren. Bestehende Methoden erfordern oft beschriftete Daten, um effektiv zu funktionieren.
Um diese Herausforderungen anzugehen, wurde ein neuer Ansatz entwickelt, der keine beschrifteten Daten benötigt. Diese Methode nutzt ein statistisches Modell, um zu lernen, wie man Punktwolken registriert, die nur teilweise überlappen.
Überblick über den Ansatz
Die neue Methode basiert darauf, Wahrscheinlichkeitsverteilungen aus den Punktwolken zu lernen. Durch die Anwendung eines speziellen Algorithmus, dem Sinkhorn-Algorithmus, kann die Methode Verbindungen zwischen den verschiedenen Teilen der beiden Punktwolken herstellen.
Der Lernprozess wird durch drei Hauptarten von Verlustfunktionen gesteuert, die sicherstellen, dass das Modell dies effektiv lernt: Selbstkonsistenz, Kreuzkonsistenz und lokale kontrastive Verluste. Diese Komponenten arbeiten zusammen, um sicherzustellen, dass die aus den Punktwolken gelernten Merkmale konsistent sind, auch wenn es nur eine teilweise Überlappung gibt.
Was ist Punktwolkenregistrierung?
Die Punktwolkenregistrierung zielt darauf ab, die beste Transformation zu finden, die zwei Punktwolken in ein einziges Koordinatensystem ausrichten kann. Das ist besonders nützlich in Anwendungen, wo 3D-Daten aus verschiedenen Blickwinkeln oder Sensoren gesammelt werden.
Der Registrierungsprozess erfordert oft, Punkte aus einer Wolke mit denen in einer anderen abzugleichen. Wenn die Wolken nur teilweise überlappen, wird dieser Abgleich kompliziert. Bei vielen aktuellen Methoden hängt der Erfolg der Punktwolkenregistrierung davon ab, Zugang zu beschrifteten Daten zu haben, was oft schwierig ist.
Herausforderungen bei bestehenden Methoden
Es gibt zwei Haupttypen von Methoden zur Punktwolkenregistrierung: korrespondenzfreie und korrespondierende Methoden.
Korrespondenzfreie Methoden: Diese Methoden betrachten die allgemeinen Merkmale der Punktwolken und versuchen, die Unterschiede zwischen ihnen zu minimieren. Diese Techniken scheitern jedoch oft, wenn es um reale Szenarien geht, in denen die Wolken nicht vollständig überlappen.
Korrespondierende Methoden: Diese Methoden versuchen, einzelne Punkte in einer Wolke zu finden, die mit denen in einer anderen übereinstimmen. Die Herausforderung dabei ist, dass es schwierig ist, zuverlässige Übereinstimmungen herzustellen, wenn die Wolken sehr unterschiedliche Punktdichten oder sich wiederholende Muster haben.
Ausserdem benötigen viele bestehende Methoden eine Menge beschrifteter Daten zum Trainieren, was zeitaufwendig und kostspielig sein kann.
Vorgeschlagene Lösung
Um diese Probleme anzugehen, wurde ein neues unüberwachtes Lernframework vorgeschlagen. Diese Methode ermöglicht die Registrierung von Punktwolken mit partiellen Überlappungen, ohne dass beschriftete Daten benötigt werden.
Die wichtigsten Innovationen dieser Methode sind:
- Lernen von Wahrscheinlichkeitsverteilungen aus den Punktwolken.
- Verwendung des Sinkhorn-Algorithmus, um Verbindungen zwischen den Verteilungen herzustellen.
- Erstellung von Verlustfunktionen, die dem Modell helfen, auf unüberwachte Weise zu lernen.
Lernen von Wahrscheinlichkeitsverteilungen
Das Framework beginnt damit, ein spezialisiertes Netzwerk zu verwenden, um die Wahrscheinlichkeitsverteilungen der Punktwolken zu lernen. Jede Punktwolke wird als Mischung von Gauss-Verteilungen modelliert. Das bedeutet, dass die Punkte in der Wolke als stammend von einer Ansammlung überlappender glockenförmiger Kurven betrachtet werden.
Die Parameter dieser Verteilungen werden während des Trainingsprozesses erlernt. So kann das Modell die zugrunde liegende Struktur jeder Punktwolke genau erfassen.
Der Sinkhorn-Algorithmus
Sobald die Wahrscheinlichkeitsverteilungen gelernt sind, wird der Sinkhorn-Algorithmus verwendet, um Korrespondenzen zwischen den beiden Punktwolken herzustellen. Dieser Algorithmus hilft dabei, verschiedene Teile der Wolken abzugleichen und gleichzeitig die Eigenschaften der Verteilungen beizubehalten.
Der Sinkhorn-Algorithmus funktioniert, indem er die Übereinstimmungen basierend auf den Gewichten der Verteilungen anpasst und sicherstellt, dass die gelernten Korrespondenzen sinnvoll sind, selbst wenn die Punktwolken nur teilweise überlappen.
Verlustfunktionen für unüberwachtes Lernen
Drei Verlustfunktionen wurden entwickelt, um den Lernprozess zu verbessern:
Selbstkonsistenzverlust: Dieser Verlust ermutigt die gelernten Wahrscheinlichkeitsverteilungen der Punktwolken dazu, sowohl im Koordinaten- als auch im Merkmalsraum gleich zu sein. Indem sichergestellt wird, dass die beiden Verteilungen übereinstimmen, lernt das Modell, Konsistenz in seinen Merkmalen aufrechtzuerhalten.
Kreuzkonsistenzverlust: Dieser Verlust konzentriert sich darauf, sicherzustellen, dass Punkte aus zwei teilweise überlappenden Wolken, die zu demselben Cluster gehören, denselben Cluster-Schwerpunkt teilen. Dies hilft dem Modell, Merkmale zu lernen, die invariant gegenüber Transformationen sind.
Lokaler kontrastiver Verlust: Dieser Verlust fördert das Lernen von Merkmalen, die nicht nur unterschiedlich, sondern auch die lokale Struktur der Punktwolken berücksichtigen. Das ist wichtig, weil viele reale Objekte nicht vollständig sichtbar sind und lokale Merkmale wertvolle Informationen liefern können.
Bewertung der Methode
Die Leistung der vorgeschlagenen Methode wird an mehreren öffentlich verfügbaren Datensätzen evaluiert, darunter 3DMatch, 3DLoMatch, ModelNet und ModelLoNet. Die Ergebnisse zeigen, dass die neue Methode bestehende unüberwachte Ansätze übertrifft und sogar mit einigen überwachten Methoden in Bezug auf die Genauigkeit konkurriert.
Testdatensätze
- 3DMatch: Dieser Datensatz umfasst verschiedene Innenräume mit teilweise überlappenden Punktwolkenfragmenten.
- 3DLoMatch: Ähnlich wie 3DMatch enthält dieser Datensatz ebenfalls Innenräume, jedoch mit einem niedrigeren Durchschnittsüberlapp.
- ModelNet: Dieser Datensatz besteht aus CAD-Modellen aus verschiedenen Kategorien, wodurch die Methode an verschiedenen Objekttypen getestet werden kann.
- ModelLoNet: Eine Variation von ModelNet, aber mit geringeren Überlappungen zwischen den Modellen.
Leistungskennzahlen
Die Leistung der Methode wird mit mehreren Metriken gemessen, darunter:
- Relative Rotationsfehler (RRE): Misst die Genauigkeit der Rotationstransformation.
- Relativer Übersetzungsfehler (RTE): Misst die Genauigkeit der Übersetzungstransformation.
- Registrierungsabruf (RR): Der Prozentsatz der Punktwolkenpaare, bei denen der Transformationsfehler unter einem bestimmten Schwellenwert liegt.
Die Ergebnisse zeigen, dass die vorgeschlagene Methode eine höhere Registrierungsrate und niedrigere Rotations- und Übersetzungsfehler im Vergleich zu bestehenden Methoden erreicht.
Fazit
Zusammenfassend bietet das vorgeschlagene unüberwachte tiefprobabilistische Registrierungsframework eine robuste Lösung zur Ausrichtung von Punktwolken mit partiellen Überlappungen. Durch die Nutzung von Wahrscheinlichkeitsverteilungen und innovativen Verlustfunktionen adressiert die Methode effektiv die Einschränkungen bestehender Ansätze, die stark auf beschriftete Daten angewiesen sind.
Diese Fortschritte haben erhebliche Auswirkungen auf Anwendungen in der Robotik, Augmented Reality und anderen Bereichen, die eine genaue 3D-Datenausrichtung benötigen. Die Methode zeigt nicht nur in Benchmark-Datensätzen gute Leistungen, sondern auch Vielseitigkeit im Umgang mit realen Szenarien, in denen das Beschaffen von beschrifteten Daten eine grosse Herausforderung darstellen kann.
Zukünftige Richtungen für diese Forschung umfassen weitere Verbesserungen des Frameworks, potenzielle Anwendungen in anderen Bereichen der Computer Vision und die Erforschung effizienterer Algorithmen für grossangelegte Punktwolkenregistrierungsaufgaben.
Titel: Unsupervised Deep Probabilistic Approach for Partial Point Cloud Registration
Zusammenfassung: Deep point cloud registration methods face challenges to partial overlaps and rely on labeled data. To address these issues, we propose UDPReg, an unsupervised deep probabilistic registration framework for point clouds with partial overlaps. Specifically, we first adopt a network to learn posterior probability distributions of Gaussian mixture models (GMMs) from point clouds. To handle partial point cloud registration, we apply the Sinkhorn algorithm to predict the distribution-level correspondences under the constraint of the mixing weights of GMMs. To enable unsupervised learning, we design three distribution consistency-based losses: self-consistency, cross-consistency, and local contrastive. The self-consistency loss is formulated by encouraging GMMs in Euclidean and feature spaces to share identical posterior distributions. The cross-consistency loss derives from the fact that the points of two partially overlapping point clouds belonging to the same clusters share the cluster centroids. The cross-consistency loss allows the network to flexibly learn a transformation-invariant posterior distribution of two aligned point clouds. The local contrastive loss facilitates the network to extract discriminative local features. Our UDPReg achieves competitive performance on the 3DMatch/3DLoMatch and ModelNet/ModelLoNet benchmarks.
Autoren: Guofeng Mei, Hao Tang, Xiaoshui Huang, Weijie Wang, Juan Liu, Jian Zhang, Luc Van Gool, Qiang Wu
Letzte Aktualisierung: 2023-03-23 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2303.13290
Quell-PDF: https://arxiv.org/pdf/2303.13290
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.