Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Visione artificiale e riconoscimento di modelli

Migliorare la registrazione di nuvole di punti 3D con cliques massimali

Un nuovo metodo migliora l'allineamento delle nuvole di punti 3D usando cliques massimali.

― 5 leggere min


Cliques massimi nellaCliques massimi nellaregistrazione 3Defficace delle nuvole di punti.Un nuovo approccio per un allineamento
Indice

La Registrazione di nuvole di punti 3D è importante nella visione computerizzata. Si tratta di allineare due set di punti dati 3D in modo che corrispondano il più possibile. Questo compito è utile in varie applicazioni come la navigazione dei robot, il riconoscimento degli oggetti e la creazione di modelli 3D a partire dalle immagini.

Trovare l'allineamento corretto, o la posa, non è sempre facile. Le sfide includono il rumore nei dati e la sovrapposizione limitata tra i due set di punti. Entrambi questi fattori possono portare a corrispondenze errate, rendendo difficile la registrazione.

Panoramica del Problema

La questione chiave nella registrazione 3D è come gestire le corrispondenze che includono corrispondenze errate, note come outlier. I metodi tradizionali, come RANSAC, gestiscono questi outlier ma hanno le loro debolezze. Possono avere difficoltà quando il numero di outlier è alto, richiedendo molte iterazioni per trovare una soluzione accettabile.

Anche i metodi di deep learning vengono utilizzati per la registrazione 3D. Questi metodi possono migliorare il processo apprendendo dai dati, ma hanno bisogno di molti esempi per essere addestrati efficacemente. Inoltre, possono avere difficoltà quando applicati a diversi tipi di dataset.

Approccio ai Cliques Massimali

Proponiamo un nuovo metodo che utilizza i cliques massimali per migliorare il processo di registrazione. L'obiettivo è raccogliere informazioni locali dai dati, piuttosto che fare affidamento solo su dati globali. I cliques massimali sono gruppi di punti che sono compatibili tra loro, e possono aiutare a generare migliori ipotesi per l'allineamento.

Grafo di Compatibilità

Per iniziare, creiamo un grafo di compatibilità. Qui, ogni punto dei due set di dati è un nodo, e le connessioni tra i nodi rappresentano relazioni che indicano compatibilità. Esaminando questo grafo, possiamo identificare gruppi di punti che formano cliques massimali.

Estrazione dei Cliques Massimali

Invece di concentrarci solo sui gruppi più grandi, cerchiamo cliques massimali, che permettono connessioni più flessibili. Questo metodo ci consente di raccogliere un insieme più ricco di informazioni locali sui dati. Ogni clique massimo fornisce potenziali ipotesi di posa, il che significa che possiamo calcolare possibili trasformazioni per allineare le nuvole di punti.

Generazione di ipotesi

Una volta identificati i cliques massimali, utilizziamo una tecnica chiamata Decomposizione ai valori singolari (SVD) per stimare le trasformazioni. Queste trasformazioni vengono poi valutate, e la migliore viene scelta per la registrazione.

Impostazione Sperimentale

Abbiamo testato il nostro metodo su diversi dataset, tra cui U3M, 3DMatch, 3DLoMatch e KITTI. Ogni dataset presenta le proprie sfide, come gradi variabili di sovrapposizione tra le nuvole di punti e diversi livelli di rumore.

Criteri di Valutazione

Per misurare quanto bene funziona la registrazione, utilizziamo diverse metriche. Il successo viene giudicato in base a quanto strettamente i punti allineati corrispondano. Questo viene fatto analizzando gli errori di misurazione per rotazione e traduzione.

Risultati

Prestazioni sul Dataset U3M

Quando abbiamo valutato il metodo sul dataset U3M, ha superato i metodi tradizionali. Il nostro approccio ha fornito risultati migliori rispetto a diverse tecniche ben note, dimostrando la sua efficacia nel trovare allineamenti accurati anche quando ci sono molti outlier.

Risultati su 3DMatch e 3DLoMatch

Per i dataset 3DMatch e 3DLoMatch, il nostro metodo ha mostrato costantemente prestazioni elevate. Ha eccelso rispetto ai metodi basati solo sulla geometria e ai metodi di deep learning. Questo evidenzia la sua robustezza e capacità di lavorare efficacemente attraverso diversi tipi di dati.

Confronto con Metodi di Deep Learning

Abbiamo anche testato come il nostro metodo funziona insieme a tecniche di deep learning. Integrando l'approccio dei cliques massimali con metodi appresi in profondità, siamo stati in grado di migliorare significativamente le loro prestazioni. Questa combinazione ha portato ai migliori richiami di registrazione sui rispettivi dataset.

Analisi delle Tecniche

Per assicurarci di utilizzare efficacemente i cliques massimali, abbiamo condotto diversi test. Confrontando diversi modi di costruire il nostro grafo di compatibilità, abbiamo scoperto che un grafo di secondo ordine ha funzionato meglio. Questo tipo di grafo cattura una relazione più ampia tra le corrispondenze dei punti.

Selezione Guidata dai Nodi

Abbiamo anche introdotto una tecnica in cui diamo priorità a determinati cliques in base ai loro pesi. Questo aiuta a ridurre il numero di ipotesi che valutiamo, rendendo l'intero processo più efficiente e accurato.

Tecniche di Filtraggio

Abbiamo esplorato diversi metodi di filtraggio come il controllo della coerenza normale all'interno dei cliques e il ranking dei cliques in base ai loro pesi. Anche se la coerenza normale ha avuto un effetto negativo lieve, il ranking dei cliques ha mostrato risultati promettenti, migliorando il richiamo e l'accuratezza nella generazione di ipotesi.

Metriche di Valutazione

Sono state analizzate diverse metriche di valutazione per determinare quale fornisse il miglior risultato. Abbiamo scoperto che l'utilizzo della metrica dell'errore medio (MAE) è risultato il più efficace per garantire registrazioni accurate. Ha superato altre metriche in termini di generazione di ipotesi corrette.

Efficienza Temporale

L'efficienza è cruciale per i metodi di registrazione. I nostri test hanno dimostrato che il tempo impiegato per la registrazione 3D è generalmente basso, anche con dataset più grandi. Questo significa che il metodo può essere applicato in scenari in tempo reale senza ritardi eccessivi.

Conclusione

Il nostro metodo che utilizza i cliques massimali per la registrazione delle nuvole di punti 3D mostra grande promettente. Raggiunge prestazioni all'avanguardia su vari dataset e può essere integrato con tecniche esistenti di deep learning per aumentarne l'efficacia.

I risultati sostengono l'uso dei cliques massimali per creare ipotesi più accurate per allineare le nuvole di punti. Questo lavoro apre la porta a ulteriori ricerche e miglioramenti nella registrazione delle nuvole di punti 3D, permettendo una migliore applicazione in diversi settori.

I futuri sforzi si concentreranno sul perfezionamento dei metodi di valutazione delle ipotesi e sull'esplorazione di ulteriori fonti di dati per migliorare ulteriormente le prestazioni e l'applicabilità.

Fonte originale

Titolo: 3D Registration with Maximal Cliques

Estratto: As a fundamental problem in computer vision, 3D point cloud registration (PCR) aims to seek the optimal pose to align a point cloud pair. In this paper, we present a 3D registration method with maximal cliques (MAC). The key insight is to loosen the previous maximum clique constraint, and mine more local consensus information in a graph for accurate pose hypotheses generation: 1) A compatibility graph is constructed to render the affinity relationship between initial correspondences. 2) We search for maximal cliques in the graph, each of which represents a consensus set. We perform node-guided clique selection then, where each node corresponds to the maximal clique with the greatest graph weight. 3) Transformation hypotheses are computed for the selected cliques by the SVD algorithm and the best hypothesis is used to perform registration. Extensive experiments on U3M, 3DMatch, 3DLoMatch and KITTI demonstrate that MAC effectively increases registration accuracy, outperforms various state-of-the-art methods and boosts the performance of deep-learned methods. MAC combined with deep-learned methods achieves state-of-the-art registration recall of 95.7% / 78.9% on 3DMatch / 3DLoMatch.

Autori: Xiyu Zhang, Jiaqi Yang, Shikun Zhang, Yanning Zhang

Ultimo aggiornamento: 2023-05-18 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2305.10854

Fonte PDF: https://arxiv.org/pdf/2305.10854

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili