Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Visione artificiale e riconoscimento di modelli

Migliorare la stima della profondità per i droni usando una sola camera

Nuovi metodi migliorano il modo in cui i droni misurano la distanza dagli oggetti.

― 6 leggere min


Scoperta nella stimaScoperta nella stimadella profondità coidronidistanza per i drone.drammaticamente la misurazione dellaNuove tecniche migliorano
Indice

Negli ultimi anni, l'uso dei droni, o veicoli aerei senza pilota (UAV), è aumentato parecchio. Queste macchine volanti vengono usate per molte cose, come servizi di consegna, sorveglianza e monitoraggio agricolo. Per volare in sicurezza, gli UAV devono rilevare e evitare altri oggetti nel cielo, ed è qui che entrano in gioco i sistemi avanzati.

I sistemi di Rilevamento e Evitamento (DAA) sono progettati per aiutare gli UAV a trovare e allontanarsi da potenziali collisioni con altri oggetti in volo. Per far funzionare bene i sistemi DAA, devono sapere non solo quali oggetti ci sono intorno, ma anche a che distanza si trovano. I metodi tradizionali di rilevamento degli oggetti di solito forniscono informazioni sulla posizione degli oggetti in uno spazio bidimensionale, ma non dicono nulla su quanto siano lontani in tre dimensioni.

Questo articolo parla di uno studio che vuole migliorare il modo in cui gli UAV possono stimare la distanza dagli oggetti usando solo una telecamera. Lo studio introduce nuovi metodi per la stima della profondità, concentrandosi su come determinare la distanza degli oggetti a lunghe distanze.

La Necessità della Stima della Profondità

Essere in grado di stimare la profondità è fondamentale per gli UAV per evitare incidenti. Se un drone non sa quanto sono lontani gli altri oggetti, non può prendere decisioni rapide per evitarli. Questo è particolarmente importante per i droni piccoli che non possono trasportare sensori pesanti come lidar o radar, che spesso vengono usati per misurare la distanza. Usare una sola telecamera per la stima della profondità è una soluzione più pratica.

Nei veicoli autonomi, ci sono sfide simili, e sono state sviluppate molte tecniche per aiutare i veicoli a capire il loro ambiente. Tuttavia, questi metodi potrebbero non essere applicabili direttamente agli UAV a causa delle differenze nel modo in cui operano questi due settori. Ad esempio, gli UAV devono rilevare oggetti a distanze molto maggiori rispetto alle auto, il che cambia l'approccio necessario per una misurazione efficace della profondità.

I Metodi Proposti

Lo studio presenta nuove tecniche per migliorare la stima della profondità per gli UAV usando una sola telecamera.

Due Nuove Tecniche di Codifica

  1. Codifica Sigmoide: Questo metodo trasforma i valori di profondità usando una funzione matematica che aiuta a garantire che i valori siano sempre positivi e rientrino in un intervallo specifico. Questo evita problemi in cui il modello potrebbe prevedere distanze negative irrealistiche.

  2. Codifica Simile a ReLU: Simile alla codifica sigmoide, questa tecnica assicura anche che i valori di profondità siano positivi. Tuttavia, utilizza una struttura matematica diversa che semplifica il processo di previsione mantenendo l'accuratezza.

Vedere la Profondità come un Problema di Classificazione

Lo studio suggerisce anche un altro modo per stimare la profondità trattandola come un problema di classificazione invece di regressione. Questo metodo prevede di dividere la distanza in intervalli specifici o 'bin' e addestrare il modello a identificare in quale bin si trova un oggetto in base alla vista della telecamera.

Viene introdotta una nuova funzione chiamata Soft-Argmax. Questa funzione offre un modo più sfumato per valutare quanto una previsione sia vicina al vero bin di profondità, tenendo conto di quanto possa essere imprecisa la previsione.

La Metodologia del Punteggio di Fitness

Per valutare quanto bene funzionano i metodi proposti, lo studio introduce il Punteggio di Fitness. Questo punteggio combina i risultati del rilevamento degli oggetti e della stima della profondità in un'unica metrica di performance. Usando il Punteggio di Fitness, risulta più facile valutare l'efficacia dei diversi metodi in modo unificato.

Test dei Metodi

I ricercatori hanno effettuato diversi test utilizzando un dataset progettato per il tracciamento di oggetti aerei. Questo dataset forniva immagini di vari oggetti in volo, annotate con le loro posizioni e distanze. Usando queste immagini, hanno potuto addestrare i loro modelli e valutare quanto bene si comportassero i nuovi metodi di stima della profondità.

Gruppi Sperimentali

I test sono stati suddivisi in tre gruppi principali in base a come era inquadrata la stima della profondità:

  1. Metodi di Regressione: Qui, l'obiettivo era prevedere un valore di profondità continuo direttamente.
  2. Metodi di Classificazione per Bin: Questo gruppo si concentrava sulla classificazione degli oggetti in intervalli di distanza discreti.
  3. Metodi di Regressione Ordinale: Questo metodo trattava la stima della profondità come un problema di classificazione ordinata, in cui i bin rappresentano distanze ordinate.

Risultati

I risultati degli esperimenti hanno mostrato che i metodi proposti, in particolare la codifica sigmoide e la classificazione Soft-Argmax, hanno superato le tecniche tradizionali.

  • Metodi di Regressione: Tra i metodi di regressione, la codifica sigmoide ha dato i migliori risultati per stimare la profondità e mantenere buone prestazioni nel rilevamento degli oggetti.

  • Metodi di Classificazione: I metodi che hanno usato Soft-Argmax hanno mostrato una precisione migliorata rispetto agli approcci di base che si affidavano a tecniche di classificazione più semplici.

  • Regressione Ordinata: Anche se i risultati erano generalmente buoni, i metodi che hanno usato Soft-Argmax hanno comunque fornito un mezzo più efficace per la stima della profondità rispetto alla regressione ordinata.

Considerazioni sul Tempo di Esecuzione

Oltre a considerare l'accuratezza dei modelli, lo studio ha valutato anche la velocità delle prestazioni. Aggiungere capacità di stima della profondità al framework di rilevamento degli oggetti ha aumentato i tempi di elaborazione; tuttavia, il compromesso è stato considerato accettabile considerando l'accuratezza migliorata.

Efficienza del Flusso di Lavoro

Una delle scoperte significative è stata che i modelli di regressione della profondità più semplici tendevano a essere più veloci. Questo era previsto, poiché metodi di classificazione più complessi richiedono ulteriori passaggi di elaborazione. Anche se questo è un fattore da considerare, i miglioramenti complessivi dell'accuratezza forniti dai nuovi metodi giustificano il leggero aumento del tempo di elaborazione.

Conclusione

Lo studio ha affrontato con successo le sfide nella stima della profondità a livello di oggetti a lungo raggio per gli UAV usando una sola telecamera. Sviluppando nuovi metodi di codifica e inquadrando la stima della profondità in modi innovativi, i ricercatori sono riusciti a migliorare il modo in cui i droni riconoscono e valutano il loro ambiente.

Questi progressi non solo migliorano il funzionamento sicuro degli UAV, ma offrono anche una base per future ricerche e sviluppi nelle applicazioni di visione artificiale per veicoli volanti autonomi. L'introduzione del Punteggio di Fitness fornisce uno strumento prezioso per valutare l'efficacia dei modelli, aprendo la strada a migliori prestazioni in scenari reali. In generale, i nuovi metodi hanno dimostrato di essere un passo avanti significativo nella diffusione degli UAV per varie applicazioni, garantendo operazioni più sicure e affidabili in spazi aerei affollati.

Fonte originale

Titolo: Long Range Object-Level Monocular Depth Estimation for UAVs

Estratto: Computer vision-based object detection is a key modality for advanced Detect-And-Avoid systems that allow for autonomous flight missions of UAVs. While standard object detection frameworks do not predict the actual depth of an object, this information is crucial to avoid collisions. In this paper, we propose several novel extensions to state-of-the-art methods for monocular object detection from images at long range. Firstly, we propose Sigmoid and ReLU-like encodings when modeling depth estimation as a regression task. Secondly, we frame the depth estimation as a classification problem and introduce a Soft-Argmax function in the calculation of the training loss. The extensions are exemplarily applied to the YOLOX object detection framework. We evaluate the performance using the Amazon Airborne Object Tracking dataset. In addition, we introduce the Fitness score as a new metric that jointly assesses both object detection and depth estimation performance. Our results show that the proposed methods outperform state-of-the-art approaches w.r.t. existing, as well as the proposed metrics.

Autori: David Silva, Nicolas Jourdan, Nils Gählert

Ultimo aggiornamento: 2023-02-17 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2302.08943

Fonte PDF: https://arxiv.org/pdf/2302.08943

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili