Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Visione artificiale e riconoscimento di modelli

Nuovo metodo migliora il riconoscimento degli oggetti per le api

Un metodo migliora il tracciamento dei movimenti delle api usando la rilevazione diretta.

― 5 leggere min


Metodo Avanzato diMetodo Avanzato diTracciamento delle Apinel tracciare i movimenti delle api.Nuovo approccio migliora la precisione
Indice

Rilevare oggetti nelle immagini è un compito importante nella visione artificiale. Un nuovo metodo aiuta a trovare forme specifiche e le loro direzioni. Questo metodo è utile per oggetti che sono più o meno della stessa dimensione. Si concentra sul rilevamento della posizione centrale e dell'angolo di questi oggetti senza bisogno di conoscere la loro larghezza e altezza.

Il Problema

In molte immagini, soprattutto quelle affollate come un alveare, è difficile tenere traccia di più oggetti contemporaneamente. Ogni oggetto, come un'ape, deve essere identificato per la sua posizione e il suo movimento. I metodi tradizionali spesso faticano con questo. L'obiettivo qui è creare un modo più semplice per trovare questi oggetti e tracciare la loro direzione, fondamentale per capire i loro schemi di movimento.

Il Dataset

Per questo metodo, i ricercatori hanno usato un insieme specifico di immagini raccolte come parte di un progetto sulle api. Ogni ape in queste immagini è stata attentamente contrassegnata con informazioni sulla sua posizione e direzione. Le api sono state catalogate in base al fatto che il loro corpo fosse completamente visibile o se si trovassero all'interno delle celle del loro alveare. Questa etichettatura dettagliata aiuta ad addestrare il metodo di rilevamento a riconoscere correttamente le api.

Metodi di Rilevamento degli Oggetti

Il rilevamento degli oggetti è un campo che ha visto molti progressi, soprattutto grazie all'uso del deep learning. Ci sono due tipi principali di rilevamento: il rilevamento orizzontale, che cerca scatole allineate con gli assi tipici dell'immagine, e il rilevamento ruotato, che può identificare oggetti angolati in modi diversi.

Il rilevamento orizzontale è più comune ed è utilizzato per immagini semplici, mentre il rilevamento ruotato è migliore per immagini complesse come quelle scattate dall'alto.

Rilevamento Orizzontale degli Oggetti

Il rilevamento orizzontale usa scatole di delimitazione allineate con gli assi dell'immagine per rappresentare gli oggetti. Esistono molti metodi in questo campo. Alcuni, come Fast R-CNN e Faster R-CNN, usano un approccio in due fasi dove prima identificano aree potenziali con oggetti e poi classificano e raffinano queste scatole.

I metodi a singola fase, come SSD e YOLO, sono più veloci perché combinano questi passaggi in uno solo. Generano punteggi per quanto è probabile che un oggetto si trovi in un'area specifica, insieme ai parametri delle scatole, tutto in una volta. I modelli YOLO, in particolare, hanno guadagnato popolarità per la loro velocità ed efficienza.

Rilevamento Ruotato degli Oggetti

Il rilevamento ruotato ha preso i metodi orizzontali e li ha adattati per oggetti che potrebbero non essere allineati lungo gli assi usuali. Rappresenta gli oggetti con un insieme più flessibile di parametri, inclusa l’angolazione. Questo è utile per molte applicazioni, comprese le immagini aeree in cui gli oggetti possono essere visti da angolazioni strane.

Esistono vari metodi per il rilevamento ruotato, che tipicamente mantengono alcuni elementi dell'approccio orizzontale. Cercano di prevedere la scatola di delimitazione che contiene l'oggetto tenendo conto della rotazione. Tuttavia, questi metodi possono avere difficoltà con le differenze angolari, rendendo difficile confrontare le scatole previste con gli oggetti reali in modo accurato.

Rilevamento Diretto degli Oggetti

Il rilevamento diretto degli oggetti è un miglioramento rispetto al rilevamento ruotato standard. Questo metodo presta attenzione non solo alla posizione di un oggetto, ma anche alla sua orientazione rispetto a un bordo specifico. L'architettura principale utilizzata per questo metodo è una variazione del modello YOLO, specificamente una versione più piccola conosciuta come YOLOv7-tiny.

In questo approccio, la scatola di delimitazione che rappresenta il corpo di un'ape è calcolata in base al suo centro e alla direzione in cui è rivolta. Questo metodo considera solo l'angolo relativo alla direzione verticale, rendendo più facile tenere traccia del movimento dell'ape.

Addestramento del Modello

Per addestrare questo nuovo metodo, i ricercatori hanno usato il modello YOLOv7-tiny, che è più veloce e semplice rispetto ai modelli più grandi. Il modello non si basa su ancore, che sono tipiche in molti metodi di rilevamento. Invece, utilizza una singola testa di rilevamento che è sufficiente per il compito a portata di mano.

Durante l'addestramento, il modello guarda le immagini e impara a prevedere dove si trovano le api e in che direzione stanno andando. Fa questo su più epoche, durante le quali si adatta per minimizzare gli errori che commette nelle previsioni.

Risultati

Il nuovo metodo mostra risultati promettenti. Il rilevamento diretto delle api ha raggiunto un alto tasso di accuratezza, il che significa che potrebbe identificare efficacemente i punti centrali e gli angoli delle api nelle immagini. Questo è particolarmente utile per applicazioni che necessitano di un tracciamento preciso dei movimenti delle api.

Le posizioni delle api vengono rilevate con un alto grado di accuratezza, il che evidenzia l'efficacia del nuovo metodo di previsione degli angoli rispetto agli approcci tradizionali. Il modello gestisce anche bene le differenze angolari, consentendo una misurazione più accurata delle orientazioni delle api.

Conclusione

Questo nuovo metodo per rilevare oggetti diretti e di dimensioni uniformi offre un approccio semplificato per comprendere come si muovono gli oggetti in scene complesse. Concentrandosi sui punti centrali e sugli angoli, elimina la necessità di previsioni di dimensioni, semplificando il processo di rilevamento. Questo è particolarmente utile per situazioni in cui il monitoraggio dei movimenti è essenziale, come negli studi ecologici che coinvolgono le api.

I significativi miglioramenti nell'accuratezza e nell'efficienza del rilevamento indicano che le attuali architetture di rilevamento degli oggetti possono adattarsi e fornire soluzioni efficaci per sfide uniche. Man mano che questo campo continua a evolversi, metodi come questi miglioreranno la nostra capacità di monitorare e comprendere vari comportamenti degli oggetti in ambienti affollati.

Fonte originale

Titolo: YUDO: YOLO for Uniform Directed Object Detection

Estratto: This paper presents an efficient way of detecting directed objects by predicting their center coordinates and direction angle. Since the objects are of uniform size, the proposed model works without predicting the object's width and height. The dataset used for this problem is presented in Honeybee Segmentation and Tracking Datasets project. One of the contributions of this work is an examination of the ability of the standard real-time object detection architecture like YoloV7 to be customized for position and direction detection. A very efficient, tiny version of the architecture is used in this approach. Moreover, only one of three detection heads without anchors is sufficient for this task. We also introduce the extended Skew Intersection over Union (SkewIoU) calculation for rotated boxes - directed IoU (DirIoU), which includes an absolute angle difference. DirIoU is used both in the matching procedure of target and predicted bounding boxes for mAP calculation, and in the NMS filtering procedure. The code and models are available at https://github.com/djordjened92/yudo.

Autori: Đorđe Nedeljković

Ultimo aggiornamento: 2023-08-08 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2308.04542

Fonte PDF: https://arxiv.org/pdf/2308.04542

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Articoli simili