Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Visione artificiale e riconoscimento di modelli# Intelligenza artificiale

Migliorare la segmentazione delle istanze in condizioni di scarsa illuminazione

Nuove tecniche migliorano i modelli di segmentazione delle istanze per immagini in condizioni di scarsa illuminazione.

― 7 leggere min


Rottura nel SegmentazioneRottura nel Segmentazionedelle Istanze inCondizioni di Scarsadella segmentazione in ambienti bui.Nuovi metodi migliorano l'accuratezza
Indice

La segmentazione istantanea è una tecnologia che identifica e separa ogni oggetto in un'immagine. È fondamentale per aiutare i computer a interpretare le immagini, supportando settori come la robotica e le auto a guida autonoma. La maggior parte dei metodi di segmentazione istantanea funziona bene in condizioni di buona illuminazione, ma fatica in condizioni di scarsa luce. Quando la luce è poca, le immagini diventano spesso rumorose, rendendo difficile vedere i dettagli e riconoscere gli oggetti.

Questo articolo esplora come migliorare la segmentazione istantanea in situazioni di luce molto bassa. Introduciamo nuove tecniche che aiutano i modelli a funzionare meglio con immagini scure. Abbiamo notato che il Rumore nelle foto a bassa luminosità interrompe le caratteristiche che le reti neurali necessitano per identificare correttamente gli oggetti. Per affrontare questo problema, abbiamo sviluppato metodi per ridurre il rumore e migliorare il processo di apprendimento dei nostri modelli.

Il Problema con le Immagini in Bassa Luce

Quando le immagini vengono catturate in condizioni di scarsa illuminazione, tendono ad avere molto rumore. Questo rumore oscura i dettagli, rendendo difficile per gli algoritmi riconoscere le caratteristiche chiare. I modelli di segmentazione istantanea tradizionali sono progettati per immagini più luminose. In scenari a bassa luce, il rumore può nascondere informazioni importanti. Questo fa sì che i modelli possano perdere oggetti o confonderli con lo sfondo.

Non ci sono molti metodi o dataset disponibili che si concentrano specificamente sulla segmentazione istantanea in condizioni di scarsa luce. Alcune tecniche esistenti cercano di migliorare le immagini prima di passarle attraverso i modelli di segmentazione, ma questo aggiunge passaggi e tempo extra. Non è l'ideale per applicazioni in tempo reale dove la velocità è fondamentale. Inoltre, questi metodi di miglioramento potrebbero non recuperare abbastanza dettagli dalle immagini originali, portando a previsioni errate.

Il Nostro Approccio

Ci siamo posti l'obiettivo di creare un framework più efficace per la segmentazione istantanea in condizioni di scarsa luce senza necessità di ulteriore pre-elaborazione. Per realizzarlo, abbiamo ideato un sistema semplice ma potente che opera direttamente su immagini in bassa luminosità.

Il nostro approccio include tre componenti principali: uno strato di downsampling pesato adattivo, un blocco convoluzionale orientato alla smoothness e un'apprendimento della soppressione delle perturbazioni. Ogni componente gioca un ruolo nel ridurre l'effetto del rumore e migliorare l'accuratezza del modello.

Strato di Downsampling Pesato Adattivo

La prima innovazione è lo strato di downsampling pesato adattivo. Questo strato aiuta a pulire il rumore dalle immagini mentre vengono elaborate dalla rete. I metodi di downsampling regolari usati in molti modelli non considerano il rumore nelle immagini. Riducono semplicemente la risoluzione senza filtrare le perturbazioni, il che può rendere il rumore ancora più problematico.

Il nostro nuovo strato di downsampling tiene conto delle caratteristiche circostanti e le aggrega selettivamente. Questo aiuta a minimizzare il rumore mantenendo i dettagli importanti intatti. Utilizzando un processo simile ai filtri passa-basso, questo strato assicura che le caratteristiche siano meno influenzate dal rumore.

Blocco Convoluzionale Orientato alla Smoothness

Poi, abbiamo introdotto il blocco convoluzionale orientato alla smoothness. Questo blocco migliora gli strati convoluzionali ordinari aggiungendo un effetto di levigatura durante l'estrazione delle caratteristiche. L'obiettivo è ridurre il rumore e migliorare la robustezza del modello quando si tratta di immagini a bassa luminosità.

La convoluzione orientata alla smoothness utilizza più rami che aiutano ad apprendere filtri migliori per diverse aree dell'immagine. Questo significa che quando il modello incontra caratteristiche rumorose, può filtrarle in modo adattivo mantenendo i dettagli semantici critici degli oggetti.

Apprendimento della Soppressione delle Perturbazioni

Infine, abbiamo implementato l'apprendimento della soppressione delle perturbazioni. Questa tecnica incoraggia il modello a imparare caratteristiche che sono stabili e non influenzate dal rumore. Invece di accettare semplicemente l'input rumoroso, il nostro modello impara a identificare le caratteristiche essenziali sia in immagini pulite che rumorose.

Minimizzando la differenza tra le caratteristiche estratte da immagini rumorose e pulite, il modello può concentrarsi su ciò che conta di più per i compiti di segmentazione. Questo migliora le prestazioni generali del modello in situazioni di scarsa luminosità.

Importanza delle Immagini RAW

Abbiamo osservato che utilizzare immagini RAW ad alta profondità di bit è vantaggioso in condizioni di scarsa luminosità. Le uscite tipiche delle fotocamere, come le immagini sRGB, possono perdere molti dettagli a causa del rumore, specialmente in scene scure. Al contrario, le immagini RAW conservano più informazioni sulla scena, rendendole più adatte per l'elaborazione in condizioni di bassa luminosità.

Per affrontare la mancanza di dataset RAW a bassa luminosità disponibili, abbiamo sviluppato una pipeline sintetica. Questa pipeline genera immagini RAW low-light realistiche a partire da immagini normali ben illuminate. Invertendo i passaggi di elaborazione delle immagini solitamente applicati per creare immagini sRGB, possiamo creare un dataset che include una varietà di scenari a bassa luminosità.

Raccolta di un Dataset del Mondo Reale

Per supportare ulteriormente la nostra ricerca, abbiamo raccolto un dataset del mondo reale specificamente progettato per la segmentazione istantanea in condizioni di bassa luminosità. Questo dataset include oltre duemila coppie di immagini catturate sia in condizioni di bassa che di normale luminosità, con ogni coppia etichettata a livello di pixel. Questa vasta collezione ci consente di valutare efficacemente il nostro metodo e fornisce un benchmark per la ricerca futura in quest'area.

Il dataset consiste in diversi tipi di scene, sia interne che esterne. Ogni scena viene catturata in condizioni diverse per garantire una rappresentazione variegata delle situazioni di scarsa luce. Le ampie annotazioni aiutano ad addestrare i modelli in modo che possano riconoscere gli oggetti anche quando la luce è insufficiente.

Valutazione del Nostro Metodo

Nei nostri esperimenti, abbiamo confrontato i metodi proposti con i modelli esistenti di stato dell'arte in condizioni di scarsa luminosità. Abbiamo effettuato valutazioni su dataset sia sintetici che reali, concentrandoci sull'accuratezza della segmentazione istantanea.

I risultati hanno mostrato miglioramenti significativi nelle prestazioni quando abbiamo utilizzato i nostri nuovi metodi. Abbiamo scoperto che elaborando direttamente immagini RAW a bassa luminosità, invece di immagini sRGB, il nostro modello ha raggiunto un'accuratezza superiore. Inoltre, i nuovi componenti di design non hanno aggiunto molto al tempo complessivo di elaborazione, rendendoli adatti per applicazioni in tempo reale.

Risultati delle Prestazioni

Quando abbiamo valutato il nostro approccio sul nuovo dataset, abbiamo riscontrato che il nostro metodo ha superato le tecniche tradizionali. I modelli che utilizzano il nostro strato di downsampling pesato adattivo e i blocchi convoluzionali orientati alla smoothness hanno costantemente ottenuto una precisione media più alta. L'apprendimento della soppressione delle perturbazioni ha ulteriormente potenziato la robustezza del modello, portando a prestazioni più stabili in diverse condizioni.

La nostra analisi ha rivelato che il framework proposto riduce efficacemente il rumore nelle immagini a bassa luminosità, traducendosi in migliori prestazioni nei compiti di segmentazione istantanea. Questo dimostra l'importanza di affrontare direttamente il rumore all'interno del modello, piuttosto che fare affidamento su metodi di pre-elaborazione che potrebbero non dare risultati soddisfacenti.

Conclusione

Questa ricerca mette in evidenza le sfide che le condizioni di scarsa luminosità pongono per la segmentazione istantanea. I metodi tradizionali faticano con il rumore comune nelle immagini scure, portando a prestazioni inferiori. Tuttavia, le tecniche proposte hanno significativamente migliorato l'accuratezza e l'efficienza della segmentazione istantanea in ambienti a bassa luminosità.

Concentrandoci sulla riduzione del rumore delle caratteristiche attraverso strategie innovative di downsampling e convoluzione, insieme a un forte accento sull'apprendimento di caratteristiche stabili, abbiamo sviluppato una soluzione completa. La raccolta di un nuovo dataset del mondo reale a bassa luminosità fornisce una risorsa preziosa per ulteriori ricerche in questo dominio.

In definitiva, il nostro lavoro apre strade per migliorare le applicazioni di visione artificiale, in particolare quelle che richiedono prestazioni affidabili in condizioni di illuminazione difficili. Grazie a questi progressi, puntiamo a creare modelli più capaci che possano operare efficacemente in ambienti diversi.

Fonte originale

Titolo: Instance Segmentation in the Dark

Estratto: Existing instance segmentation techniques are primarily tailored for high-visibility inputs, but their performance significantly deteriorates in extremely low-light environments. In this work, we take a deep look at instance segmentation in the dark and introduce several techniques that substantially boost the low-light inference accuracy. The proposed method is motivated by the observation that noise in low-light images introduces high-frequency disturbances to the feature maps of neural networks, thereby significantly degrading performance. To suppress this ``feature noise", we propose a novel learning method that relies on an adaptive weighted downsampling layer, a smooth-oriented convolutional block, and disturbance suppression learning. These components effectively reduce feature noise during downsampling and convolution operations, enabling the model to learn disturbance-invariant features. Furthermore, we discover that high-bit-depth RAW images can better preserve richer scene information in low-light conditions compared to typical camera sRGB outputs, thus supporting the use of RAW-input algorithms. Our analysis indicates that high bit-depth can be critical for low-light instance segmentation. To mitigate the scarcity of annotated RAW datasets, we leverage a low-light RAW synthetic pipeline to generate realistic low-light data. In addition, to facilitate further research in this direction, we capture a real-world low-light instance segmentation dataset comprising over two thousand paired low/normal-light images with instance-level pixel-wise annotations. Remarkably, without any image preprocessing, we achieve satisfactory performance on instance segmentation in very low light (4~\% AP higher than state-of-the-art competitors), meanwhile opening new opportunities for future research.

Autori: Linwei Chen, Ying Fu, Kaixuan Wei, Dezhi Zheng, Felix Heide

Ultimo aggiornamento: 2023-09-08 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2304.14298

Fonte PDF: https://arxiv.org/pdf/2304.14298

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili