Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Visione artificiale e riconoscimento di modelli

Avanzare la collaborazione umano-robot nella produzione

Questo articolo parla di un nuovo dataset per migliorare la sicurezza nel lavoro di squadra tra umani e robot.

― 7 leggere min


Miglioramento del lavoroMiglioramento del lavorodi squadra tra umani erobotsicurezza negli ambienti di glovebox.Nuovo dataset punta a aumentare la
Indice

Nel mondo della produzione di oggi, la tecnologia sta cambiando il modo in cui lavoriamo. Con l'arrivo delle macchine intelligenti, il ruolo degli esseri umani si sta evolvendo. Gli umani sono ora visti come partner che lavorano al fianco di queste macchine, soprattutto in compiti che richiedono precisione e sicurezza. Un'area in cui questa collaborazione è cruciale è nell'assemblaggio di prodotti in ambienti controllati noti come glovebox. Questi sono spazi sigillati progettati per proteggere i lavoratori da materiali pericolosi. Tuttavia, lavorare in tali ambienti presenta le proprie sfide.

Questo articolo parla della creazione di un nuovo dataset volto a migliorare il modo in cui le macchine riconoscono le mani umane nei contesti delle glovebox. Questo dataset è importante per sviluppare modi sicuri ed efficaci per far lavorare insieme umani e robot.

L'importanza della collaborazione uomo-robot

Con l'industria che si sposta verso una produzione più intelligente, è chiaro che c'è bisogno di una migliore cooperazione tra persone e macchine. In molte situazioni, gli esseri umani portano competenze e flessibilità che le macchine non hanno. Pertanto, costruire sistemi in cui i robot possono riconoscere e comprendere i movimenti umani è essenziale. Un aspetto importante di questo è sapere dove si trovano le mani umane durante il lavoro. Se i robot possono identificare la posizione delle mani di un lavoratore, può aiutare a prevenire incidenti e assicurarsi che i compiti vengano completati in modo efficiente.

Sebbene esistano molti dataset per il riconoscimento delle mani, la maggior parte si concentra su ambienti quotidiani come case e uffici. Questi dataset spesso non considerano ambienti industriali, specialmente quelli che coinvolgono materiali pericolosi. Questa limitazione è significativa perché i dataset esistenti non preparano i sistemi di apprendimento automatico per le complessità dei compiti di produzione nel mondo reale.

Riconoscere le lacune

Una delle sfide nello sviluppo di sistemi di collaborazione uomo-robot sicuri è che molti dataset si basano su dati sintetici o generati al computer. Questo significa che non rappresentano accuratamente le situazioni reali. Inoltre, i Sistemi di Sicurezza devono considerare le incertezze, come le variazioni di illuminazione e i toni della pelle di diversi operatori. La maggior parte dei dataset esistenti manca di questi elementi critici, rendendoli meno utili per applicazioni nel mondo reale.

Per affrontare queste carenze, abbiamo creato un nuovo dataset chiamato Hand and Glove Segmentation Dataset (HAGS). Questo dataset include immagini reali catturate nelle glovebox e consente ai ricercatori di costruire algoritmi che riconoscono mani e guanti in condizioni difficili.

Raccolta del dataset

Il nostro dataset consiste in video registrati in una tipica glovebox, mostrando partecipanti umani che completano Compiti di Assemblaggio con un Braccio robotico. I video sono stati catturati da due angolazioni: una vista a volo d'uccello e una vista laterale, utilizzando telecamere ad alta definizione. In totale, abbiamo raccolto 191 video, per un totale di circa 9 ore di filmati.

Ogni partecipante ha completato ciascun compito indossando guanti o a volte senza guanti, consentendo la raccolta di una gamma diversificata di scenari. In totale, abbiamo annotato oltre 1.700 fotogrammi per l'uso nella formazione e nel test dei modelli di apprendimento automatico.

I compiti di assemblaggio

Abbiamo progettato due diversi compiti di assemblaggio per raccogliere dati in modo efficace.

Compito Jenga

In questo compito, i partecipanti hanno costruito una torre Jenga utilizzando blocchi che assomigliano a dita umane. Questa impostazione è stata scelta perché pone sfide per i modelli di segmentazione delle mani. I partecipanti hanno assunto ruoli o come operatori robotici o come posatori di blocchi. Il robot avrebbe passato i blocchi Jenga al partecipante, che poi li impilava.

Compito Toolbox

Per questo compito, ai partecipanti è stato dato un toolbox chiuso da aprire utilizzando diversi strumenti. Il braccio robotico avrebbe preso gli strumenti e passarli al partecipante, che li avrebbe usati per svitare il toolbox. Questo compito era più complesso poiché coinvolgeva più azioni e strumenti, fornendo dati preziosi per riconoscere i movimenti delle mani in vari contesti.

Sfide affrontate negli ambienti glovebox

Lavorare nelle glovebox presenta sfide uniche. Le superfici metalliche possono creare abbagliamenti e riflessi che confondono i sistemi di visione delle macchine. Inoltre, gli operatori possono soffrire di infortuni ergonomici o esposizione se i guanti si strappano. Includendo sia scenari con guanti che senza guanti nel nostro dataset, abbiamo cercato di preparare i sistemi di apprendimento automatico per eventi rari ma possibili.

Inoltre, abbiamo incorporato uno sfondo a schermo verde in metà dei video registrati. Questo ci ha permesso di testare quanto bene i modelli possono gestire sfondi distraenti, poiché abbiamo introdotto immagini sintetiche durante l'analisi.

Preparazione dei dati e annotazione

I video raccolti sono stati preparati con cura per l'analisi. Abbiamo campionato fotogrammi dai video, assicurandoci di avere un dataset bilanciato che rappresentasse vari scenari, inclusi angoli e compiti diversi. Il nostro dataset finale comprende fotogrammi in distribuzione, che riflettono operazioni comuni nelle glovebox, e fotogrammi fuori distribuzione, che includono condizioni più impegnative.

Ogni fotogramma è stato etichettato per identificare la mano sinistra, la mano destra e lo sfondo. Due annotatori hanno lavorato sull'etichettatura per garantire accuratezza, portando a un alto livello di accordo nelle loro valutazioni. Questa etichettatura rigorosa è fondamentale poiché influisce direttamente sull'affidabilità dei modelli di apprendimento automatico.

Sperimentazione

Per valutare il nostro dataset, abbiamo condotto due esperimenti principali.

Esperimento A: Apprendimento per trasferimento

In questo esperimento, abbiamo testato quanto bene i modelli esistenti addestrati su altri dataset potessero performare quando rifiniti utilizzando i nostri dati HAGS. L'obiettivo era vedere se i modelli potessero mantenere buone prestazioni nei nostri complessi scenari glovebox dopo essere stati addestrati su compiti diversi. Abbiamo scoperto che le prestazioni non si trasferivano bene, evidenziando la necessità di dataset più mirati per applicazioni specifiche del settore.

Esperimento B: Quantificazione dell'incertezza

Questo esperimento si è concentrato sulle applicazioni in tempo reale e ha valutato quanto bene i modelli di apprendimento automatico potessero gestire i diversi tipi di dati nel nostro dataset. Abbiamo impiegato metriche come l'Intersection over Union (IoU) per valutare l'accuratezza dei modelli nel riconoscere le mani in varie condizioni. Questo esperimento mirava a garantire che i modelli potessero operare efficacemente anche in situazioni inaspettate.

Addestramento del modello

Per i nostri esperimenti, abbiamo utilizzato varie architetture di apprendimento automatico, comprese le reti neurali convoluzionali, che sono popolari per i compiti di segmentazione delle immagini. Abbiamo diviso il dataset in set di addestramento e test per valutare accuratamente le prestazioni del modello. I nostri risultati hanno indicato che, mentre alcuni modelli hanno ottenuto risultati discreti su compiti familiari, hanno faticato con le complessità presentate dalle operazioni nel mondo reale.

Discussione e risultati

La creazione del dataset HAGS è un passo avanti per migliorare la tecnologia di collaborazione uomo-robot nei contesti di produzione, in particolare nelle glovebox. I nostri esperimenti hanno rivelato alcuni risultati significativi:

  1. I dataset esistenti sono insufficienti per le complessità delle applicazioni industriali.
  2. Dati di addestramento diversificati che includono varie condizioni delle mani sono essenziali per sviluppare modelli affidabili.
  3. Gli scenari del mondo reale introducono imprevedibilità che i modelli attuali spesso non gestiscono bene.

Queste intuizioni sottolineano la necessità di una ricerca continua e di ulteriori dataset focalizzati sulle interazioni uomo-robot in ambienti specializzati.

Direzioni future

Anche se il nostro lavoro ha gettato una solida base, ci sono molte opportunità di crescita. La futura ricerca dovrebbe continuare a concentrarsi sull'espansione del dataset per includere più partecipanti con background diversi. Aumentare il numero di video e le condizioni rappresentate aiuterà i modelli di apprendimento automatico a diventare più robusti ed efficaci.

Inoltre, incorporare variabili aggiuntive, come diverse condizioni di illuminazione o l'uso di guanti vari, può fornire un ambiente di addestramento più completo. Col tempo, speriamo che questo dataset possa servire come una risorsa cruciale per i ricercatori che mirano a migliorare la sicurezza e l'efficienza dei sistemi collaborativi negli ambienti industriali.

Conclusione

Il dataset HAGS rappresenta un passo essenziale nell'avanzamento della tecnologia per una collaborazione sicura tra uomini e robot, in particolare in ambienti glovebox impegnativi. Riconoscendo le limitazioni dei dataset esistenti e affrontandole attraverso dati reali, miriamo a aprire la strada a sistemi di apprendimento automatico migliorati che possano comprendere meglio le azioni umane. Con l'evoluzione del panorama della produzione, la nostra ricerca spera di giocare un ruolo critico per garantire che i sistemi possano adattarsi e operare in sicurezza al fianco dei lavoratori umani.

Attraverso i nostri sforzi continui, aspiriamo a favorire una cooperazione intelligente, sicura ed efficace tra persone e macchine, beneficiando in ultima analisi l'industria nel suo complesso.

Fonte originale

Titolo: The Collection of a Human Robot Collaboration Dataset for Cooperative Assembly in Glovebox Environments

Estratto: Industry 4.0 introduced AI as a transformative solution for modernizing manufacturing processes. Its successor, Industry 5.0, envisions humans as collaborators and experts guiding these AI-driven manufacturing solutions. Developing these techniques necessitates algorithms capable of safe, real-time identification of human positions in a scene, particularly their hands, during collaborative assembly. Although substantial efforts have curated datasets for hand segmentation, most focus on residential or commercial domains. Existing datasets targeting industrial settings predominantly rely on synthetic data, which we demonstrate does not effectively transfer to real-world operations. Moreover, these datasets lack uncertainty estimations critical for safe collaboration. Addressing these gaps, we present HAGS: Hand and Glove Segmentation Dataset. This dataset provides 1200 challenging examples to build applications toward hand and glove segmentation in industrial human-robot collaboration scenarios as well as assess out-of-distribution images, constructed via green screen augmentations, to determine ML-classifier robustness. We study state-of-the-art, real-time segmentation models to evaluate existing methods. Our dataset and baselines are publicly available: https://dataverse.tdl.org/dataset.xhtml?persistentId=doi:10.18738/T8/85R7KQ and https://github.com/UTNuclearRoboticsPublic/assembly_glovebox_dataset.

Autori: Shivansh Sharma, Mathew Huang, Sanat Nair, Alan Wen, Christina Petlowany, Juston Moore, Selma Wanna, Mitch Pryor

Ultimo aggiornamento: 2024-07-19 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2407.14649

Fonte PDF: https://arxiv.org/pdf/2407.14649

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili