Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Intelligenza artificiale# Interazione uomo-macchina

Sviluppi nel Zero-Shot Learning per la Sensibilità IoT

Un nuovo approccio migliora il zero-shot learning per una migliore classificazione dei dati IoT.

― 8 leggere min


Zero-Shot Learning perZero-Shot Learning perIoTapprendimento.IoT con nuove tecniche diMigliorare la classificazione dei dati
Indice

Negli ultimi anni, il deep learning ha fatto grandi progressi in molti campi, compreso l'Internet delle Cose (IoT). I dispositivi IoT sono ovunque, raccogliendo dati attraverso vari sensori. Questi dispositivi possono aiutarci a capire e analizzare l'ambiente in tempo reale. Tuttavia, i modelli di deep learning tradizionali hanno delle limitazioni, soprattutto quando si tratta di riconoscere nuovi tipi di dati che non hanno mai visto prima. Questo è un problema, specialmente quando si lavora con i dati dei dispositivi IoT, dove il numero di classi diverse può essere piuttosto limitato.

Una soluzione a questa sfida è un metodo chiamato Zero-shot Learning (ZSL). Lo ZSL permette ai modelli di fare previsioni su nuove classi basandosi su informazioni apprese in precedenza. Questo avviene utilizzando informazioni semantiche, che sono dati che descrivono le caratteristiche delle classi. In questo modo, possiamo classificare dati da classi non viste senza dover addestrare il modello su quelle classi specifiche.

Inoltre, i Modelli Fondamentali (FMs) sono modelli di deep learning di grande dimensione addestrati su dataset diversi, che hanno dimostrato abilità straordinarie in vari compiti. Questi modelli possono generare informazioni utili che possono essere applicate a diversi campi, tra cui l'elaborazione del linguaggio naturale e il riconoscimento delle immagini. Tuttavia, la loro applicazione nel campo della rilevazione IoT con segnali specifici come mmWave, IMU e Wi-Fi non è stata esplorata a fondo.

Panoramica del Problema

La sfida fondamentale nella rilevazione IoT è che i modelli addestrati in contesti tradizionali spesso fanno fatica quando si trovano di fronte a dati di classi che non hanno mai visto prima. Per migliorare le performance dei dispositivi IoT in queste situazioni, abbiamo bisogno di un metodo che possa utilizzare efficacemente i dati disponibili e trarne conclusioni significative. Gli approcci tradizionali di machine learning richiedono spesso grandi quantità di dati etichettati per funzionare correttamente e possono avere difficoltà con dati limitati, che è comune nelle applicazioni IoT.

Questo ci porta allo ZSL. Lo ZSL può potenzialmente consentire ai dispositivi IoT di identificare e classificare dati da queste nuove classi con l'aiuto delle informazioni semantiche. Tuttavia, i metodi passati si sono basati su approcci manuali che sono faticosi e difficili da scalare per dataset più complessi.

Zero-Shot Learning

Lo zero-shot learning mira a classificare dati da classi nuove utilizzando conoscenze acquisite da classi conosciute. I metodi ZSL tradizionali si concentrano tipicamente solo sul riconoscimento delle classi non viste, il che può essere limitante. Un approccio migliorato, noto come generalized zero-shot learning (GZSL), cerca di identificare sia le classi viste che quelle non viste contemporaneamente.

I metodi GZSL possono essere divisi in due categorie principali: metodi basati su embedding e metodi generativi. I metodi basati su embedding creano una funzione che mappa le caratteristiche dei dati a spazi semantici. L'obiettivo è collegare gli embedding dei dati della stessa classe e portarli più vicino alle etichette corrispondenti nello spazio semantico. Questo metodo è spesso semplice, ma può essere distorto a favore delle classi viste a causa della mancanza di dati per le classi non viste durante l'addestramento.

D'altra parte, gli approcci basati su generazione addestrano modelli a creare caratteristiche sintetiche di classi non viste basate sulle caratteristiche delle classi viste. Anche se questi metodi possono aiutare ad alleviare i pregiudizi fornendo alcuni dati di classi non viste, sono spesso meno stabili e possono affrontare problemi durante l'addestramento.

Modelli Fondamentali

I modelli fondamentali sono sistemi di deep learning su larga scala addestrati su enormi quantità di dati. Questi modelli hanno mostrato successi significativi in vari compiti. Ad esempio, possono essere utilizzati per chatbot, riconoscimento delle immagini, generazione di codice, traduzione linguistica e altro. La versatilità di questi modelli consente loro di gestire efficacemente un'ampia gamma di tipi di dati.

Negli sviluppi recenti, questi modelli fondamentali sono stati utilizzati per creare connessioni tra vari tipi di dati, come audio, testo e immagini. Imparando da dataset diversi, questi modelli possono generare embedding che possono essere utili per diverse applicazioni, comprese le attività di rilevazione IoT.

Approccio Proposto

Per affrontare le sfide nella rilevazione IoT zero-shot, proponiamo un metodo che allinea gli embedding dei dati IoT con gli embedding semantici derivati dall'encoder di testo di un modello fondamentale. Il nostro approccio consiste in diversi passaggi mirati a migliorare le performance della rilevazione IoT.

Prima di tutto, applichiamo l'ingegneria dei prompt per creare prototipi di classe efficaci. Utilizziamo una combinazione di prompt morbidi, che sono vettori apprendibili che si adattano ai dati, insieme a prompt rigidi, che si basano su conoscenze specifiche del dominio. Questa combinazione aiuta a creare embedding semantici robusti necessari per classificare dati non visti.

Utilizziamo tecniche di cross-attention per unire questi due tipi di prompt. Questo metodo ci consente di sfruttare i punti di forza sia dei prompt morbidi che di quelli rigidi per generare una comprensione approfondita di ogni classe.

Secondo, per affrontare il pregiudizio negli embedding IoT, implementiamo l'augmentazione dei dati per generare dati sintetici per classi non viste. Questo aiuta a garantire che i nostri modelli non dipendano eccessivamente dalle classi viste e possano generalizzare efficacemente ai nuovi dati.

Terzo, valutiamo il nostro metodo proposto su più dataset IoT, utilizzando vari metriche di performance per valutare come si comporta nella rilevazione open-set e nello zero-shot learning.

Implementazione del Metodo

Il nostro metodo coinvolge diversi moduli chiave per ottenere una rilevazione IoT zero-shot efficace:

Estrazione del Prototipo di Classe

Utilizziamo l'encoder di testo di un modello fondamentale per estrarre prototipi di classe dalle descrizioni testuali fornite. Questi prototipi catturano le caratteristiche essenziali di ogni classe, che aiutano a determinare come classificare i dati in arrivo.

Inoltre, creiamo prompt per le classi basate su tecniche di prompt morbidi e rigidi. Il prompt morbido è apprendibile e si adatta durante l'addestramento del modello, mentre il prompt rigido integra conoscenze specifiche nel prototipo di classe.

Estrazione degli Embedding IoT

Ogni campione di dati IoT in arrivo viene elaborato utilizzando un estrattore di caratteristiche. Questo può comportare architetture ben note come le reti neurali convoluzionali (CNN) o i transformer, a seconda del tipo di dati IoT che si sta analizzando. Le caratteristiche estratte vengono quindi proiettate negli spazi semantici per creare embedding IoT.

Addestramento del Modello

Alleniamo il nostro modello utilizzando una strategia di apprendimento contrastivo supervisionato. Questo approccio consente al modello di apprendere come differenziare tra campioni di dati simili e dissimili. Funziona riunendo gli embedding delle coppie positive mentre allontana gli embedding delle coppie negative.

Durante l'addestramento del modello, sintetizziamo anche dati di classi non viste utilizzando modelli generativi. Questo garantisce che i nostri embedding IoT siano robusti e meno distorti verso le classi viste.

Rilevazione Open-Set

La rilevazione open-set identifica se i campioni in arrivo appartengono a classi conosciute o sconosciute. Calcoliamo le distanze tra gli embedding IoT dei campioni e i cluster formati dagli embedding delle classi viste. Basandoci su queste distanze, possiamo classificare i campioni come visti o non visti.

Classificazione Zero-Shot

Per i campioni identificati come non visti, li carichiamo nel modello fondamentale basato su cloud per la classificazione. Il modello calcola punteggi di somiglianza tra gli embedding IoT e i prototipi di classe per assegnare l'etichetta più appropriata ai dati non visti.

Valutazione e Risultati

Abbiamo valutato il nostro metodo su più dataset, che includevano dati IMU, mmWave e Wi-Fi. Questa valutazione ha coinvolto il test del nostro approccio contro vari baseline per misurare la sua efficacia sia nella rilevazione open-set che nello zero-shot learning generalizzato.

Per quanto riguarda la rilevazione open-set, il nostro metodo ha superato gli approcci precedenti. I risultati hanno dimostrato che la combinazione di apprendimento contrastivo supervisionato e augmentazione dei dati ha aiutato a creare embedding IoT meglio definiti, consentendo un'identificazione migliorata delle classi non viste.

Per quanto riguarda la classificazione zero-shot, il nostro metodo ha mostrato anche prestazioni superiori. Utilizzando modelli fondamentali per migliorare gli embedding semantici, abbiamo raggiunto una maggiore accuratezza nel riconoscere sia le classi viste che quelle non viste.

Discussione

La nostra esplorazione dell'uso dei modelli fondamentali per la rilevazione IoT zero-shot ha rivelato numerose opportunità di miglioramento nel modo in cui classifichiamo e analizziamo i dati provenienti dai dispositivi IoT. La combinazione di ingegneria dei prompt efficace e augmentazione dei dati ci ha permesso di creare un sistema che è sia flessibile che robusto contro le sfide di dati etichettati limitati.

Nel nostro lavoro futuro, prevediamo di esplorare il potenziale per integrare modalità aggiuntive e adattare il nostro approccio a una gamma più ampia di sensori IoT e applicazioni. Prevediamo anche di indagare sull'interpretabilità del nostro metodo, il che fornirebbe informazioni su come il modello effettua le sue classificazioni. Comprendere questi processi può aiutare a migliorare la fiducia degli utenti nei sistemi di machine learning, in particolare in applicazioni critiche come la salute e la sicurezza.

Conclusione

In sintesi, il nostro lavoro si è concentrato sul miglioramento della rilevazione IoT zero-shot attraverso l'uso innovativo di modelli fondamentali e tecniche di apprendimento avanzate. Sfruttando le conoscenze generalizzate codificate nei modelli fondamentali, abbiamo sviluppato un metodo che collega efficacemente i dati IoT e la comprensione semantica. I nostri risultati indicano che possiamo ottenere miglioramenti significativi nella rilevazione e classificazione delle classi non viste, portando infine a soluzioni di rilevazione IoT più efficaci e affidabili.

Fonte originale

Titolo: Leveraging Foundation Models for Zero-Shot IoT Sensing

Estratto: Deep learning models are increasingly deployed on edge Internet of Things (IoT) devices. However, these models typically operate under supervised conditions and fail to recognize unseen classes different from training. To address this, zero-shot learning (ZSL) aims to classify data of unseen classes with the help of semantic information. Foundation models (FMs) trained on web-scale data have shown impressive ZSL capability in natural language processing and visual understanding. However, leveraging FMs' generalized knowledge for zero-shot IoT sensing using signals such as mmWave, IMU, and Wi-Fi has not been fully investigated. In this work, we align the IoT data embeddings with the semantic embeddings generated by an FM's text encoder for zero-shot IoT sensing. To utilize the physics principles governing the generation of IoT sensor signals to derive more effective prompts for semantic embedding extraction, we propose to use cross-attention to combine a learnable soft prompt that is optimized automatically on training data and an auxiliary hard prompt that encodes domain knowledge of the IoT sensing task. To address the problem of IoT embeddings biasing to seen classes due to the lack of unseen class data during training, we propose using data augmentation to synthesize unseen class IoT data for fine-tuning the IoT feature extractor and embedding projector. We evaluate our approach on multiple IoT sensing tasks. Results show that our approach achieves superior open-set detection and generalized zero-shot learning performance compared with various baselines. Our code is available at https://github.com/schrodingho/FM\_ZSL\_IoT.

Autori: Dinghao Xue, Xiaoran Fan, Tao Chen, Guohao Lan, Qun Song

Ultimo aggiornamento: 2024-07-29 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2407.19893

Fonte PDF: https://arxiv.org/pdf/2407.19893

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili