Innovazioni nella Sintesi dei Dati di Tracciamento Oculare
Un nuovo modello aumenta il realismo dei dati di tracciamento oculare sintetici per applicazioni migliori.
― 6 leggere min
Indice
La tecnologia del tracciamento oculare è diventata importante in vari campi come salute, educazione e marketing. Con i nuovi dispositivi che utilizzano questa tecnologia che diventano popolari nell'elettronica di consumo, è cruciale assicurarsi che i dati prodotti da questi dispositivi siano di buona qualità. Tuttavia, i diversi dispositivi di tracciamento oculare possono generare livelli di Qualità dei Dati variabili, il che rappresenta delle sfide per i ricercatori e gli sviluppatori.
Per affrontare questi problemi, i ricercatori hanno sviluppato tecniche per cambiare i dati registrati da un tracciatore oculare in modo che assomiglino a quelli di un altro. Questo è importante per aumentare la quantità e la varietà dei dati disponibili, che possono aiutare ad addestrare modelli di apprendimento automatico utilizzati in varie applicazioni.
L'obiettivo principale di questo lavoro è creare un modo migliore per far sembrare i dati provenienti da tracciatori oculari di alta qualità come quelli di dispositivi di qualità inferiore. L'intento è migliorare il realismo dei Dati Sintetici generati, che possono essere utilizzati in diversi scenari. Facendo ciò, i segnali generati assomiglieranno di più alla qualità dei dispositivi target.
Tracciamento Oculare e la Sua Variabilità
La tecnologia del tracciamento oculare è stata usata per molto tempo in ambienti controllati, offrendo preziose intuizioni. Man mano che i dispositivi diventano sempre più integrati nella tecnologia di tutti i giorni, la qualità dei segnali di tracciamento oculare può cambiare. Fattori come la precisione spaziale e la coerenza della registrazione dei dati possono influenzare i dati risultanti. Questa inconsistenza rende difficile applicare le stesse tecniche di elaborazione a diversi tipi di dispositivi.
Per superare queste sfide, i ricercatori hanno proposto metodi per alterare i segnali di tracciamento oculare. Questi metodi consentono ai dati registrati su un dispositivo di imitare le caratteristiche di un altro dispositivo. Facendo ciò, aumentano la varietà dei dati di addestramento per l'apprendimento automatico e aiutano i progettisti a stimare come si comporteranno diversi dispositivi in applicazioni reali.
Tuttavia, creare dati sintetici realistici non è semplice. Ci sono molti modi per valutare la qualità dei tracciatori oculari e diversi fattori contribuiscono alle variazioni nei segnali di tracciamento oculare. Il rumore dell'attrezzatura e della persona che la utilizza può distorcere i risultati. Modelli recenti hanno suggerito di aggiungere rumore per rappresentare meglio gli errori di registrazione dei tracciatori oculari, ma questi modelli spesso non affrontano efficacemente né la qualità spaziale né la Precisione temporale.
Migliorare il Modello
Questo studio introduce diversi miglioramenti a un modello esistente che degrada i segnali di tracciamento oculare. Il nuovo modello introduce modifiche per garantire che sia la precisione spaziale che la precisione temporale siano influenzate in modo realistico. Utilizza anche tecniche per abbinare meglio la struttura della qualità dei dati presenti nelle registrazioni del mondo reale.
I ricercatori hanno usato dati provenienti da due diversi tracciatori oculari: un dispositivo EyeLink 1000 di alta qualità e un dispositivo SMI di qualità inferiore utilizzato nella realtà virtuale. Confrontando questi diversi dispositivi, puntano a creare dati sintetici che rispecchiano da vicino le caratteristiche delle registrazioni del dispositivo di qualità inferiore.
La valutazione di questo nuovo modello si basa su due fronti: quanto bene replica le caratteristiche individuali dei segnali di tracciamento oculare e come si comporta complessivamente rispetto ai dati originali catturati dal dispositivo target.
Metodologia
Per creare il nuovo modello, i ricercatori hanno prima stabilito un metodo per catturare i dati sul movimento oculare. Hanno raccolto dati da più partecipanti attraverso vari compiti, consentendo una rappresentazione ampia di come vengono tracciati i movimenti oculari. I dati iniziali sono stati raccolti utilizzando il tracciatore oculare EyeLink 1000 di alta qualità.
Successivamente, i ricercatori hanno trasformato questi dati di alta qualità per simulare come apparirebbero se fossero stati registrati con il dispositivo SMI di qualità inferiore. Hanno introdotto una procedura per degradare sia la precisione spaziale che la precisione temporale dei segnali, assicurandosi che assomigliassero da vicino alle caratteristiche del dispositivo target.
Per raggiungere questo obiettivo, i ricercatori hanno applicato una tecnica che misura come i punti dati si classificano all'interno della distribuzione delle metriche di qualità. Questo consente loro di determinare quanto degrado è necessario per raggiungere il livello di qualità desiderato, modificando efficacemente le caratteristiche dei dati originali.
Valutazione del Modello
I ricercatori hanno valutato la qualità dei dati sintetici attraverso confronti visivi e test statistici. Hanno confrontato le distribuzioni delle misure di qualità tra i dati sintetici e i dati reali catturati dal dispositivo di qualità inferiore. L'obiettivo era verificare se le modifiche apportate al modello avessero migliorato significativamente la somiglianza dei dati sintetici con i dati reali.
La valutazione ha coinvolto l'uso di un metodo di classificazione dei vicini più prossimi, che verifica quanto bene i due diversi set di dati possano essere distinti l'uno dall'altro. Se l'accuratezza della classificazione è attorno al 50%, ciò indica che i dati sintetici sono quasi indistinguibili dai dati reali.
I risultati hanno mostrato che il nuovo modello ha performato meglio rispetto al metodo precedente. I dati sintetici prodotti dal nuovo modello erano più vicini ai dati reali in termini di varie metriche di qualità. Questo suggerisce che le modifiche apportate hanno portato a una rappresentazione più realistica dei dati sul movimento oculare.
Conclusione
Questo lavoro presenta un nuovo modello per sintetizzare i dati sul movimento oculare che migliora il suo realismo. Combinando diverse tecniche per alterare sia la precisione spaziale che quella temporale, i ricercatori sono riusciti a creare dati sintetici che riflettono più accuratamente le caratteristiche dei dati di tracciamento oculare raccolti da dispositivi di qualità inferiore.
Questo modello migliorato ha implicazioni significative per il futuro della ricerca e delle applicazioni sul tracciamento oculare. Consentendo una migliore aumentazione dei dati, può aiutare a migliorare i modelli di apprendimento automatico che si basano sui segnali di movimento oculare. Di conseguenza, questo può portare a una migliore classificazione, previsione e persino allo sviluppo di sistemi biometrici.
Le scoperte ampliano ulteriormente la letteratura disponibile introducendo un workflow di valutazione che può essere applicato in diverse applicazioni. Questo approccio può aiutare i progettisti a valutare la qualità dei dati sintetici senza dover riaddestrare i modelli di apprendimento automatico, accelerando il processo di sviluppo.
In futuro, il lavoro potrebbe mirare a perfezionare ulteriormente la precisione spaziale dei dati sintetici. Affinare il modello per riflettere le complessità delle distribuzioni reali dei dati migliorerà la sua efficacia e utilità. Inoltre, esplorare l'incorporazione di ulteriori caratteristiche relative alla dinamica del movimento oculare può portare a valutazioni dei dati ancora più ricche.
Titolo: A Mechanistic Transform Model for Synthesizing Eye Movement Data with Improved Realism
Estratto: This manuscript demonstrates an improved model-based approach for synthetic degradation of previously captured eye movement signals. Signals recorded on a high-quality eye tracking sensor are transformed such that their resulting eye tracking signal quality is similar to recordings captured on a low-quality target device. The proposed model improves the realism of the degraded signals versus prior approaches by introducing a mechanism for degrading spatial accuracy and temporal precision. Moreover, a percentile-matching technique is demonstrated for mimicking the relative distributional structure of the signal quality characteristics of the target data set. The model is demonstrated to improve realism on a per-feature and per-recording basis using data from an EyeLink 1000 eye tracker and an SMI eye tracker embedded within a virtual reality platform. The model improves the median classification accuracy performance metric by 35.7% versus the benchmark model towards the ideal metric of 50%. This paper also expands the literature by providing an application-agnostic realism assessment workflow for synthetically generated eye movement signals.
Autori: Henry Griffith, Samantha Aziz, Dillon J Lohr, Oleg Komogortsev
Ultimo aggiornamento: 2023-06-14 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2306.08712
Fonte PDF: https://arxiv.org/pdf/2306.08712
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.