Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Interazione uomo-macchina# Architettura di rete e Internet

Assistenti vocali e profili utente: uno sguardo più da vicino

Uno studio su come gli assistenti vocali profilano gli utenti e le preoccupazioni per la privacy collegate.

― 9 leggere min


Assistenti Vocali eAssistenti Vocali eRischi per la Privacynegli assistenti vocali.Analisi delle pratiche di profilazione
Indice

Molte aziende, come Google, Amazon e Apple, offrono assistenti vocali per aiutare gli utenti a trovare rapidamente informazioni e accedere ai loro servizi. Questi assistenti vocali sono ormai ampiamente utilizzati, presenti in smartphone, altoparlanti smart, smartwatch e altro. Tuttavia, usare questi assistenti solleva importanti preoccupazioni per la privacy.

Sebbene le aziende dicano che potrebbero utilizzare le interazioni vocali per il profilo degli utenti nelle loro politiche sulla privacy, spesso è vago e non chiaro quanto profiling avvenga realmente. È difficile sapere se utilizzare assistenti vocali comporti più rischi per la privacy rispetto ad altre modalità di interazione, come la navigazione web.

In questo studio, esaminiamo come i tre principali assistenti vocali-Google Assistant, Amazon Alexa e Apple Siri-profilano gli utenti attraverso diversi tipi di query e personas per diversi mesi. Analizziamo come gli utenti vengono etichettati, l'accuratezza di queste etichette, il tempo necessario per cambiarle e come diverse modalità di interazione influenzino il processo di profiling. Controlliamo anche gli strumenti forniti da questi assistenti per aiutare gli utenti a controllare i loro profili.

La nostra ricerca mostra che il profiling può avvenire anche senza interazione e può a volte essere errato o incoerente. Le modifiche ai profili possono richiedere giorni o settimane. Inoltre, il metodo utilizzato per interagire con gli assistenti può influenzare come vengono profilati gli utenti.

Introduzione

Gli assistenti vocali, come Amazon Alexa, Google Assistant e Apple Siri, stanno diventando strumenti importanti per accedere a informazioni e servizi. Aiutano gli utenti a svolgere compiti senza bisogno di interfacce fisiche, rendendoli molto popolari, soprattutto negli Stati Uniti.

Nonostante i loro vantaggi, ci sono problemi di privacy notevoli nell'uso degli assistenti vocali, simili alle preoccupazioni viste con la navigazione web. Ricerche precedenti indicano che i servizi online utilizzano spesso i dati degli utenti per il profiling, il che mira a personalizzare i contenuti per gli utenti. Inoltre, ci sono prove che alcune interazioni degli utenti con le skill di Alexa di terze parti vengano utilizzate anche per il profiling.

Tuttavia, non è chiaro quanto gli assistenti vocali stessi si impegnino nel profiling senza applicazioni di terze parti e come i loro metodi si confrontino con le interazioni web. Questa incertezza sottolinea la necessità di ulteriori ricerche su come gli assistenti vocali profilano gli utenti e sui rischi per la privacy associati.

Capire il profiling è importante in quanto influisce sull'esperienza dell'utente-profili errati possono portare a pubblicità irrilevanti e potrebbero influenzare le strategie di marketing. C'è anche il rischio che informazioni errate possano essere condivise con terzi, evidenziando la necessità di comprendere meglio il profiling degli utenti.

Puntiamo a indagare le implicazioni per la privacy dell'interazione con gli assistenti vocali, concentrandoci su cosa viene profilato, quanto sono accurati questi profili e quanto tempo ci vuole per aggiornarli. Confronteremo anche il profiling degli utenti attraverso comandi vocali e ricerche web, esaminando se e come questi metodi differiscano.

Infine, valuteremo l'efficacia degli strumenti disponibili per aiutare gli utenti a gestire i loro profili, come le opzioni per rinunciare o correggere le etichette.

Lavoro Correlato

Privacy e Assistenti Vocali

Sin dalla loro introduzione, gli assistenti vocali e i loro dispositivi (come gli altoparlanti smart) hanno sollevato preoccupazioni per la privacy e la sicurezza. La maggior parte degli studi esistenti si concentra sui rischi dovuti a difetti tecnologici, come attivazioni accidentali degli altoparlanti smart e bug che possono portare alla condivisione non autorizzata delle registrazioni. Inoltre, è possibile inferire caratteristiche degli utenti dalle registrazioni invece che solo da ciò che viene detto, creando maggiori possibilità per il profiling.

Profiling Basato su Persona

Adottiamo una metodologia basata su personas per creare etichette nel contesto degli assistenti vocali. Questo approccio è stato utilizzato per studiare come i dati vengano condivisi con terzi in altri contesti, come la navigazione web. Sebbene alcuni studi abbiano esaminato le personas nel contesto degli assistenti vocali, spesso si concentrano su applicazioni di terze parti piuttosto che sugli assistenti vocali stessi.

Metodologia

Questo studio si concentra sulle pratiche di profiling degli assistenti vocali. La nostra ricerca coinvolge la creazione di account utente, l'instaurazione di personas attraverso specifiche query vocali e l'analisi delle etichette di profiling risultanti.

Definizione degli Assistenti Vocali

Definiamo gli assistenti vocali come software progettati per elaborare comandi vocali per svolgere una varietà di compiti. Gli assistenti vocali che esaminiamo-Google Assistant, Alexa e Siri-sono tutti basati su cloud, il che significa che operano elaborando i dati degli utenti esternamente piuttosto che sul dispositivo dell'utente.

Etichette di Profiling

Le etichette di profiling sono elementi essenziali all'interno del profilo di un utente che derivano dai dati raccolti attraverso le interazioni. Categorizziamo le etichette in etichette demografiche, che si riferiscono a caratteristiche personali, e etichette di inferenza, che riflettono gli interessi degli utenti.

Query di Allenamento

Le query di allenamento sono domande progettate specificamente per plasmare la persona di un utente nel framework dell'assistente vocale. Queste query sono essenziali per guidare l'assistente nel riconoscere specifiche etichette di profiling.

Modalità di Interazione

Le modalità di interazione si riferiscono ai diversi modi in cui gli utenti possono comunicare con gli assistenti vocali, comprese le input vocali o le query testuali. I nostri studi confrontano queste modalità per vedere come influenzano il profiling degli utenti.

Domande di Ricerca

  1. Gli assistenti vocali partono con etichette precompilate?

    • Esaminiamo se gli account appena creati abbiano etichette assegnate prima di qualsiasi interazione.
  2. Il profiling avviene, e a che extent?

    • Misuriamo l'accuratezza e la coerenza dei profili degli utenti dopo interazioni basate su persona.
  3. Il metodo di interazione influisce sul profiling?

    • Esploriamo se diversi metodi di interazione (voce rispetto al web) influenzino come vengono profilati gli utenti.
  4. Quanto sono efficaci gli strumenti forniti per mitigare il profiling?

    • Investigiamo se gli utenti possono rimuovere o modificare con successo le loro etichette di profiling.

Preparazione dell'Esperimento

Abbiamo controllato attentamente i nostri esperimenti per prevenire interferenze, garantendo risultati consistenti tra diversi account e query. Abbiamo creato nuovi account utente e monitorato direttamente le etichette di profiling generate durante i nostri esperimenti.

Approccio Sperimentale

  1. Creazione dell'Account: Abbiamo creato nuovi account per ogni persona, assicurandoci che tutti gli account rimanessero indipendenti.
  2. Richieste di Divulgazione dei Dati: Abbiamo utilizzato vie legali per richiedere informazioni sulle etichette di profiling assegnate agli utenti.
  3. Interazioni Vocali Basate su Persona: Abbiamo facilitato query basate su persona specificamente adattate agli assistenti vocali, osservando come queste influenzassero l'etichettatura.
  4. Esperimenti con Modalità Web: Abbiamo replicato le query basate sulla persona attraverso interfacce web per confrontare i risultati del profiling.
  5. Test di Mitigazione: Abbiamo valutato gli strumenti disponibili per gestire o modificare efficacemente le etichette di profiling.

Raccolta Dati

Per ogni assistente, abbiamo preparato un insieme dettagliato di query che guiderebbero il processo di profiling, assicurandoci che le nostre domande riflettessero accuratamente le personas che abbiamo creato. Le query erano personalizzate per ogni persona, concentrandosi su tratti chiave destinati a influenzare il profiling.

Risultati

Etichette Precompilate

I nostri risultati hanno rivelato che Google Assistant assegna certe etichette agli utenti prima di qualsiasi interazione. Queste etichette includevano "Proprietari di casa" e "Non genitori". Per Alexa e Siri, non c'erano segni di etichette precompilate.

Accuratezza e Tempistiche del Profiling

Abbiamo valutato l'accuratezza del profiling degli utenti dopo le interazioni e notato differenze significative in quanto a velocità ed efficacia con cui diverse piattaforme aggiornavano i profili.

  • Google Assistant: I comandi vocali portavano a risultati più variabili in termini di accuratezza del profiling e tempi molto più lunghi per cambiamenti delle etichette rispetto alle query web.
  • Amazon Alexa: L'assistente mostrava alta accuratezza quando i comandi erano direttamente correlati ai suoi prodotti, ottenendo risultati coerenti sia con interazioni vocali che web.
  • Apple Siri: La nostra valutazione non mostrava evidenze di profiling attraverso Siri, suggerendo che potrebbe essere più focalizzata sulla privacy.

Impatto della Modalità di Interazione

Abbiamo riscontrato chiare distinzioni tra come il profiling variava tra interazioni vocali e web. Google Assistant aveva tassi di accuratezza più elevati e aggiornamenti più rapidi quando si utilizzavano metodi web rispetto ai comandi vocali.

Strumenti di Mitigazione

Abbiamo testato l'efficacia delle funzionalità fornite da ciascuna piattaforma per gestire i profili utente. Google Assistant permetteva agli utenti di modificare e confermare efficacemente le etichette demografiche, mentre Amazon offriva meno flessibilità nel modificare le etichette di interesse senza rinunciare completamente.

Discussione

Implicazioni delle Etichette Precompilate

La presenza di etichette precompilate in Google Assistant solleva potenziali preoccupazioni per la privacy poiché potrebbero non riflettere accuratamente le caratteristiche reali dell'utente. Etichette fuorvianti potrebbero risultare in contenuti o pubblicità irrilevanti.

Accuratezza del Profiling e Rischi

I risultati hanno mostrato che, mentre il profiling di Amazon è deterministico, portando a risultati coerenti dalle interazioni degli utenti, l'approccio di Google coinvolge una metodologia probabilistica che può portare a errori. Le implicazioni di tali inesattezze potrebbero influenzare la fiducia degli utenti e l'efficacia della pubblicità mirata.

Sfide nei Tempi di Profiling

Processi di profiling che richiedono diversi giorni possono fuorviare gli utenti riguardo al loro stato di profiling, specialmente se richiedono dati troppo presto. Gli utenti potrebbero credere di non essere profilati o di essere stati etichettati erroneamente.

Controllo sui Profili

Sebbene sia Google che Amazon offrano opzioni per rinunciare al profiling, è fondamentale che gli utenti abbiano maggiore controllo sui propri profili, consentendo loro di modificare o rimuovere etichette in modo selettivo.

Conclusione

Il nostro studio rivela che gli assistenti vocali mostrano comportamenti di profiling distintivi, con Google Assistant che utilizza un metodo più flessibile che potrebbe portare a imprecisioni, mentre il metodo affidabile ma meno modificabile di Amazon si allinea strettamente con il suo ecosistema di prodotti. Apple Siri, d'altra parte, mostra un impegno per la privacy limitando le attività di profiling.

In generale, le nostre scoperte incoraggiano le aziende di assistenti vocali a migliorare la trasparenza sulle loro pratiche di profiling e a sviluppare strumenti che consentano agli utenti di gestire i propri profili in modo efficace.

Fonte originale

Titolo: Echoes of Privacy: Uncovering the Profiling Practices of Voice Assistants

Estratto: Many companies, including Google, Amazon, and Apple, offer voice assistants as a convenient solution for answering general voice queries and accessing their services. These voice assistants have gained popularity and can be easily accessed through various smart devices such as smartphones, smart speakers, smartwatches, and an increasing array of other devices. However, this convenience comes with potential privacy risks. For instance, while companies vaguely mention in their privacy policies that they may use voice interactions for user profiling, it remains unclear to what extent this profiling occurs and whether voice interactions pose greater privacy risks compared to other interaction modalities. In this paper, we conduct 1171 experiments involving a total of 24530 queries with different personas and interaction modalities over the course of 20 months to characterize how the three most popular voice assistants profile their users. We analyze factors such as the labels assigned to users, their accuracy, the time taken to assign these labels, differences between voice and web interactions, and the effectiveness of profiling remediation tools offered by each voice assistant. Our findings reveal that profiling can happen without interaction, can be incorrect and inconsistent at times, may take several days to weeks for changes to occur, and can be influenced by the interaction modality.

Autori: Tina Khezresmaeilzadeh, Elaine Zhu, Kiersten Grieco, Daniel J. Dubois, Konstantinos Psounis, David Choffnes

Ultimo aggiornamento: 2024-09-13 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2409.07444

Fonte PDF: https://arxiv.org/pdf/2409.07444

Licenza: https://creativecommons.org/licenses/by/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili