Simple Science

Scienza all'avanguardia spiegata semplicemente

# Informatica# Ingegneria del software

Migliorare le Informative sulla Privacy per le App Mobili

Un nuovo framework aiuta gli sviluppatori a creare dichiarazioni di privacy chiare per le app.

― 5 leggere min


Dichiarazioni sullaDichiarazioni sullaprivacy senza stressgli sviluppatori.informative sulla privacy delle app perNuovo framework semplifica le
Indice

Le app mobili raccolgono informazioni personali dagli utenti e devono informare gli utenti su cosa fanno con quei dati. Queste informazioni vengono fornite tramite avvisi sulla privacy. Scrivere questi avvisi può essere difficile per gli sviluppatori, e spesso risultano incoerenti o poco chiari. Alcuni metodi esistenti usano questionari o modelli per scrivere questi avvisi, ma questi approcci hanno i loro problemi.

La Necessità di Migliori Avvisi sulla Privacy

Gli avvisi sulla privacy devono essere chiari e precisi. Quando le app raccolgono Informazioni sensibili, come la posizione o i contatti, la Federal Trade Commission consiglia alle aziende di far sapere agli utenti quali dati stanno raccogliendo e perché. Ci sono tre modi principali in cui le app mobili danno queste informazioni:

  1. Politiche sulla Privacy
  2. Descrizioni dell'app
  3. Motivi per i Permessi

Anche se questi metodi sono stati usati, possono produrre avvisi vaghi o incompleti. Spesso, non cambiano quando il codice dell'app cambia, portando a maggior confusione.

Studi recenti si sono concentrati sul verificare se il comportamento di un'app corrisponde alle sue dichiarazioni sulla privacy. Alcune ricerche cercano di creare migliori politiche sulla privacy ponendo domande o analizzando come funziona l'app. Anche se questi metodi mostrano promesse, non sempre garantiscono che gli avvisi sulla privacy siano accurati o dettagliati.

Presentiamo PriGen

Per aiutare a migliorare gli avvisi sulla privacy, è stato sviluppato un nuovo framework chiamato PriGen. PriGen aiuta gli sviluppatori a creare dichiarazioni sulla privacy che corrispondano al codice della loro app, anche quando vengono apportate modifiche. Lo fa utilizzando un modello di deep learning per analizzare il codice dell'app e generare dichiarazioni sulla privacy concise, chiamate didascalie sulla privacy.

Le didascalie sulla privacy sono frasi brevi che spiegano quali dati personali raccoglie l'app e come utilizza quei dati. Queste didascalie possono servire a diversi scopi:

  1. Possono essere incluse in diversi formati di avvisi sulla privacy.
  2. Possono guidare gli sviluppatori nel migliorare il loro codice.
  3. Possono essere utilizzate in discussioni tra sviluppatori, esperti legali e leader aziendali.
  4. Possono servire come prova delle pratiche sulla privacy dell'app durante gli audit.

Fornendo queste didascalie, PriGen mira a offrire un modo migliore per gli sviluppatori di comunicare sulla privacy nelle loro app.

Come Funziona PriGen

PriGen tratta la generazione di didascalie sulla privacy come un problema di traduzione linguistica. La "fonte" in questo caso è la parte di codice che richiede permesso per accedere a informazioni sensibili. L'"obiettivo" è la didascalia sulla privacy che spiega quella parte del codice.

Il primo passo per PriGen è identificare le sezioni di codice che richiedono permesso. Lo fa utilizzando uno strumento chiamato PDroid. Questo strumento analizza il codice dell'app e trova parti che richiedono l'accesso ai dati sensibili. Una volta trovate queste sezioni, PriGen utilizza un modello addestrato per generare didascalie sulla privacy appropriate per ciascuna.

Costruire il Dataset

Per creare didascalie, è necessario un dataset di segmenti di codice. Per questo progetto, i ricercatori hanno scaricato 80.000 app Android e estratto 300.000 segmenti di codice pertinenti. Hanno identificato quali parti del codice accedono a informazioni sensibili e poi hanno generato didascalie sulla privacy.

Per trovare le sezioni di codice che richiedono permesso, i ricercatori si sono riferiti alla Documentazione per sviluppatori Android. Hanno creato un elenco di API di sistema e permessi rilevanti per l'accesso ai dati sensibili, assicurandosi che il progetto tenesse conto sia delle versioni attuali che di quelle più vecchie di Android.

Una volta stabilito l'elenco delle API, hanno utilizzato PDroid per analizzare il codice dell'app e estrarre i segmenti di codice che richiedono permesso.

Creare Didascalie sulla Privacy

Dopo aver identificato i segmenti di codice, il passo successivo è creare didascalie sulla privacy per ciascun segmento. Farlo manualmente per un dataset così grande è poco pratico, quindi è stato utilizzato un approccio semi-automatizzato.

Il sistema genera prima didascalie di codice dai segmenti che richiedono permesso usando un modello chiamato Code2Seq. Queste didascalie di codice descrivono cosa fa il codice, mentre le descrizioni delle API dicono quali tipi di dati sensibili vengono acceduti. Combinando queste due informazioni, PriGen mira a fornire una chiara comprensione di come il codice gestisce informazioni sensibili.

Una volta generate, le didascalie vengono esaminate per accuratezza e chiarezza, e regolate manualmente dove necessario.

Valutare i Risultati

L'efficacia delle didascalie generate da PriGen è stata misurata utilizzando alcuni indicatori di punteggio. I ricercatori hanno valutato le didascalie generate, cercando la loro accuratezza e leggibilità. Hanno scoperto che le didascalie funzionavano bene per i segmenti di codice con un numero ridotto di righe. Tuttavia, i segmenti di codice più lunghi producevano didascalie meno chiare, che ripetevano parole o erano vaghe.

Questo ha mostrato delle promesse, indicando che PriGen potrebbe generare didascalie utili per segmenti di codice più piccoli.

Sfide Attuali e Lavori Futuri

Anche se PriGen mostra potenziale, ci sono ancora sfide che devono essere affrontate:

  1. Le didascalie potrebbero non essere efficaci per segmenti di codice più lunghi. Piani per esplorare modelli diversi potrebbero aiutare a migliorare le prestazioni nella generazione di didascalie per questi casi.
  2. Il riutilizzo del codice è comune nelle app, e segmenti di codice simili potrebbero confondere il modello o portare a didascalie meno efficaci. I lavori futuri includeranno tecniche per identificare e rimuovere segmenti duplicati.
  3. Alcune sezioni di codice sono offuscate, il che significa che usano nomi generici invece di identificatori significativi. L'attuale modello ha difficoltà con questo tipo di codice. Le versioni future si concentreranno sull'operare solo con segmenti di codice chiari e non offuscati.

Conclusione

In sintesi, PriGen rappresenta un nuovo approccio per generare didascalie sulla privacy coerenti e comprensibili per le applicazioni Android. Analizzando i segmenti di codice che gestiscono informazioni sensibili, PriGen utilizza modelli avanzati per creare dichiarazioni chiare sulle pratiche di privacy. I risultati iniziali mostrano che PriGen può produrre didascalie accurate e leggibili, ma ci sono sfide da affrontare. Affrontando queste, il framework mira a fornire un modo affidabile per gli sviluppatori di comunicare efficacemente le loro pratiche sulla privacy.

Altro dagli autori

Articoli simili