Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Software-Entwicklung

Verbesserung der Datenschutzinfos für Mobile Apps

Ein neues Framework hilft Entwicklern, klare Datenschutzerklärungen für Apps zu erstellen.

― 6 min Lesedauer


DatenschutzerklärungenDatenschutzerklärungenganz einfachDatenschutzinfos für Entwickler.Neues Framework vereinfacht die
Inhaltsverzeichnis

Mobile-Apps sammeln persönliche Informationen von Nutzern, und sie müssen die Nutzer darüber informieren, was sie mit diesen Daten machen. Diese Informationen werden über Datenschutzhinweise bereitgestellt. Diese Hinweise zu schreiben, kann für Entwickler schwierig sein, und oft sind sie inkonsistent oder unklar. Manche bestehenden Methoden nutzen Fragebögen oder Vorlagen, um beim Schreiben dieser Hinweise zu helfen, aber diese Ansätze haben ihre eigenen Probleme.

Der Bedarf an besseren Datenschutzhinweisen

Datenschutzhinweise müssen klar und genau sein. Wenn Apps sensible Informationen wie Standort oder Kontakte sammeln, rät die Federal Trade Commission den Unternehmen, den Nutzern mitzuteilen, welche Daten sie sammeln und warum. Es gibt drei Hauptwege, wie mobile Apps diese Informationen weitergeben:

  1. Datenschutzerklärungen
  2. App-Beschreibungen
  3. Genehmigungsgründe

Obwohl diese Methoden verwendet werden, können sie Hinweise produzieren, die vage oder unvollständig sind. Oft ändern sie sich nicht, wenn sich der Code der App ändert, was zu mehr Verwirrung führt.

Jüngste Studien haben sich darauf konzentriert, zu überprüfen, ob das Verhalten einer App mit ihren Datenschutzangaben übereinstimmt. Einige Forschungen zielen darauf ab, bessere Datenschutzerklärungen zu erstellen, indem Fragen gestellt oder analysiert wird, wie die App funktioniert. Obwohl diese Methoden vielversprechend sind, garantieren sie nicht immer, dass die Datenschutzhinweise genau oder detailliert sind.

Einführung von PriGen

Um die Datenschutzhinweise zu verbessern, wurde ein neues Framework namens PriGen entwickelt. PriGen hilft Entwicklern, Datenschutzerklärungen zu erstellen, die mit dem Code ihrer App übereinstimmen, selbst wenn Änderungen vorgenommen werden. Das geschieht mit Hilfe eines Deep-Learning-Modells, das den Code der App analysiert und prägnante Datenschutzerklärungen generiert, die als Datenschutzcaptions bezeichnet werden.

Datenschutzcaptions sind kurze Sätze, die erklären, welche persönlichen Daten die App sammelt und wie diese Daten verwendet werden. Diese Captions können verschiedene Zwecke erfüllen:

  1. Sie können in unterschiedlichen Formaten von Datenschutzhinweisen enthalten sein.
  2. Sie können Entwicklern helfen, ihren Code zu verbessern.
  3. Sie können in Diskussionen zwischen Entwicklern, Rechtsexperten und Geschäftsführern verwendet werden.
  4. Sie können als Nachweis für die Datenschutzpraktiken der App während Audits dienen.

Durch die Bereitstellung dieser Captions möchte PriGen einen besseren Weg bieten, wie Entwickler über Datenschutz in ihren Apps kommunizieren können.

Wie PriGen funktioniert

PriGen behandelt die Erstellung von Datenschutzcaptions als ein Übersetzungsproblem. Die „Quelle“ sind in diesem Fall die Teile des Codes, die eine Genehmigung zum Zugriff auf sensible Informationen erfordern. Das „Ziel“ ist die Datenschutzcaption, die diesen Teil des Codes erklärt.

Der erste Schritt für PriGen ist die Identifizierung der Abschnitte des Codes, die eine Genehmigung erfordern. Das geschieht mit einem Werkzeug namens PDroid. Dieses Werkzeug analysiert den Code der App und findet Teile, die den Zugriff auf sensible Daten anfordern. Sobald diese Abschnitte gefunden sind, verwendet PriGen ein trainiertes Modell, um geeignete Datenschutzcaptions für jeden zu generieren.

Erstellung des Datensatzes

Um Captions zu erstellen, ist ein Datensatz von Code-Segmenten erforderlich. Für dieses Projekt haben Forscher 80.000 Android-Apps heruntergeladen und 300.000 relevante Code-Segmente extrahiert. Sie haben identifiziert, welche Teile des Codes auf sensible Informationen zugreifen und dann Datenschutzcaptions erstellt.

Um die Abschnitte des Codes zu finden, die eine Genehmigung benötigen, haben sich die Forscher auf die Android-Entwicklerdokumentation bezogen. Sie haben eine Liste von systemeigenen APIs und Berechtigungen erstellt, die für den Zugriff auf sensible Daten relevant sind, und sichergestellt, dass das Projekt sowohl aktuelle als auch ältere Versionen von Android berücksichtigt.

Sobald sie die Liste der APIs erstellt hatten, verwendeten sie PDroid, um den App-Code zu analysieren und die notwendigen Genehmigungsanforderungen zu extrahieren.

Erstellung von Datenschutzcaptions

Nachdem die Code-Segmente identifiziert wurden, besteht der nächste Schritt darin, für jedes Segment Datenschutzcaptions zu erstellen. Das manuell für einen so grossen Datensatz zu tun, ist unpraktisch, daher wurde ein halbautomatisierter Ansatz verwendet.

Das System generiert zuerst Codecaptions aus den genehmigungsbedürftigen Segmenten mit einem Modell namens Code2Seq. Diese Codecaptions beschreiben, was der Code macht, während die API-Beschreibungen angeben, auf welche Art von sensiblen Daten zugegriffen wird. Durch die Kombination dieser beiden Informationen zielt PriGen darauf ab, ein klares Verständnis dafür zu bieten, wie der Code mit sensiblen Informationen umgeht.

Sobald die Captions generiert sind, werden sie auf Genauigkeit und Klarheit überprüft und bei Bedarf manuell angepasst.

Bewertung der Ergebnisse

Die Wirksamkeit der von PriGen generierten Captions wurde mithilfe bestimmter Bewertungskriterien gemessen. Die Forscher bewerteten die generierten Captions und prüften ihre Genauigkeit und Lesbarkeit. Sie stellten fest, dass die Captions bei Code-Segmenten mit einer kleinen Anzahl von Zeilen gut funktionierten. Bei längeren Code-Segmenten waren die Captions jedoch weniger klar und wiederholten Wörter oder waren vage.

Das zeigte vielversprechende Ansätze, was darauf hindeutet, dass PriGen nützliche Captions für kleinere Code-Segmente erzeugen könnte.

Aktuelle Herausforderungen und zukünftige Arbeiten

Obwohl PriGen Potenzial zeigt, gibt es noch Herausforderungen zu bewältigen:

  1. Die Captions sind möglicherweise nicht so effektiv für längere Code-Segmente. Pläne, verschiedene Modelle zu erforschen, könnten dazu beitragen, die Leistung bei der Generierung von Captions für diese Fälle zu verbessern.
  2. Code-Wiederverwendung ist in Apps häufig, und ähnliche Code-Segmente könnten das Modell verwirren oder zu weniger effektiven Captions führen. Zukünftige Arbeiten werden Techniken zur Identifizierung und Entfernung von Duplikaten einschliessen.
  3. Einige Codeabschnitte sind obfuskiert, was bedeutet, dass sie generische Namen anstelle von aussagekräftigen Bezeichnern verwenden. Das aktuelle Modell hat Schwierigkeiten mit diesen Arten von Code. Zukünftige Versionen werden sich darauf konzentrieren, nur mit klaren, unverschleierten Code-Segmenten zu arbeiten.

Fazit

Zusammenfassend lässt sich sagen, dass PriGen einen neuen Ansatz zur Erstellung konsistenter und verständlicher Datenschutzcaptions für Android-Anwendungen darstellt. Durch die Analyse von Code-Segmenten, die mit sensiblen Informationen umgehen, verwendet PriGen fortschrittliche Modelle, um klare Aussagen über Datenschutzpraktiken zu erstellen. Die ersten Ergebnisse zeigen, dass PriGen genaue und lesbare Captions erzeugen kann, aber es gibt Herausforderungen, die noch bewältigt werden müssen. Durch die Lösung dieser Herausforderungen zielt das Framework darauf ab, Entwicklern einen zuverlässigen Weg zu bieten, um ihre Datenschutzpraktiken effektiv zu kommunizieren.

Mehr von den Autoren

Ähnliche Artikel