Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Kryptographie und Sicherheit# Datenbanken

Datenprivatsphäre und Verkehrsanalysen in Einklang bringen

Städte bekommen wichtige Verkehrsdaten, während sie sich um Datenschutz kümmern.

― 6 min Lesedauer


Datenschutz bei derDatenschutz bei derErfassung vonVerkehrsdatensie Transportinformationen sammeln.Städte schützen Nutzerdaten, während
Inhaltsverzeichnis

Städte auf der ganzen Welt versuchen, ihre Kohlenstoffemissionen zu reduzieren. Um fundierte Entscheidungen zu treffen, brauchen sie genaue Daten darüber, wie sich Menschen mit verschiedenen Verkehrsmitteln bewegen. Google hat ein Tool namens Environmental Insights Explorer (EIE), das solche Daten sammelt und teilt. EIE sammelt Informationen darüber, wie Menschen in über 2.400 Städten reisen und gibt Einblicke in verkehrsbezogene Emissionen. Das hilft den lokalen Regierungen, Ziele zur Emissionsreduktion festzulegen und bessere Verkehrssysteme zu planen.

Allerdings wirft das Sammeln von Daten über menschliche Bewegungen Datenschutzbedenken auf. Die Leute möchten diese wertvollen Daten nutzen, wollen aber nicht, dass ihre persönlichen Informationen offengelegt werden. Um dem gerecht zu werden, verwendet Google Datenschutztechniken, die die Daten anonymisieren, während die Städte nützliche Einblicke gewinnen können.

Die Herausforderung des Datenschutzes

Wenn es darum geht, Daten über menschliche Mobilität zu teilen, ist es wichtig, Zugänglichkeit mit Datenschutz in Einklang zu bringen. Die Herausforderung besteht darin, sicherzustellen, dass keine persönlichen Informationen offengelegt werden, während die Daten trotzdem nützlich bleiben. Wenn beispielsweise Daten über den Verkehr geteilt werden, muss dies so erfolgen, dass die Privatsphäre der einzelnen Nutzer geschützt wird. Google zielt darauf ab, diese Herausforderung mit einer Methode namens Differential Privacy (DP) zu meistern, die Rauschen zu den Daten hinzufügt, um die Identifizierung einzelner Datensätze zu verhindern.

Differential Privacy funktioniert, indem der Zugang zu allgemeinen Mustern in den Daten gewährt wird, ohne spezifische Nutzerinformationen preiszugeben. So können selbst wenn einige Rohdaten verloren gehen, die allgemeinen Trends immer noch verstanden werden. Das Ziel ist, nützliche Aggregierte Daten bereitzustellen (z.B. gesamte zurückgelegte Strecke), ohne die Reisen einzelner Personen offen zu legen.

Wie die Daten funktionieren

EIE sammelt Daten von Leuten, die die Google Standortgeschichte auf ihren Smartphones aktiviert haben. Nutzer können Google erlauben, ihre Bewegungen zu verfolgen. Diese Daten beinhalten Informationen darüber, wie sie reisen, egal ob mit dem Auto, Fahrrad, zu Fuss oder mit öffentlichen Verkehrsmitteln. Jede Fahrt, die von der App aufgezeichnet wird, umfasst den Startort, das Ziel, die Transportart, die zurückgelegte Strecke und die benötigte Zeit.

Um die Privatsphäre zu schützen, werden die Daten lokal auf den Geräten der Nutzer verarbeitet, bevor sie an den Server gesendet werden. Der Server sieht nur aggregierte Daten, was die Anonymität weiter unterstützt. Dieser Prozess ermöglicht es, eine grosse Menge an Daten zu sammeln und gleichzeitig persönliche Informationen zu schützen.

Datenaggregation für nützliche Einblicke

Die Daten von EIE werden in nützliche Statistiken unterteilt, wie z.B. die Anzahl der Fahrten, die mit jeder Transportart in bestimmten Bereichen unternommen wurden. Das umfasst auch, wie weit die Leute gereist sind und wie viel Kohlendioxid (CO2) sie während dieser Fahrten erzeugt haben. Durch die Analyse dieser Daten können Städte verstehen, welche Transportmethoden am häufigsten genutzt werden und wie sie zu den Emissionen beitragen.

Jede Woche wird angestrebt, neue Statistiken basierend auf den in dieser speziellen Woche gesammelten Nutzerdaten zu erstellen. Für jede Kombination aus Region, Richtung und Transportart werden drei wichtige Kennzahlen bereitgestellt: die Anzahl der unternommenen Fahrten, die gesamte zurückgelegte Strecke und die Gesamtdauer der Fahrten. Diese Kennzahlen helfen Städten, ihren Fortschritt bei den Zielen zur Emissionsreduzierung zu verfolgen.

Verschiedene Ansätze im Vergleich

Es gibt unterschiedliche Methoden, um den Datenschutz zu gewährleisten und gleichzeitig die Informationen nützlich zu halten. Ein Ansatz ist, Statistiken separat für jede Transportart zu berechnen. Diese Methode erlaubt massgeschneiderte Datenschutzeinstellungen basierend auf der Anzahl der Fahrten und den Transportarten. Das bedeutet jedoch, dass das Datenschutzziel auf viele verschiedene Statistiken verteilt werden muss, was deren Effektivität verringern kann.

Ein weiterer Ansatz ist, eine einzige globale Statistik zu berechnen, die alle Details umfasst. Das bietet einen einfacheren Ansatz für den Datenschutz, könnte jedoch die Genauigkeit der Daten aufgrund des ungezielten hinzugefügten Rauschens verringern.

Google hat ein neues Verfahren entwickelt, das Activity + Metric Scaling heisst und die Vorteile beider Ansätze kombiniert. Dieses Verfahren passt die Daten basierend auf der Reisemethode und der Art der gemessenen Kennzahl an. Indem der Beitrag jedes Nutzers zu den Gesamtdaten skaliert wird, bevor Rauschen hinzugefügt wird, zielt diese Methode darauf ab, die Nützlichkeit der Statistiken zu erhalten und gleichzeitig den Datenschutz zu gewährleisten.

Der Evaluierungsprozess

Um sicherzustellen, dass ihre Methoden effektiv sind, hat Google drei verschiedene Techniken zur Messung des Datenschutzes bewertet, indem sie einen Datensatz mit Informationen von Millionen von Nutzern verwendet haben. Das Ziel war es herauszufinden, welche Methode das beste Gleichgewicht zwischen Datenschutz und Genauigkeit der geteilten Daten bietet.

Durch Anpassung ihres Datenschutzbudgets – der Menge an Informationen, die geteilt werden können, ohne die Privatsphäre der Nutzer zu verlieren – testete Google, wie gut jede Methode funktionierte. Sie betrachteten speziell den gewichteten relativen Fehler, der zeigt, wie genau die statistischen Schätzungen im Vergleich zu den tatsächlichen Werten sind.

Die Ergebnisse zeigten, dass die Methode Activity + Metric Scaling andere Basistechniken übertraf, indem sie eine gleichmässigere Genauigkeit über verschiedene Kennzahlen hinweg aufrechterhielt.

Gelerntes und zukünftige Richtungen

Diese Forschung hat gezeigt, dass es möglich ist, sinnvolle Statistiken zur Mobilität zu berechnen, während die Privatsphäre der Nutzer respektiert wird. Der neue Mechanismus stellt sicher, dass die Daten anonymisiert sind und für Stadtplaner und Entscheidungsträger nützlich bleiben.

Die Erkenntnisse deuten darauf hin, dass dieses Verfahren auch in anderen Bereichen über Verkehrsdaten hinaus eingesetzt werden könnte. Der Prozess muss verfeinert werden, um einige Aspekte der Datenverarbeitung zu automatisieren und zu gewährleisten, dass die Privatsphäre der Nutzer geschützt bleibt, ohne dass umfangreiche öffentliche Daten für Anpassungen benötigt werden.

Zukünftige Arbeiten könnten darin bestehen, Mechanismen zu schaffen, die sich an die Art der verarbeiteten Daten anpassen. Indem die Bedeutung bestimmter Anfragen erkannt wird, könnte es möglich sein, die Effektivität des Systems weiter zu verbessern und die gesammelten Daten besser zu nutzen.

Fazit

Daten aus verschiedenen Regionen können effektiv genutzt werden, um eine nachhaltige Stadtplanung zu unterstützen und gleichzeitig die Privatsphäre der Einzelnen zu wahren. Googles Environmental Insights Explorer ist ein wichtiger Schritt nach vorne, um Städten die Werkzeuge zu bieten, die sie benötigen, um informierte Entscheidungen basierend auf Mobilitätstrends zu treffen. Die entwickelten Ansätze haben das Potenzial, wichtige Einblicke zu bieten, ohne die persönliche Privatsphäre zu gefährden.

Durch die Kombination fortschrittlicher Datenschutzmethoden mit praktischer Datensammlung zielt Google darauf ab, Städte in ihren Bemühungen zu unterstützen, Emissionen zu reduzieren, die Verkehrsinfrastruktur zu verbessern und auf eine nachhaltigere Zukunft hinzuarbeiten. Mit der Weiterentwicklung der Methoden besteht die Hoffnung, dass mehr Städte auf wertvolle Daten zugreifen können, während die Privatsphäre ihrer Bewohner respektiert wird.

Originalquelle

Titel: Releasing Large-Scale Human Mobility Histograms with Differential Privacy

Zusammenfassung: Environmental Insights Explorer (EIE) is a Google product that reports aggregate statistics about human mobility, including various methods of transit used by people across roughly 50,000 regions globally. These statistics are used to estimate carbon emissions and provided to policymakers to inform their decisions on transportation policy and infrastructure. Due to the inherent sensitivity of this type of user data, it is crucial that the statistics derived and released from it are computed with appropriate privacy protections. In this work, we use a combination of federated analytics and differential privacy to release these required statistics, while operating under strict error constraints to ensure utility for downstream stakeholders. In this work, we propose a new mechanism that achieves $ \epsilon \approx 2 $-DP while satisfying these strict utility constraints, greatly improving over natural baselines. We believe this mechanism may be of more general interest for the broad class of group-by-sum workloads.

Autoren: Christopher Bian, Albert Cheu, Yannis Guzman, Marco Gruteser, Peter Kairouz, Ryan McKenna, Edo Roth

Letzte Aktualisierung: 2024-07-03 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2407.03496

Quell-PDF: https://arxiv.org/pdf/2407.03496

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel