Analyse der Auswirkungen von Mobile Apps auf Reisedaten
Studie zeigt, wie mobile Apps das Reiseverhalten beeinflussen.
― 7 min Lesedauer
Inhaltsverzeichnis
- Die Bedeutung des Verständnisses von Datenbias
- Methodologie
- Datensammlung und Vorbereitung
- Auswahl der Stichprobe
- Merkmale des täglichen Reiseverhaltens
- Massnahmen zur täglichen Reiseaktivität
- Gruppierung täglicher Reisemuster
- Verhaltensbias von mobilen Anwendungen
- Einfluss auf die Reisennetzwerkkonnektivität
- Erkenntnisse und Schlussfolgerungen
- Originalquelle
Handys können uns viel darüber erzählen, wie Leute sich bewegen. Die Daten von diesen Geräten werden immer mehr genutzt, um verschiedene Dinge anzuschauen. Zum Beispiel können wir messen, wie belebt ein Gebiet ist, vorhersagen, wie sich Krankheiten ausbreiten, schätzen, wie viele Leute reisen werden, sehen, wie Menschen auf Naturkatastrophen reagieren, und studieren, wie Menschen sozial interagieren. Es gibt verschiedene Arten von Daten, die wir nutzen können. Eine Art kommt von Anrufdetailaufzeichnungen, die zeigen, wie Telefone sich mit Mobilfunkmasten verbinden. Eine andere Art kommt von GPS-Daten, die mit GPS-Tools in Smartphones gesammelt werden. Eine spezielle Art von GPS-Daten nennt sich In-App-Mobilitätsdaten. Diese Art von Daten wird aus verschiedenen mobilen Apps gesammelt, die ein Werkzeug namens Software Development Kit (SDK) verwenden, das in die Apps auf einem Handy eingebaut ist.
Während der COVID-19-Pandemie ist die Nutzung von In-App-Mobilitätsdaten schnell gewachsen. Das lag an einem Anstieg von öffentlich verfügbaren Mobilitätsdaten grosser Unternehmen und dem dringenden Bedarf, Echtzeit-Aktivitätsmuster während der Lockdowns zu sehen. Um die Privatsphäre der Einzelnen zu schützen, werden detaillierte Mobilitätsdaten vieler Apps oft kombiniert, um Trends für grössere Gruppen von Menschen zu zeigen. Dazu kann gehören, wie aktiv Menschen an bestimmten Orten sind oder wie viel Reiseverkehr zwischen bestimmten Orten stattfindet.
Die Bedeutung des Verständnisses von Datenbias
Während das Kombinieren von Daten von Individuen hilft, die Privatsphäre zu schützen, kann es auch wichtige Unterschiede im Reiseverhalten verbergen. Das führt zu Unsicherheiten darüber, was die Daten wirklich über kollektive Bewegungen aussagen. Eine grosse Frage ist, wie gut die ausgewählten Verhaltensweisen die tatsächlichen Reiseaktivitäten von Individuen repräsentieren. Einige Apps könnten nur Daten während bestimmter Aktivitäten sammeln, wie zum Beispiel beim Navigieren während des morgendlichen Pendelns, während andere möglicherweise nur in der Freizeit genutzt werden.
Die genauen Apps, die in weit verbreiteten Datensätzen enthalten sind, werden in der Regel nicht öffentlich geteilt. Einige Informationen sind jedoch darüber erhältlich, welche mobilen Apps mit grossen Datenanbietern verbunden sind. Zum Beispiel zeigen Studien, dass Navigations-, Wetter- und Sport-Apps Standortdaten mit einem in Grossbritannien ansässigen Datenaggregator namens Huq teilen. Diese speziellen Arten von Apps könnten beeinflussen, wie gut wir verschiedene Reiseverhalten wahrnehmen können. Andere Datenanbieter haben möglicherweise ähnliche Verhaltensweisen, die mit ihren mobilen Anwendungen verknüpft sind.
Da die meisten Apps in diesen Datensätzen privat oder verändert sind, um die Benutzeridentität zu schützen, wissen wir wenig darüber, wie Bias in der Datensammlung das, was wir in den gesamten Mobilitätsdatensätzen sehen, beeinflussen könnte. Verschiedene Apps können unterschiedliche Arten von Verhaltensweisen sammeln, was zu verzerrten Ergebnissen in den Gesamtdaten führen kann. Es besteht ein grosser Bedarf an Methoden, um diese Verzerrungen aufzudecken, ohne die Privatsphäre der Einzelnen zu gefährden oder sensible kommerzielle Informationen preiszugeben.
Methodologie
Diese Studie versucht, tiefer in die kombinierten Reisedaten von mobilen Apps einzutauchen, um zu sehen, ob bestimmte Apps zu einer voreingenommenen Erkennung spezifischer Verhaltensweisen im Reisen führen. Wir haben einen Datensatz verwendet, der 2019 aus 45 mobilen Anwendungen gesammelt wurde. Dieser Datensatz enthält ein anonymisiertes Label für jede App, die die Bewegungsdaten erfasst hat. Wir haben die individuellen Bewegungshistorien in einer sicheren Umgebung analysiert, mit Kontrollen, um zu vermeiden, dass persönliche Informationen preisgegeben werden.
Datensammlung und Vorbereitung
Wir haben mit GPS-Daten begonnen, die zwischen dem 1. Januar 2018 und dem 31. Dezember 2019 gesammelt wurden. Diese Daten kamen von einem Standortdatenaggregator namens Huq Industries im Vereinigten Königreich. Bevor die Daten geteilt wurden, wurden einzigartige Identifikatoren für Geräte und Apps anonymisiert. GPS-Beobachtungen könnten von hochpräzisen GPS-Sensoren oder von weniger genauen Systemen stammen, was zu unterschiedlichen Datenqualitätsniveaus führte. Um sicherzustellen, dass wir nur hochwertige Standortdaten verwendeten, haben wir nur Beobachtungen mit einer Genauigkeit von 100 Metern oder besser behalten.
Wir haben dann die Rohdaten in ein Tagebuch von "Stopppunkten" umgewandelt. Diese Stopppunkte identifizieren, wo ein Gerät für eine Mindestzeit an einem Ort verweilte. Durch das Gruppieren benachbarter Stopppunkte konnten wir wiederholte Besuche am gleichen Ort identifizieren. Für unsere Analyse haben wir einen Stopppunkt basierend auf einem Abstandsradius von 200 Metern und einer Dauer von mindestens 5 Minuten definiert.
Auswahl der Stichprobe
Da verschiedene Nutzer über unterschiedliche Zeiträume Teil des Datensatzes waren, mussten wir unseren Ansatz anpassen. Wir haben unsere Analyse um Reisetage statt um einzelne Geräte herum gestaltet. Zudem haben wir Tage mit schlechter Standortdatenqualität gefiltert und nur Tage mit mindestens 300 Minuten aufgezeichneter Aktivität einbezogen.
Reiseverhaltens
Merkmale des täglichenUm zwischen verschiedenen Arten von täglichem Reiseverhalten zu unterscheiden, haben wir verschiedene Merkmale basierend auf den Reisetagebüchern aus individuellen mobilen Gerätedaten berechnet. Diese Merkmale beinhalteten die gesamte Reisestrecke, wie oft bestimmte Orte besucht wurden, und die Vorhersagbarkeit der Reisemuster. Für jeden Nutzer haben wir ihre Heimatbasis als den am häufigsten über Nacht besuchten Ort identifiziert.
Massnahmen zur täglichen Reiseaktivität
Wir haben Metriken berechnet, die uns geholfen haben, tägliche Reisemuster zu verstehen. Die insgesamt zurückgelegte Distanz konnte leicht zwischen verschiedenen Nutzern verglichen werden. Andere Masse wie die Besuchshäufigkeit hingen jedoch von der Beobachtungsdauer des Geräts ab. Um diese zu standardisieren, haben wir die Häufigkeits- und Entropiemessungen nach der gesamten Beobachtungszeit angepasst.
Gruppierung täglicher Reisemuster
Dann haben wir eine Clustering-Technik namens k-means verwendet, um die identifizierten Reisemuster zu gruppieren. Dieser Ansatz erlaubt es uns, verschiedene Kategorien basierend auf Ähnlichkeiten im Reiseverhalten zu erstellen, wie regelmässige tägliche Pendelstrecken, Zuhause bleiben, Langstreckenreisen oder Abwesenheit von zu Hause.
Verhaltensbias von mobilen Anwendungen
Um zu sehen, wie spezifische mobile Apps einen Bias in den erfassten Verhaltensweisen einführen könnten, haben wir Apps basierend auf den verschiedenen Reisemustern gruppiert, die sie erfasst haben. Die Gruppierung zeigte signifikante Unterschiede in den Arten von Verhaltensweisen, die von den verschiedenen mobilen Apps erfasst wurden. Einige App-Gruppen sammelten Daten, die hauptsächlich Verhaltensweisen fürs Zuhause zeigen, während andere mehr Langstreckenreisetätigkeiten erfassten.
Die Analyse zeigte einen ungleichen Beitrag verschiedener mobiler Anwendungen zum Datensatz. Einige App-Gruppen trugen einen Grossteil der Reisetage bei. Diese ungleiche Darstellung erhöht das Risiko von Verzerrungen in den gesammelten Daten, insbesondere von Apps, die bestimmte Arten von Verhaltensweisen effektiver erfassen als andere.
Einfluss auf die Reisennetzwerkkonnektivität
Als Nächstes haben wir untersucht, wie diese definierten Reiseverhalten das gesamte Reisennetz beeinflussten. Durch das Verbinden von Bewegungen in einem strukturierten Raster konnten wir beobachten, wie jede Verhaltenskategorie das Gesamtnetzwerk beeinflusste. Zum Beispiel haben wir festgestellt, dass regelmässige Reisen einen grossen Teil der einzigartigen Verbindungen im aggregierten Netzwerk ausmachten, während Langstreckenreisen, obwohl sie weniger häufig waren, einen signifikanten Teil der einzigartigen Verbindungen ausmachten.
Als wir spezifische Reisemodi aus dem Netzwerk entfernten, sahen wir verschiedene Effekte auf die Netzwerkverbindung. Die häufigste Reisemethode zeigte einen bemerkenswerten Rückgang in gut vernetzten Bereichen, als sie entfernt wurde, während die Netzwerkstruktur allgemein intakt blieb, wenn andere Arten von Verhaltensweisen verloren gingen.
Erkenntnisse und Schlussfolgerungen
Diese Analyse hebt hervor, dass mobile Anwendungen die Arten von Reiseverhalten beeinflussen können, die in grossen Datensätzen erscheinen. Einige Verhaltensweisen, insbesondere Langstreckenreisen, können die gesamte Darstellung der Mobilität in den Daten erheblich prägen, obwohl sie seltener vorkommen. Das Verständnis dieser Verzerrungen ist entscheidend für die Sicherstellung, dass die aus Mobilitätsdaten gezogenen Schlussfolgerungen robust sind.
Die in dieser Studie skizzierten Methoden können Forschern und Datenanbietern helfen, Verhaltensverzerrungen zu erkennen und zu verstehen, während sie die individuelle Privatsphäre schützen. Durch ein besseres Bewusstsein dafür, wie verschiedene Apps den Datenbeschaffungsprozess beeinflussen, können zukünftige Nutzungen von In-App-Mobilitätsdaten verfeinert werden, um klarere und genauere Einblicke in menschliche Bewegungsmuster zu erhalten.
Zusammenfassend unterstreichen die durch diese Analyse aufgeworfenen Fragen die Bedeutung der Erkennung und Behandlung von Verhaltensverzerrungen in der Mobilitätsdatensammlung. Sie betont, wie verschiedene mobile Anwendungen unser Verständnis von Reiseverhalten formen können, und lädt zu weiteren Untersuchungen ein, um effektive Strategien zur Verbesserung der Datenqualität zu entwickeln, während die individuelle Privatsphäre geschützt bleibt.
Titel: Detecting behavioural bias in GPS location data collected by mobile applications
Zusammenfassung: A commonly-used form of human mobility data, called in-app mobility data, is based on GPS locations collected from a panel of mobile applications. In this paper, we analysed daily travel patterns from in-app GPS data in the United Kingdom to identify characteristic modes of travel behaviour, and assessed whether certain behavioural modes were more common among users of different groups of mobile applications. We also explored the relative importance of different mobility behaviours for the topology of an aggregated travel network. Our findings point to the presence of behavioural bias in in-app mobility data driven by the interaction between mobile device users and specific mobile applications. Our study also presents a general methodology for detecting behavioural bias in in-app mobility data, allowing for greater transparency into the characteristics of in-app mobility datasets without risking individual privacy or identifying specific mobile applications underlying a given dataset. Overall, the analysis highlights the need to understand the process of data generation for in-app mobility data, and the way that this process can bias the collective dynamics reported in aggregate mobility data.
Autoren: Hamish Gibbs, R. M. Eggo, J. Cheshire
Letzte Aktualisierung: 2024-04-29 00:00:00
Sprache: English
Quell-URL: https://www.medrxiv.org/content/10.1101/2023.11.06.23298140
Quell-PDF: https://www.medrxiv.org/content/10.1101/2023.11.06.23298140.full.pdf
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an medrxiv für die Nutzung seiner Open-Access-Interoperabilität.