Simple Science

最先端の科学をわかりやすく解説

# 健康科学# 疫学

モバイルアプリが旅行データに与える影響を分析する

研究でモバイルアプリが旅行行動にどう影響するかがわかったよ。

― 1 分で読む


モバイルアプリと旅行データモバイルアプリと旅行データのバイアスアプリが旅行行動にどう影響するかを調査中
目次

携帯電話は人々の移動パターンについて多くのことを教えてくれるんだ。これらのデバイスからのデータは、いろんなことを調べるためにどんどん使われてる。例えば、地域の混雑具合を測ったり、病気の広がりを予測したり、旅行者数を推定したり、自然災害に対する人々の反応を見たり、社会的な相互作用を研究したりできる。使えるデータにはいくつかの種類があって、一つは通話詳細記録(CDR)からのもので、電話が携帯基地局に接続する様子を示してる。もう一つはGPSデータで、これはスマートフォンのGPSツールを使って収集されるんだ。特に「アプリ内移動データ」と呼ばれるGPSデータがあって、これは電話のアプリに組み込まれているソフトウェア開発キット(SDK)を使って様々なモバイルアプリから集められる。

COVID-19のパンデミック中に、アプリ内移動データの使用が急激に増えたんだ。これは、大手企業からの公開されている移動データの増加と、ロックダウン中にリアルタイムの活動パターンを把握する必要性が高まったから。個人のプライバシーを守るために、多くのアプリからの詳細な移動データはしばしば結合されて、より大きなグループの人々の傾向を示すようになってる。これには、特定の場所での人々の活動度や、特定の場所間の旅行の頻度が含まれるかもしれない。

データバイアスを理解することの重要性

個人からのデータを結合することでプライバシーが守られる一方で、移動行動の重要な違いが隠れてしまうこともある。これにより、集団の動きについてのデータが実際に何を示しているのか不確実になる。大きな疑問は、サンプルされた行動が実際の個人の旅行活動をどれくらい代表しているのかということ。あるアプリは、朝の通勤中のナビゲートしているときだけデータを集めるかもしれないし、他のアプリはレジャーの時間にしか使われないかもしれない。

広く使われるデータセットに含まれる正確なアプリは一般には公開されていないけど、大手データプロバイダーに関連するモバイルアプリについての情報はある。例えば、ナビゲーション、天気、スポーツアプリが、イギリスのデータ集約業者であるHuqと位置データを共有しているって研究がある。こういったタイプのアプリは、異なる旅行行動をどれだけ見えるようにするかに影響を与えるかもしれない。他のデータプロバイダーも、自社のモバイルアプリに似た行動がリンクされているかもしれない。

これらのデータセットのほとんどのアプリはプライベートだったり、ユーザーのアイデンティティを守るために変更されているから、データ収集におけるバイアスが全体の移動データセットにどんな影響を与えるのかはほとんどわからない。異なるアプリが異なる種類の行動を収集することがあるから、全体のデータに歪みが生じることもある。個々のプライバシーを損なわず、商業上の敏感な情報を明らかにすることなく、これらのバイアスを見つける方法が強く求められている。

方法論

この研究は、モバイルアプリからの結合された旅行データをより深く調べて、特定のアプリが旅行行動の特定のバイアスを引き起こすかどうかを確認しようとしている。2019年に収集された45のモバイルアプリからのデータセットを使用した。このデータセットには、移動データを記録した各アプリの匿名化されたラベルが含まれている。個々の移動履歴を安全な環境で分析して、個人情報が明らかになるのを避けるためにチェックを入れた。

データ収集と準備

2018年1月1日から2019年12月31日までに収集されたGPSデータから始めた。このデータは、イギリスのHuq Industriesという位置データ集約業者からのもの。データを共有する前に、デバイスとアプリのユニークな識別子が匿名化された。GPS観測は、高精度のGPSセンサーから来ることもあれば、低精度のシステムから来ることもあり、データ品質にばらつきが生じた。高品質の位置データだけを使用するために、精度が100メートル以上の観測だけを残した。

その後、生のGPSデータを「停留ポイント」の日記に変換した。この停留ポイントは、デバイスが一定時間同じ場所に留まっていた場所を特定する。隣接する停留ポイントをグループ化することで、同じ場所への再訪を特定できた。分析のために、200メートルの距離半径と少なくとも5分間の時間を基に停留ポイントを定義した。

サンプルの選定

異なるユーザーがデータセットに参加していた期間が様々だったので、これに対応するためにアプローチを調整する必要があった。デバイスごとではなく、旅行の日を基に分析をフレームした。また、質の悪い位置データの日をフィルタリングし、記録された活動が300分以上ある日だけを含めた。

日常の旅行行動の特徴

さまざまな日常の旅行モードを区別するために、個々のモバイルデバイスデータから作成された旅行日記に基づいていくつかの特徴を計算した。これらの特徴には、総旅行距離、特定の場所が訪問された頻度、旅行ルーティンの予測可能性が含まれている。各ユーザーに対して、最も頻繁に訪れた場所を「ホームベース」として特定した。

日常の旅行活動の測定

日常の旅行パターンを理解するのに役立つ指標を計算した。総旅行距離は異なるユーザー間で簡単に比較できた。しかし、訪問頻度のような他の測定値は、デバイスがどれだけ観察されたかに関連していた。これらを標準化するために、頻度とエントロピーの測定値を総観察時間で調整した。

日常旅行パターンのグルーピング

次に、k-meansというクラスタリング技術を使って、特定された旅行パターンをグループ化した。このアプローチにより、通勤する日常的な移動、家にいる、長距離旅行、家から離れているなど、旅行行動の類似性に基づいて独特なカテゴリーを作成できる。

モバイルアプリからの行動バイアス

特定のモバイルアプリが記録された行動にどのようなバイアスを引き起こすかを確認するために、検出されたさまざまな旅行パターンに基づいてアプリをグループ化した。このグルーピングにより、異なるモバイルアプリがキャッチする行動の種類において大きな違いが明らかになった。あるアプリグループは主に「ステイホーム」行動を示すデータを収集する一方で、他のグループはより多くの長距離旅行活動を記録していた。

分析の結果、異なるモバイルアプリがデータセットへの貢献が不均等であることがわかった。特定のアプリグループは旅行日数の大多数を占めていた。この不均一な代表性は、特定の種類の行動をより効果的にキャッチするアプリから収集されたデータにおいて、バイアスのリスクを増加させる。

旅行ネットワークの接続性への影響

次に、これらの定義された旅行行動が全体の旅行ネットワークにどのように影響するかを調べた。動きを構造化されたグリッドに接続することで、各行動カテゴリーが全体のネットワークにどのように影響を与えるかを観察できた。例えば、定期的な旅行が集約ネットワーク内のユニークな接続の大部分を占める一方で、長距離旅行は頻度は少ないけれどもユニークな接続の重要な部分を占めていることが分かった。

特定の旅行モードをネットワークから除外したとき、接続性にさまざまな影響が見られた。一般的な旅行モードを削除すると、接続の良いエリアでの顕著な減少が見られたが、他のタイプの行動が失われてもネットワークの構造は一般的に保たれていた。

インサイトと結論

この分析は、モバイルアプリが大規模データセットに現れる旅行行動の種類に影響を与えることができることを示している。一部の行動、特に長距離旅行は、発生頻度が低いにもかかわらず、データにおける移動の全体的な表現を大きく形作る可能性がある。これらのバイアスを理解することは、移動データから導き出される結論が堅牢であることを保証するために重要なんだ。

この研究で示された方法は、研究者やデータプロバイダーが、個人のプライバシーを守りながら行動バイアスを理解し、対処するのに役立つ。異なるアプリがデータ収集プロセスにどのように影響を与えるかをより良く理解することで、今後のアプリ内移動データの使用が洗練されて、人間の移動パターンに関する明確で正確なインサイトを得ることができる。

結局、この分析が提起した問題は、移動データ収集における行動バイアスを認識し、対処することの重要性を示している。異なるモバイルアプリが旅行行動に対する理解をどのように形作るかを強調し、データ品質を向上させつつ個人のプライバシーを守る効果的な戦略の開発についてさらなる調査を促している。

オリジナルソース

タイトル: Detecting behavioural bias in GPS location data collected by mobile applications

概要: A commonly-used form of human mobility data, called in-app mobility data, is based on GPS locations collected from a panel of mobile applications. In this paper, we analysed daily travel patterns from in-app GPS data in the United Kingdom to identify characteristic modes of travel behaviour, and assessed whether certain behavioural modes were more common among users of different groups of mobile applications. We also explored the relative importance of different mobility behaviours for the topology of an aggregated travel network. Our findings point to the presence of behavioural bias in in-app mobility data driven by the interaction between mobile device users and specific mobile applications. Our study also presents a general methodology for detecting behavioural bias in in-app mobility data, allowing for greater transparency into the characteristics of in-app mobility datasets without risking individual privacy or identifying specific mobile applications underlying a given dataset. Overall, the analysis highlights the need to understand the process of data generation for in-app mobility data, and the way that this process can bias the collective dynamics reported in aggregate mobility data.

著者: Hamish Gibbs, R. M. Eggo, J. Cheshire

最終更新: 2024-04-29 00:00:00

言語: English

ソースURL: https://www.medrxiv.org/content/10.1101/2023.11.06.23298140

ソースPDF: https://www.medrxiv.org/content/10.1101/2023.11.06.23298140.full.pdf

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。

著者たちからもっと読む

類似の記事