ホームレス問題を追跡する上でのTwitterの役割を調査する
この研究は、Twitterデータを分析してホームレスのトレンドを測定し理解することを目的にしてるよ。
― 1 分で読む
目次
アメリカでは、裕福な国なのに毎年約60万人がホームレスの問題に直面してる。これって、健康と深く関係してるんだ。安定した住居がないと、医療や衛生サービスにアクセスするのが難しいから、ストレスが増えて、深刻な健康問題につながることも。ホームレスの人たちは若くして亡くなる可能性が高いし、家のない人の平均寿命はたった48歳。
過去5年間、ホームレスの数は減少してた時期があったけど、また増え始めてる。こうした増加に対処するためには、ホームレスの人たちを助けるための効果的で持続可能な方法を見つけることが重要だ。ホームレスの人たちの数を正確に把握して、リソースが適切に配分されることが必要なんだ。
ホームレスを追跡するために、住宅と都市開発省みたいな機関がさまざまな方法を試みてきたんだけど、例えば「Point in Time(PiT)」カウントっていう年に一度の調査がある。ボランティアが地元のオフィスを手伝って、特定の期間内のホームレスのデータを集めるんだ。この方法は統計を明確にすることを目的にしてるけど、一貫性がないって批判も受けていて、それがトレンドを効果的に分析するのを難しくしてる。
これらの欠点から、多くの人がより良い方法を求めてる。解決策の一つは、特にTwitterのデータを使って、時間の経過とともに変化を追跡すること。Twitterはホームレスについてのリアルタイムの議論を反映して、貴重な洞察を提供するかもしれない。
ソーシャルメディアとホームレスに関する研究
最近の研究では、ソーシャルメディアとホームレスの関係を調べてるんだ。ある研究では、「homeless」や「homelessshelter」みたいなハッシュタグを使ったTumblrの投稿を分析した。これらの投稿で使われている言葉を調べた結果、ホームレスの人たちはよりネガティブな感情や個人的な経験を表現していた一方、非ホームレスのユーザーは助けることについて一般的な考えをシェアすることが多かった。
別の研究では、「@WeAreVisible」っていうTwitterアカウントに焦点を当てて、ホームレスの声を増幅しようとしたんだけど、研究者はそのアカウントに関わるユーザーの役割が異なることを発見した。ネットワーク内のほとんどのユーザーはホームレスではなく、ホームレスを経験している人たちの声と、その人たちを支援しようとする広い聴衆との間にギャップがあることを示していた。
Twitterの利用パターンを見ていくつかの研究者は、ホームレスに関するツイートが州やその条件によって変化することを発見した。最近の研究では、ツイートの内容と公衆衛生対策が関連していることが示唆されていて、Twitterが病気の拡散などの社会的問題をリアルタイムで監視するツールになり得るって。
私たちの研究では、Twitterデータを分析して、ホームレスの指標として使えるかどうかを見てみた。2010年3月から2022年12月までの間にアメリカ内で「homeless」という言葉を含むツイートを集めた。Twitter APIを使って、そのツイートがいつ投稿されたのか、その内容、送信された場所などのさまざまな情報にアクセスしたんだ。
全体で90万件以上の「homeless」っていう言葉を含むツイートを集めた。これらのデータを見て、Twitterの活動量と異なる州のホームレス率との相関関係があるかどうかを見たかったんだ。
データの理解
Twitterデータを公式なホームレスの推定値と比較する必要もあった。政府が報告しているPoint in Timeの推定値など、さまざまな情報源からデータを取得した。このデータは毎年のホームレスの人々の概要を提供するけど、24時間の限られた期間に依存している。
特に、シェルターのある人とシェルターのない人の両方を含むホームレスの全体数に焦点を当てた。「ホームレス」に関するツイート数が実際のホームレス率に関連するだろうと仮定したんだ。
データを分析するために、州の人口と平方マイルあたりのホームレス密度で分けた。ツイートのボリューム、感情、そしてホームレスの全体数の関係を見た。生のカウントに焦点を当てて、時間の経過に伴う変化を比較して、何かのパターンが見えるか確認した。
ホームレスとツイートボリュームに関する発見
2017年以降、ホームレスの数は増えてきて、ツイートも増加してることが分かった。データによると、州の約75%が一人当たりのホームレス率が低いけど、一部の州ではまだ高い率を経験してる。
ホームレス密度とツイートボリュームをつなげようとした分析では、重要な相関関係が示された。つまり、ホームレス率が上がると、ホームレスに関するツイートも増えるってこと、特にホームレスの人たちが多い州では。
面白いことに、アメリカのさまざまな地域で異なるパターンを見つけた。ルイジアナやフロリダみたいな南部の州はネガティブな相関が見られた。つまり、ホームレスが減るにつれて、ホームレスに関連するTwitter活動も減るってこと。一方、ニューヨークやマサチューセッツみたいな北東の州は、より強いポジティブな相関があった。
これらの違いは、各州のコンテキストがTwitterユーザーがホームレスにどう反応するかに大きな影響を与えていることを示してる。例えば、カリフォルニアみたいな人口の多い州では、ホームレスの小さな変化に気づきにくいけど、マサチューセッツみたいな人口密度の低い州では変化がもっと目立つ。
時間を通じたトレンドの分析
ツイートの感情の変化も見た。感情分析は、ツイートで使われている言葉が一般的にポジティブかネガティブかを測るんだ。データによると、全体的なホームレス率が増加している一方で、「homeless」という言葉を含むツイートの感情は時間とともに改善していた。
このトレンドは、ホームレスが増えているのに、なぜ人々がよりポジティブな感情を表現しているのか疑問を呼ぶ。ひとつの理論は、ホームレスに対する可視性と同情が高まって、ソーシャルメディア上でより支援的な態度を育てているかもしれないってこと。
でも、全国的なイベントやメディアの報道が、Twitter上でのホームレスに関する話題に影響を与えることも大事な点だよ。例えば、ホームレスのトレンドにおける重要な変化がオンライン上での議論や感情のシフトを生むかもしれない。
また、ホームレス率が高い州では、ツイートの内容に「housing」や「crisis」といった言葉がトレンドしているのが分かった。これらの言葉は、ホームレスやその関連した課題についての公衆の認識と対話の増加を示している。
ユーザー行動とアカウントの種類
私たちの研究では、誰がホームレスに関するツイートをしているかを調べた。アカウントを個人ユーザーと組織または団体の2種類に分類した。ホームレス率が高い州では、マルチポストアカウントが多くて、関与しているユーザーが問題について何度もツイートする可能性が高いことが分かった。
これって、ホームレスの問題がより深く人々に響いているってことを示してる。さらに、組織が情報やリソースをシェアすることが多いけど、個人は個人的な経験や意見を共有することが多い。
人口密度の低い州では、ツイートは主に一度だけホームレスについて投稿する個人からのものだった。これって、ホームレスの人が少ない地域では、この問題に対する関与が低いことを示すかもしれない。ユーザーの違いは、地域の要因がTwitter上でのホームレスに関する議論にどう影響するかを強調している。
ポジティブな感情が主流の州では、単一投稿アカウントがより一般的だった。これは、ネガティブな感情が主流の州とは異なり、団体が議論において重要な役割を果たしている。これが、個人の経験、公共の感情、そして団体の役割がホームレスに関する議論を形成する複雑な関係を示している。
制限と今後の方向性
これらの発見にも、研究の中でいくつかの制限がある。まず、Point in Time Annual Countはホームレスの全体像を捉えきれないことがある。これは、1晩の観察に依存しているからだ。それに加えて、各州のデータ収集方法が異なるため、結果が直接比較できないこともある。
Twitterデータの使用は、その代表性についても疑問を投げかける。Twitterユーザーの一部だけが自分のツイートにジオタグを付けるので、バイアスが入り込む可能性がある。それに、ホームレスについてのツイートは、政治的なキャンペーンや特定のアジェンダに影響されると、公共の感情を正確に反映していないかもしれない。
私たちは、ツイート量に対するボットや自動アカウントの影響も考慮しなかったため、結果が歪む可能性がある。今後の研究では、こうした影響を排除して、テーマに関する本物の人間の感情や関与を理解する方法を考える必要がある。
最後に、ツイート量とホームレス率の関連を示すことができた一方で、これらはあくまで相関関係に過ぎないことを認識することが重要だ。地元のイベントやメディアの報道など、こうした関係を引き起こすメカニズムを探るためには、より詳細な研究が必要だ。
結論
要するに、私たちの研究は、特にTwitterを使ってホームレスの率を理解し、推定する可能性を強調している。ツイートのボリューム、感情、そして公式なホームレスデータとの関連は、アドボカシー活動に役立つ複雑な景観を示している。
地域の条件がホームレスに関する会話や認識にどう影響を与えるかを理解することで、関係者は影響を受ける人々のニーズに対処するためのアプローチをより良くカスタマイズできる。ホームレスはアメリカで重要な問題であり続ける中、ソーシャルメディアでの公の議論を探求することは、効果的な解決策や支援を提供するための新たな道を開くかもしれない。
タイトル: An assessment of measuring local levels of homelessness through proxy social media signals
概要: Recent studies suggest social media activity can function as a proxy for measures of state-level public health, detectable through natural language processing. We present results of our efforts to apply this approach to estimate homelessness at the state level throughout the US during the period 2010-2019 and 2022 using a dataset of roughly 1 million geotagged tweets containing the substring ``homeless.'' Correlations between homelessness-related tweet counts and ranked per capita homelessness volume, but not general-population densities, suggest a relationship between the likelihood of Twitter users to personally encounter or observe homelessness in their everyday lives and their likelihood to communicate about it online. An increase to the log-odds of ``homeless'' appearing in an English-language tweet, as well as an acceleration in the increase in average tweet sentiment, suggest that tweets about homelessness are also affected by trends at the nation-scale. Additionally, changes to the lexical content of tweets over time suggest that reversals to the polarity of national or state-level trends may be detectable through an increase in political or service-sector language over the semantics of charity or direct appeals. An analysis of user account type also revealed changes to Twitter-use patterns by accounts authored by individuals versus entities that may provide an additional signal to confirm changes to homelessness density in a given jurisdiction. While a computational approach to social media analysis may provide a low-cost, real-time dataset rich with information about nationwide and localized impacts of homelessness and homelessness policy, we find that practical issues abound, limiting the potential of social media as a proxy to complement other measures of homelessness.
著者: Yoshi Meke Bird, Sarah E. Grobe, Michael V. Arnold, Sean P. Rogers, Mikaela I. Fudolig, Julia Witte Zimmerman, Christopher M. Danforth, Peter Sheridan Dodds
最終更新: 2023-05-15 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2305.08978
ソースPDF: https://arxiv.org/pdf/2305.08978
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://hedonometer.org/maps.html
- https://drive.google.com/file/d/1va4dWRZ6RPT089rcTkrE5fvK5hT0nksV/view?usp=sharing
- https://www.compstorylab.org/something/
- https://tex.stackexchange.com/questions/218418/book-title-in-revtex-bibliography
- https://tex.stackexchange.com/questions/102665/revtex4-1-and-colortbl-doesnt-fill-cells