イスラエル・ハマス紛争に対するオンラインの反応を理解する
2023年10月のハマス攻撃後のReddit上の世論の調査。
― 1 分で読む
目次
2023年10月7日のハマスの攻撃をきっかけに、イスラエルとパレスチナの対立が大きく激化した。この出来事は世界中から注目を集め、関連する話題についての議論が増えた。人々がオンラインで何を言っているのかをよりよく理解するために、IsamasRedという大規模なデータセットが作成された。このデータセットには、2023年8月から11月までの間にRedditから集めた約40万件の会話と800万件以上のコメントが含まれている。
データセットの基本
IsamasRedはReddit上のさまざまなディスカッションをまとめている。イスラエル・ハマスの対立に関連するコメントや投稿に焦点を当てていて、継続中の状況について議論している人々の感情、意見、信念を反映した会話を集めることが目的だった。Redditがこの研究のプラットフォームとして選ばれた理由は、その多様なユーザー層とサブレディットと呼ばれるディスカッションフォーラムの構造にある。
Redditは、ユーザーが特定のトピックに集中できる複数のサブレディットを通じて機能している。データ収集は、イスラエル・ハマスの対立などの地政学的問題についてよく議論される関連するサブレディットをターゲットにした。この方法により、様々な会話や視点がデータセットに取り込まれるようになった。
データ収集方法
データを集めるために、対立に関連するWikipediaページから自動的にキーワードを抽出するフレームワークが開発された。最初は小さな用語のセットが使われて、これらのページを取得していた。その後、モデルはこれらのページから重要なトピックを特定し、その関連性に基づいてランク付けを行った。このフレームワークは、キーワードを手動で選ぶことから生じるバイアスを減らすことを目指していた。
研究者たちは、Redditからの投稿を集めるために、対立に関連する用語のリストを用意した。投稿のタイトルにこれらのキーワードが含まれていた場合、その投稿はデータセットに含まれることになった。この自動化されたアプローチにより、重要な議論を逃すことなく、大量のデータを収集することができた。
対立の概要
10月7日のハマスの攻撃により、イスラエルで多くの死傷者と人質が発生した。それに対して、イスラエル政府はガザに対する軍事行動を開始し、双方に多くの死と苦しみがもたらされた。この暴力の悪循環は、地域だけでなく世界中に重要な政治的および社会的影響を及ぼしている。
この対立は激しい議論を引き起こし、各種のプラットフォームで抗議や議論が行われるようになった。特にアメリカでは、多くの人がこの問題について意見を述べ、双方の正当性について意見が分かれるようになった。これらの議論は、自己防衛、土地の権利、イスラエル・パレスチナの歴史的文脈といった複雑なテーマに触れることが多い。
Redditデータの重要性
Redditは、公の感情や意見を分析するための豊富な情報源となる。ユーザーは、コメントや議論の中で自由に自分の考えを表現できるし、ニュース記事、意見記事、個人のストーリーを共有することができる。Redditでの会話は、多様な視点を反映していて、こうした出来事に対する公の反応を理解する上で非常に貴重だ。
収集期間中は、特に対立に関連する重要な出来事の後に会話の活動が大きく増加したことが観察された。これは、状況が展開する中でユーザーからのリアルタイムの反応をキャッチするRedditの能力を示している。
データセットの分析
IsamasRedデータセットを使えば、研究者はオンラインのディスカッションの様々な側面を分析できる。ユーザーエンゲージメント、物議を醸すコメント、感情的な言葉、道徳的な感情の検討に焦点を当てている。さまざまな分析手法を活用することで、これらの議論の中でどのように異なる物語が形成されているのかを洞察することができる。
ユーザーの支持とエンゲージメント
ユーザーエンゲージメントを測る方法の一つは、アップボートとダウンボートを通じたもので、これらの相互作用の数は特定のコメントの人気や物議を示す。アップボートの増加は、ユーザーが特定の議論を価値があるまたは共感できると考えたことを示している。
データは、重要な日付の周りで会話が激化したことを示していて、特に暴力のエスカレーションがあった時期にもっと多くのユニークユーザーが参加し始めた。これは、議論への関心と感情的な投資が高まっていることを示している。
物議を醸すコメント
イスラエル・ハマス対立に関するRedditでの議論には、物議を醸す発言がしばしば含まれている。一部のコメントは混合反応を受け、激しい議論を引き起こす。特定の指標は、物議を醸すコメントの数を追跡しており、この数は対立の重要な出来事の際に特に高まっている。
物議を醸すコメントの存在は、強い意見や熱心な議論を示している。このダイナミクスは、対立に対する公の感情の複雑さと、意見が分かれる要因を明らかにする。
感情的な内容
感情は、議論がどうフレーム化され、認識されるかに重要な役割を果たす。このデータセットは、コメントに表現された感情的なニュアンスを特定するために分析された。怒り、恐れ、悲しみなどの一般的な感情が、特に対立が激化した後に見られた。
ネガティブな感情がより目立ち、この状況の深刻さやユーザーが展開する出来事にどう反応しているかを示している。こうした感情の次元を理解することは、全体の会話のトーンやコミュニティの心持ちを明らかにするのに役立つ。
道徳的な言語
感情に加えて、対立に関する議論には道徳的な考慮も含まれる。ユーザーは人権、公平性、出来事に関する倫理的な影響について懸念を表明している。コメントの背後にある道徳的な基盤を分析することで、参加者が最も共鳴するテーマが明らかになる。
議論の中での主要な道徳的テーマには、害や苦しみへの懸念が含まれる。ユーザーは、対立に関連するケアや公正の概念について話し合い、自分の価値観や信念を反映している。
データセットのサブセット
データセットには、対立に関連する特定のテーマに焦点を当てたサブセットも含まれている。例えば、シオニズムと反ユダヤ主義に関する議論に特化したサブセットがある。また、「フリーパレスチナ」運動とイスラムフォビアに中心を置いた別のサブセットもある。
これらの焦点を絞ったコレクションは、大きな会話の中で特定の物語や感情を深く分析することを可能にする。これらのトピックを孤立させることで、研究者はさまざまな問題がどのように相互に関連し、公の意見に影響を与えるのかをより明確に理解できる。
サブセット: IsamasRed-Z
このサブセットは、シオニズムと反ユダヤ主義に関する議論を調査する。イスラエルの行動やユダヤ人のアイデンティティや文化に対する影響を反映した会話を捉えている。データは、これらのテーマが議論の中でどのように展開され、ユーザーがどのような感情を表現しているのかを明らかにすることを目的としている。
サブセット: IsamasRed-P
データセットのもう一つの重要な側面は、「フリーパレスチナ」運動とそれに対する反応に焦点を当てている。このサブセットは、パレスチナの権利、自己決定権、関連する感情的な言語についての議論を探求している。これを分析することで、対立の文脈の中でパレスチナの権利を擁護することの複雑さが浮き彫りになる。
実用的な応用
IsamasRedデータセットは、研究者、政策立案者、イスラエル・ハマス対立についての公の意見を理解したい人々にとって貴重な応用がある。数多くの会話を分析することで、感情の変化を測定し、公の関心が高まっている重要な領域を特定することが可能になる。
ソーシャルメディアの分析は、ナラティブがどのように形成され、時間と共に変化していくのかについての洞察を提供する。公の議論を理解することで、より良い政策決定を促進し、対立解決を目指す議論を育むことができる。
結論
IsamasRedデータセットは、イスラエル・ハマス対立についてのオンラインディスカッションを検証するための重要なリソースとなっている。Redditの会話を慎重に収集し分析することで、研究者は公の感情やオンラインの議論に影響を与える要因を洞察することができる。
ユーザーエンゲージメント、物議を醸すコメント、感情表現、道徳的感情に注目することで、公の意見のより明確なイメージが浮かび上がってくる。特定のテーマに特化したサブセットの詳細な探求は、対立に関する複雑な物語の理解を深める。
状況が進展し続ける中で、IsamasRedのようなデータセットは、デジタル空間で公の議論がどのように展開され、現実の出来事にどのような影響を与えるのかを理解する上で重要な役割を果たし続けるだろう。
タイトル: IsamasRed: A Public Dataset Tracking Reddit Discussions on Israel-Hamas Conflict
概要: The conflict between Israel and Palestinians significantly escalated after the October 7, 2023 Hamas attack, capturing global attention. To understand the public discourse on this conflict, we present a meticulously compiled dataset-IsamasRed-comprising nearly 400,000 conversations and over 8 million comments from Reddit, spanning from August 2023 to November 2023. We introduce an innovative keyword extraction framework leveraging a large language model to effectively identify pertinent keywords, ensuring a comprehensive data collection. Our initial analysis on the dataset, examining topics, controversy, emotional and moral language trends over time, highlights the emotionally charged and complex nature of the discourse. This dataset aims to enrich the understanding of online discussions, shedding light on the complex interplay between ideology, sentiment, and community engagement in digital spaces.
著者: Kai Chen, Zihao He, Keith Burghardt, Jingxin Zhang, Kristina Lerman
最終更新: 2024-04-16 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2401.08202
ソースPDF: https://arxiv.org/pdf/2401.08202
ライセンス: https://creativecommons.org/licenses/by-nc-sa/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。