OSINTの洞察:ロシア-ウクライナ戦争におけるSNSの役割
OSINTツイートの研究は、ロシア・ウクライナ紛争に関する公共の議論を浮き彫りにしている。
― 1 分で読む
オープンソースインテリジェンス(OSINT)ってのは、一般に公開されてる情報を集めて分析することを指すんだ。ニュース記事、SNSの投稿、衛星画像、学術研究、公的記録なんかが含まれるよ。最近、特にロシア・ウクライナ戦争みたいな紛争の時にOSINTはかなり注目されてる。進行中の出来事を理解したり、誤情報を追跡するのに重要な情報源になるんだ。
戦争中は、TwitterみたいなSNSが人が情報を共有する大事な場になる。個人やジャーナリスト、グループが軍の動きや死傷者の報告、その他の関連情報を投稿することが多い。でも、こういうプラットフォームは誤情報の温床にもなるから、OSINTの役割がさらに重要になるんだよ。
データセットとその収集
この論文では、2022年1月から2023年7月までのロシア・ウクライナ戦争に関連するOSINT関連のツイートに焦点を当てたデータセットを紹介するよ。このデータセットは、関連するユーザーアカウントやそのツイートを特定して分析するために、構造化されたアプローチに従って収集されたんだ。
最初の段階では、「OSINT」っていう単語とウクライナかロシアに関連するツイートを探す作業をした。この検索は、国名を英語、ドイツ語、ロシア語などのいろんな言語に翻訳して広げたんだ。この方法で、15,000以上のユーザーから54,000以上のツイートが特定された。
次は、これらの結果をフィルタリングして、最終的なデータセットにはOSINT関連の話題に関連するアカウントだけが含まれるようにした。ユーザーはOSINT関連のトピックに関して少なくとも10回は言及されたりリツイートされている必要があったんだ。このフィルタリングプロセスの結果、約524人のユニークユーザーに絞られて、大手メディアや政府のアカウントを取り除くために手動で確認した。
関連するユーザーが特定されたら、2022年1月から2023年6月の間に投稿されたトップレベルのツイートを収集した。一部のアカウントでは技術的な問題があって、収集が2023年7月まで延びた。最終的に、このデータセットは1,040人のユーザーからほぼ200万ツイートを含む、戦争に関するSNS上の会話を分析するための大きな資源になったんだ。
データセットの分析
ユーザーのエンゲージメントと活動
データセットは、Twitter上のOSINTコミュニティの活動がかなり活発だってことを示してる。2022年3月、紛争が激化した時にデータセットでは約16万ツイートが記録された。この数はその後減ったけど、月に約10万ツイートが続いて比較的高い数字を保ってた。
ユーザーのエンゲージメントメトリクスはデータセットの関連性を反映してるよ。視聴回数は310億回を超えて、いいねはほぼ10億、リツイートは約1億8千万回だった。画像や動画も頻繁に共有されてて、戦争に関する情報を伝えるのに視覚的コンテンツの重要性がわかるね。
言語とハッシュタグ
データセットのツイートの大部分は英語で書かれてて、全体の約69%を占めてた。日本語、ウクライナ語、ロシア語なんかも見られて、紛争への国際的な関心を示してる。
ハッシュタグの使い方も目立ってて、特定のトピックに投稿を分類・関連付けるんだ。一番よく使われたハッシュタグには「ウクライナ」と「ロシア」が含まれてた。「OSINT」っていうハッシュタグも頻繁に使われてて、ユーザーたちがこのインテリジェンス収集の用語の重要性をわかってたってことを示してる。
コンテンツ分析
最初のコンテンツ分析は、関連ツイートと無関係なツイートを特定することに焦点を当ててた。この分類は、実用的なインテリジェンスを提供しないかもしれない個人的な意見や感情をフィルタリングするのに必要だったんだ。分析の結果、約28万7千ツイートが紛争に直接関連する情報を含んでることがわかった。
関連するツイートは、装備の移動や軍事作戦などのいろんなトピックをカバーしてて、ユーザーたちが話し合ってる戦争の多様な側面を示してた。
誤情報検出
誤情報は紛争の時に重要な問題だよ。これに対処するため、データセットの中で潜在的に誤解を招く情報や虚偽の情報を特定するための予備実験が行われた。二つの異なるモデルが使われて、一つはCOVID-19に関する誤情報、もう一つは一般的なフェイクニュースの検出に焦点を当ててた。
最初のモデルは、207,000ツイート以上を誤情報として分類したけど、二つ目のモデルは約14,000ツイートをフラグした。これらの結果は偽情報が広がってることを示してるけど、その正確性や影響を完全に理解するにはさらなる研究が必要だね。
意義と今後の応用
このデータセットは、危機の時にOSINTがどのように機能するかについて貴重な洞察を提供するよ。ユーザーのやり取りや会話を分析することで、研究者はロシア・ウクライナ戦争に関する情報の広がりや公共の感情をよりクリアに理解できるんだ。
ただ、このデータセットの限界も認識することが大事だね。OSINTの風景の重要な部分をキャッチしてるとはいえ、すべての関連する会話を含むわけじゃない。今後の研究は、このデータを他のソースと統合して、もっと包括的な視点を提供することを考慮するべきだと思う。
このデータセットを作成・分析するために用いられた技術は、他のトピックや社会運動にも応用できる。オンラインでの情報の広がりや伝え方を調べることで、研究者は危機の時の公共の議論や影響のダイナミクスをもっとよく理解できるようになるよ。
結論
ロシア・ウクライナ戦争に関連するOSINTの探索は、SNSデータをインテリジェンス収集に使う潜在的な利点を強調してる。このデータセットは、紛争の最中に情報がどのように共有され、議論され、時には歪められるのかを理解するための基盤を提供するんだ。
今後は、オンラインプラットフォームからの情報を扱って分析するためのベストプラクティスに関する議論に貢献できるかも。この急速に変化する状況では、情報の正確性と本物性に注意を払い続けることが研究者や一般市民にとって重要なんだ。
このデータセットは公開されてて、さらなる探求や分析ができるようになっているから、他の人たちもOSINTの現代的な紛争における役割についての会話に貢献できるんだ。協力を促進することで、危機の時に情報がどのように形作られるかについての理解をさらに深めていけるよ。
タイトル: A dataset of Open Source Intelligence (OSINT) Tweets about the Russo-Ukrainian war
概要: Open Source Intelligence (OSINT) refers to intelligence efforts based on freely available data. It has become a frequent topic of conversation on social media, where private users or networks can share their findings. Such data is highly valuable in conflicts, both for gaining a new understanding of the situation as well as for tracking the spread of misinformation. In this paper, we present a method for collecting such data as well as a novel OSINT dataset for the Russo-Ukrainian war drawn from Twitter between January 2022 and July 2023. It is based on an initial search of users posting OSINT and a subsequent snowballing approach to detect more. The final dataset contains almost 2 million Tweets posted by 1040 users. We also provide some first analyses and experiments on the data, and make suggestions for its future usage.
著者: Johannes Niu, Mila Stillman, Philipp Seeberger, Anna Kruspe
最終更新: 2024-09-02 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2409.01052
ソースPDF: https://arxiv.org/pdf/2409.01052
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://gind.mines-albi.fr
- https://www.mines-albi.fr
- https://github.com/annakaa/OSINT
- https://developer.twitter.com/en/developer-terms/policy
- https://www.kaggle.com/code/josbenard/ukrain-war-hashtag-timeline?scriptVersionId=109668548
- https://huggingface.co/roberta-base
- https://huggingface.co/spencer-gable-cook/COVID-19_Misinformation_Detector
- https://huggingface.co/FriedGil/distillBERT-misinformation-classifier
- https://twitter.com/TreasChest/status/1605953315065327617
- https://twitter.com/Flash
- https://twitter.com/front
- https://twitter.com/Hromadske/status/1518869992908935168
- https://twitter.com/Hajun
- https://motolko.help/en-news/belarusian-hajun-military-activity-on-the-territory-of-belarus-on-may-18/
- https://hajunby.motolko.help
- https://twitter.com/NOELreports/status/1636013175005954049
- https://twitter.com/nos
- https://twitter.com/YourmediaAgency/status/1497725282249228292
- https://twitter.com/radiosvoboda/status/1668833986934898688
- https://twitter.com/zloy
- https://twitter.com/Mmzk