Twitterでの「いいね」の分析:協調行動の考察
この研究は、Twitterの「いいね」がどのようにして協調的な非本物行動を示すかを調べているよ。
― 1 分で読む
目次
ソーシャルメディアプラットフォームは、人々が情報を共有し、消費する方法を変えたよね。多くのユーザーは、いいね!を使って投稿の質や信頼性を判断してる。残念ながら、これが一部のユーザーを、協調的な非正規行動(CIB)を使っていいね!を不正に増やそうとさせる結果になってる。この論文では、Twitterのいいね!を研究する新たな方法と、それがCIBを示すかもしれない行動について、特にデンマークの政治的議論の文脈で話すよ。
背景
Twitterみたいなプラットフォームは、ユーザーのエンゲージメント、特にいいね!を使って、どの投稿を目立たせるかを決めるんだ。いいね!は共有されたコンテンツの質の承認とも見なせる。でも、この仕組みは操作のチャンスを生み出すから、ユーザーは不正な手段で投稿の目立ち度を増やそうとすることがある。CIBは、ユーザーのグループがいいね!を操作して、世論を影響したり、誤情報を広めたりすることを指すんだけど、彼らが一緒に活動してることを隠すんだ。
研究の必要性
誤情報がプラットフォーム上でどう広がるかを分析する研究はたくさんあるけど、いいね!に関するCIBは詳しく研究されてないんだ。このギャップの一因は、ユーザーのいいね!行動に関する適切なデータを集めるのが難しいから。研究者はデータアクセスに苦労していて、プラットフォーム側が見られるものや収集できるものを制限することがある。
研究の貢献
この論文では、デンマークの政治的議論をハッシュタグ「dkpol」を通じてキャッチしたいいね!データを収集するスクリプトを紹介するよ。このスクリプトは、既存の方法よりも広範なデータ収集を可能にするんだ。特定のツイートを誰がいいね!したかを30日間にわたってデータを集めて、CIBを示唆するかもしれないパターンを分析できるようにするよ。
データ収集方法
データを集めるために、スクリプトは設定した観察期間に実行されて、指定したキーワードに一致するツイートを取得するよ。数分おきに、これらのツイートの更新をチェックして、誰がいいね!してるかを記録するんだ。プロセスでは、前回のチェックからのいいね!の数を比較して、新たにいいね!されたツイートを特定する。ツイートが新しいいいね!の設定数に達したら、スクリプトはそのツイートをいいね!したユーザーのリストをリクエストするよ。
このアプローチは、研究者がユーザー間のいいね!行動の包括的なデータセットを構築し、CIBの可能性を理解するのに役立つんだ。
データセットの活用
集めたデータはまず、スクリプトがいいね!データを集めるのがどれくらいよく機能するかを評価するのに使うよ。研究者は、ユーザーの行動を分析して、このデータのパターンがCIBの指標として使えるかどうかを判断する。特定のツイートに対して、ユーザーがどのようにいいね!行動を調整しているかに注目して、意見を操作している可能性のあるグループを特定することを目指すんだ。
ユーザー行動の発見
データセットは二値形式の情報を提供し、各行がツイートを表し、各列がユーザーを表すよ。ユーザーがツイートをいいね!したら、そのセルは「1」にマークされて、そうでなければ「0」になる。このおかげで、研究者はユーザー間のパターンを見つけることができるんだ。
データを分析する際、研究者はユーザーを同一のいいね!行動に基づいて厳格な基準でグループ化するよ。この厳しさによって、一緒にグループ化されたユーザーが協調行動に従事している可能性を高めるんだ。
クラスタリング分析
ユーザーのいいね!プロフィールに基づいてグループ化することで、研究者は完璧に調整されたユーザーの重要なクラスタを見つけるんだ。これらのグループには、ベンダーが購入したいいね!に関連するアカウントが含まれていることもあるんだ。研究者は、積極的ないいね!がなくても、検出されたクラスタがさらなる調査の必要性を示唆することを強調してる。
結果の可視化
発見をよりよく示すために、データは特異値分解(SVD)と呼ばれる方法を使って可視化されるよ。この手法は、ユーザーの行動を低次元空間で表示するのを助けて、同じいいね!パターンを示すユーザーのグループを見つけやすくするんだ。
CIBに対処する重要性
この論文は、情報の流れを歪めたり、世論に影響を与えたりすることができるCIBを調べることの重要性を強調してる。いいね!や他の指標が操作されると誤情報が広がりやすくなるから、これらの行動に対処することは、オンラインでの政治的議論の健全性を維持するために重要なんだ。
研究で直面する課題
研究はいくつかの課題に直面しているよ:
データの再現性: ソーシャルメディアの行動は急速に変わることがあるから、同じデータを2回収集すると異なる結果になるかもしれない。
限られたデータアクセス: 多くのソーシャルメディアプラットフォームは、いいね!データへのアクセスを制限してるから、研究者が包括的なデータセットを集めるのが難しいんだ。
真実の問題: どのアカウントが本当に調整されているのか、同じコンテンツを単にいいね!したアカウントなのかを特定するのが難しい。
データ収集技術の重要性
データ収集用に開発されたスクリプトは非常に重要で、研究者が標準APIアクセスに依存する際の制限を克服できるんだ。リアルタイムでユーザーのいいね!に関する情報を自動的に集めることで、ユーザーのエンゲージメントや潜在的な操作のより正確なイメージを構築するのを助けるよ。
倫理的配慮
ユーザーデータを含む研究は、プライバシーや同意に関する倫理的な問題を引き起こすよ。研究者はデータ収集のための適切な承認を求めて、関連する規制に従っていると報告されている。でも、意図的な研究でも、これらのプラットフォームでのユーザーの体験を妨害する可能性があることを認めてる。
今後の方向性
この研究は、協調いいね!行動を検出するためのさらなる研究の基盤を築くんだ。時間や頻度のような観察可能な特徴に頼らずに、あまり明らかでないCIBの形を特定できるような、より包括的な方法を開発する必要があるよ。
結論
特にCIBの文脈で、ソーシャルメディア上のいいね!行動を理解することは、オンラインでの議論の健全性を維持するためにますます重要になってる。この研究は、データ収集と分析の新しい方法を紹介し、ソーシャルメディアの指標が意見に影響を与えるために操作される方法についての継続的な調査の必要性を強調しているんだ。
これらの行動を探求することで、研究はソーシャルメディアのエンゲージメントのダイナミクスと公共の議論への影響を明確にする一助となることを期待しているよ。
タイトル: Towards Detecting Inauthentic Coordination in Twitter Likes Data
概要: Social media feeds typically favor posts according to user engagement. The most ubiquitous type of engagement (and the type we study) is *likes*. Users customarily take engagement metrics such as likes as a neutral proxy for quality and authority. This incentivizes like manipulation to influence public opinion through *coordinated inauthentic behavior* (CIB). CIB targeted at likes is largely unstudied as collecting suitable data about users' liking behavior is non-trivial. This paper contributes a scripted algorithm to collect suitable liking data from Twitter and a collected 30 day dataset of liking data from the Danish political Twittersphere #dkpol, over which we analyze the script's performance. Using only the binary matrix of users and the tweets they liked, we identify large clusters of perfectly correlated users, and discuss our findings in relation to CIB.
著者: Laura Jahn, Rasmus K. Rendsvig
最終更新: 2023-05-12 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2305.07384
ソースPDF: https://arxiv.org/pdf/2305.07384
ライセンス: https://creativecommons.org/licenses/by-sa/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://botometer.osome.iu.edu/bot-repository/datasets.html
- https://developer.twitter.com/en/docs/twitter-api/enterprise/decahose-api/overview/streaming-likes
- https://help.twitter.com/en/rules-and-policies/platform-manipulation
- https://transparency.twitter.com/en/reports/information-operations.html
- https://github.com/humanplayer2/get-twitter-likers-data/
- https://dataverse.harvard.edu/dataverse/twitter-likers
- https://doi.org/10.7910/DVN/WRUNZD