ツイッターでのハッシュタグの広がり:二つのアプローチ
この記事は、ネットワークとアイデンティティがTwitterでのハッシュタグの人気にどう影響するかを探る。
― 1 分で読む
目次
ハッシュタグはSNS、特にTwitterでどこにでもあるよね。みんなの考えを共有したり、他の人とつながるのに役立つ。この記事では、ハッシュタグが新しいアイデアや文化をつなげるためにTwitterでどう広がるかを見ていくよ。ネットワークとアイデンティティっていう二つの大事な要素が、ハッシュタグの広がり方にどう影響するかを探るんだ。
ハッシュタグの理解
ハッシュタグは、"#"の記号の前に置かれた言葉やフレーズだよ。Twitter上のコンテンツをカテゴライズするのに役立って、特定のトピックに関連するメッセージを見つけやすくする。約5件に1件のツイートにはハッシュタグが含まれていて、どれだけ一般的かがわかるよ。ハッシュタグはTwitterでは主に二つの目的があるんだ:
- 新しい文化的アイデアを生み出す。
- そのアイデアを広めやすくする。
例えば、新しいトレンドやトピックが出てくると、人々はそれに関わるためにハッシュタグを使う。これがSNSで文化的な革新が起こる方法なんだ。
ハッシュタグの広がりを研究する理由
ハッシュタグの広がりについて話すとき、「カスケード」を考えるよね。カスケードは、行動や情報がSNSで広がるプロセスのこと。研究者たちは主にネットワークの構造という一つの要因に焦点を当てて、どう広がるかを理解しようとしてきた。でもこの記事では、二つの要因を見て、もっと全体像を提供することを目指してるんだ:
この二つの要素を一緒に研究することで、どのハッシュタグが人気になるか、またはならないかについての見識が得られるんだ。
どうやってテストしたか
1,337個のハッシュタグをTwitterで分析して、新しい文化的アイデアをどう表しているかを見たよ。約300万人のユーザーを調べて、ネットワークだけ、アイデンティティだけ、または両方の組み合わせに基づいてハッシュタグの広がりを予測するモデルを作ってテストしたんだ。
使用した三つのモデル
- ネットワークのみモデル:このモデルはネットワーク構造がハッシュタグの広がりにどう寄与するかを見てる。
- アイデンティティのみモデル:このモデルはネットワークを考慮せずにデモグラフィック要因を分析する。
- ネットワークとアイデンティティの組み合わせモデル:このモデルはネットワークとアイデンティティの両方を見てる。
それぞれのモデルが、人気や成長などのハッシュタグの10の異なる属性をどれだけ予測できるかを比較したよ。
何がわかったか
結果は、ネットワークとアイデンティティの組み合わせを使うことで、ハッシュタグの広がりについて最も良い予測が得られることを示してる。ただ、広がりの異なる側面は異なる要因に影響を受けるんだ。
人気と成長
私たちの発見は、組み合わせモデルが人気をよく予測する一方で、ネットワークのみモデルがハッシュタグの成長速度を予測するのには向いてるってこと。つまり、ネットワークの構造がハッシュタグの広がりの速さにおいてより重要な役割を果たすんだ。
アイデンティティの重要性
アイデンティティモデルは、誰がハッシュタグを採用するかを予測するのに優れてた。特に、人種や地域のアイデンティティに関連するハッシュタグについては特にそう。アダプターのアイデンティティが、特定のハッシュタグに関与するかどうかに影響を与えるんだ。
複数要因の重要性
ネットワークとアイデンティティを組み合わせて分析することで、ハッシュタグの広がりをもっと正確に反映できたんだ。
- 行動の理解:両方の要素を使ったモデルは、ハッシュタグがSNSを通じてどう移動するかをよりよく捉えた。
- 異なるニーズ:スポーツや文化的イベントのように特定のコミュニティにサービスを提供するハッシュタグは、組み合わせモデルから恩恵を受けた。
異なるハッシュタグのタイプ
異なる種類のハッシュタグは、その広がりに異なる要因を必要とすることに気づいたよ。例えば、スポーツや地域のイベントに関連するハッシュタグは、ネットワークとアイデンティティの両方が tractionを得るのに必要だ。一方で、一般的なトピックはアイデンティティにそれほど重点を置かなくてもいいかもしれない。
ハッシュタグの広がり方
ハッシュタグの広がりを視覚化するために木をイメージしてみて。最初のユーザーがハッシュタグを使って、その友達がそれを見る。もしその友達がそれを共有すれば、もっと多くの人が気づいて広がり続ける。
初期アダプターの役割
初期アダプターは重要なんだ。彼らはしばしばハッシュタグを最初に使う人たちだから。もし彼らがすでに影響力があったり、ソーシャルサークルの中心にいるなら、ハッシュタグに多くの注目を集めることができるんだ。
- 中心ユーザー:フォロワーやネットワーク内のつながりが多いユーザーは、ハッシュタグをさらに広める。
- コミュニティのつながり:初期アダプターが特定のコミュニティとつながっていれば、そのコミュニティはそのハッシュタグを支持する可能性が高い。
アイデンティティを反映するハッシュタグ
一つの重要な発見は、ハッシュタグがそれを採用するユーザーのアイデンティティを反映することが多いってこと。人々が人種的や社会的アイデンティティを表すハッシュタグを使うと、そのハッシュタグはそのアイデンティティを共有する他の人が採用することで成功しやすいんだ。
- 例:#BlackLivesMatterのようなハッシュタグは、人種的アイデンティティが強いコミュニティで勢いを増す。ネットワークのつながりと共有されたアイデンティティの組み合わせが、こうしたハッシュタグの広がりに役立つ。
成功の評価
各モデルがどれだけうまく機能したかを評価するために、カスケードに関連する10の異なる属性を見たよ:
- 使用頻度:ハッシュタグがどれだけ使われるか。
- アダプターの数:ハッシュタグを採用したユニークなユーザーの数。
- エッジ密度:アダプターが自身のソーシャルネットワーク内でどれだけつながっているか。
- 成長予測性:初期アダプターに基づいて、ハッシュタグがどれだけ大きくなるかを予測する能力。
- デモグラフィックの類似性:アダプターのデモグラフィックがどれだけ似ているか。
- 地理的類似性:アダプターの場所がどれだけ関連しているか。
- ネットワークの性質の類似性:アダプターのネットワーク内での位置がどれだけ似ているか。
これらの指標を異なるモデルで比較することで、ネットワークとアイデンティティの組み合わせの利点を確認できたんだ。
過去の研究の制限
ほとんどの過去の研究は、ネットワークかアイデンティティのどちらか一つの要素に焦点を当ててきたから、ハッシュタグの広がりに対する理解が広がらないことがあるんだ。
今後の方向性
将来の研究は、ハッシュタグの採用に影響を与えるかもしれない追加の要因を考慮することで、私たちの発見を改善できるよ。探るべき分野には、ユーザー間の関係の種類、ハッシュタグ使用の具体的な意図、感情や現在の出来事がハッシュタグの人気を高める役割などが含まれるんだ。
結論
まとめると、私たちの研究は、ハッシュタグの広がりを理解するには、ユーザーのネットワークとアイデンティティの両方を一緒に見る必要があるってことを示してる。この組み合わせのアプローチは、ハッシュタグがTwitterでどう tractionを得るかのより詳細な見解を提供するよ。
ネットワークとアイデンティティの役割を分析することで、社会的つながりと個人のアイデンティティが文化的アイデアの広がりにどう影響するかが複雑に絡み合っていることを学んだんだ。未来の研究は、これらのダイナミクスをさらに探ることで私たちの発見から利益を得ることができるよ。
データリリース
進行中の研究をサポートするために、私たちが調べた1,337個のハッシュタグのデータベースをリリースするよ。それには、トピックや関与しているユーザーのデモグラフィックに関連するさまざまな特徴が含まれてる。これにより、ハッシュタグがSNSでどう機能し広がるかのさらなる探求が可能になるんだ。
タイトル: The Role of Network and Identity in the Diffusion of Hashtags
概要: Although the spread of behaviors is influenced by many social factors, existing literature tends to study the effects of single factors -- most often, properties of the social network -- on the final cascade. In order to move towards a more integrated view of cascades, this paper offers the first comprehensive investigation into the role of two social factors in the diffusion of 1,337 popular hashtags representing the production of novel culture on Twitter: 1) the topology of the Twitter social network and 2) performance of each user's probable demographic identity. Here, we show that cascades are best modeled using a combination of network and identity, rather than either factor alone. This combined model best reproduces a composite index of ten cascade properties across all 1,337 hashtags. However, there is important heterogeneity in what social factors are required to reproduce different properties of hashtag cascades. For instance, while a combined network+identity model best predicts the popularity of cascades, a network-only model has better performance in predicting cascade growth and an identity-only model in adopter composition. We are able to predict what type of hashtag is best modeled by each combination of features and use this to further improve performance. Additionally, consistent with prior literature on the combined network+identity model most outperforms the single-factor counterfactuals among hashtags used for expressing racial or regional identity, stance-taking, talking about sports, or variants of existing cultural trends with very slow- or fast-growing communicative need. In sum, our results imply the utility of multi-factor models in predicting cascades, in order to account for the varied ways in which network, identity, and other social factors play a role in the diffusion of hashtags on Twitter.
著者: Aparna Ananthasubramaniam, Yufei Zhu, David Jurgens, Daniel Romero
最終更新: 2024-07-17 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2407.12771
ソースPDF: https://arxiv.org/pdf/2407.12771
ライセンス: https://creativecommons.org/publicdomain/zero/1.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。