Twitterの新しいインサイト:ツイートが注目を集める方法
Twitterのインプレッション数は、ツイートがどれだけユーザーの注意を引くかを時間をかけて示してるよ。
― 1 分で読む
Twitterが新しい機能を導入して、ユーザーがツイートを何回見たかを表示するようになったんだ。この指標は「インプレッション数」と呼ばれ、ツイートがどのように広がり、時間とともに注目を集めるかを分析できるようになるよ。初期の分析によると、ツイートが最も多く見られるのは、投稿されてから約72秒後が多いんだって。24時間後には、多くのツイートが追加のビューをほとんど得られなくなる。平均して、ツイートは総ビューの半分がカウントされるまでに約80分間注目を集め続けるんだ。
情報が時間とともに価値を失うという考えは新しくないよ。図書館学などの分野では、書籍や研究論文がどのくらいの時間で重要性を失うかを研究しているんだ。その測定方法としては、書籍が何回借りられるかや論文がどれだけ引用されるかを見てる。こうしたパターンを追うことで、価値が半分になる時期を推測できるんだ。
科学文献では、この時間枠は通常数年になるけど、ニュース記事の場合は数日で価値が失われることもある。ソーシャルメディアの台頭や24時間ニュースサイクルの影響で、ニュース情報はさらに早く関連性を失うことがあるんだ。
Twitterが始まって以来、プラットフォームは各ツイートの「いいね」やリツイート数を表示してきた。この数字はユーザーがツイートの人気度を測るのに役立つし、どのくらいの期間関連性があるかを知る手助けにもなるよ。でも、最近まではユーザーは自分のツイートのビュー数しか見れなかったんだ。
2022年12月から、Twitterはすべてのツイートのビュー数を表示するようになったんだ。これで、自分のツイートだけじゃなく、他の人がツイートを何回見たかもわかるようになったよ。2023年1月5日には、研究者向けにこのインプレッション数もAPIを通じて利用できるようになると発表されたんだ。
この機能の利用可能性を受けて、私たちは研究を行うことにしたよ。TwitterのAcademic APIを使って、ツイートが時間とともにどう注目を集めるのかについていくつかの質問に答えることにしたんだ。
まず、ツイートのリーチを時間の経過とともにどう追跡できるかを見たよ。同じツイートの情報を繰り返し集めて、時間の経過に伴うインプレッションを示すデータセットを作る方法を示したんだ。
次に、インプレッションが最も多く発生するタイミングや、投稿後すぐのピークがいつかを調べたよ。データセットを使って、時間の経過に伴うインプレッションの平均的なパターンを見つける方法を見せたんだ。
ツイートのインプレッション数がすぐに減少することが証明できるかも見たかった。データからは、ほとんどのツイートに対してビュー数は最初は急速に増加するけど、その後すぐに増えなくなることがわかったから、分析ではツイートの最初の24時間に焦点を当てられたんだ。
最後に、ツイートの平均的な半減期を計算することを目指したよ。多くのビューを得た成功したツイートを少数除外することで、ツイートの中央値の半減期は約79.5分だとわかったんだ。
関連研究
情報の半減期、つまり情報がその価値を半分失うまでの時間については、多くの年にわたって研究されてきたよ。特に書籍や科学論文に関連してね。半減期は3年から12年と幅があり、理論科学の方が長い傾向にあるよ。
ニュースメディアでは、ストーリーの寿命はジャーナリストがどのようにコンテンツを作り、ローテーションして読者を引きつけるかに組み込まれているんだ。特定のイベントについては、そのイベントに関する記事がどれくらい早く出版されるかで半減期が測られるよ。ソーシャルメディアの台頭が情報の劣化を加速させているんだ。
Twitterでは、人気度を「いいね」やリツイートで測ることが多いけど、新しいインプレッション数のおかげで、実際にツイートを見た人数を知ることができるようになったんだ。
TwitterのAcademic APIを使って、2023年1月6日に22,144件のツイートを収集して、そのビュー数を追跡したよ。特定の時間ごとにツイートを集めて、各回の時間とビュー数を記録したんだ。私たちは、収集中に可視性を保っていた21,685件のツイートのデータを保持できたよ。
平均して1,893秒の間に、これらのツイートは平均46.2ビューを得ていて、15.6%のツイートは全くビューがなかったんだ。ビュー数はしばしばロングテール分布に従い、ほとんどのツイートは非常に少ないビューしか得られず、一部のツイートはたくさんのビューを得ることがある。中央値のビュー数は7だったよ。
ツイートのパフォーマンスを時間の経過とともに見ると、2つの異なるパターンに気づいたんだ。一部のツイートはすぐに最大ビューに達して、リツイートが少なくても同じオーディエンスを維持するけど、他のツイートは少しずつ安定して成長するんだ。
ユーザーがツイートを最も見やすい時間も知りたかったんだ。約18,000件のツイートを分析した結果、最も多くのビューが平均してツイートが投稿されてから72秒後に発生することがわかったよ。
より長い期間のビュー数を理解するために、同じツイートを1日、2日、3日後に追跡したんだ。結果は明らかで、最初の24時間にビューを得たツイートの約3分の1が、その次の2日間には追加のビューを全く得られなかったんだ。20件に1件のツイートだけがこの期間で50%以上のビュー数の増加を見たよ。
ツイートの半減期
20分から24時間の間でビュー数に大きな変化が見られたので、最初のデータセットからツイートの半減期を正確に測ることができないことに気づいたんだ。だから、約5,000件のツイートを11時間かけて収集する第2データセットを作成したよ。
第2データセットでは、24時間後にビューがなかったツイートは8.5%だったよ。残りのツイートについては、各ツイートが1日後のビュー数の半分に達するまでにかかった時間を測定したんだ。ほとんどのツイートはこの中間点にすぐに達したよ。
ツイートの平均的な半減期は約79.5分で、ほとんどのツイートのビュー数がすぐに減少するという以前の観察を確認できたんだ。
今後の研究課題
今後は、ビュー数やツイートの半減期を何が駆動しているのかを発見するのが自然な次のステップだね。データ収集中に、リツイートや「いいね」の情報も集めたんだ。これらの数字とビューとの関係を分析するのは、今後の研究にとって価値があるだろう。
ツイートの送信者が持っているフォロワー数、ツイートの内容、共有されているリンクや画像など、Twitterの他の詳細もツイートのパフォーマンスに影響を与えることができるよ。
いくつかのツイートは数日や数ヶ月後にバイラルになることもあるけど、この研究ではそういった外れ値には焦点を当てなかったんだ。でも、データを繰り返し収集する方法は、こうした長期的なトレンドを探るのに応用できるよ。
最後に、ソーシャルメディア上での人々の行動を研究するには、偏見やデータ品質の問題などの課題があるんだ。ビュー数の追加は、人気コンテンツやツイートが広がる詳細を調査するのに大いに役立つけど、Twitterのようなプラットフォームがアルゴリズムを秘密にすることが多いから、ソーシャルメディアデータの限界にも対処することが重要だね。
意外な発見の一つは、多くのツイートが全くビューを得ていないことだったんだ。これは、一部のツイートが削除されずにブロックされたり制限されたりしているのかどうかという疑問を引き起こすよ。これらの問題をさらに探求することが、ソーシャルメディアプラットフォームがデータを扱う上での透明性と責任を向上させるために必要なんだ。
研究の倫理と再現性
この研究では、Twitterからの公共のデータのみを使用し、情報を収集するために彼らのAPIに依存したんだ。ツイートを送信したり、他のアカウントと関わったりはしていないよ。収集したデータには、ツイートID、作成タイムスタンプ、インプレッション数が含まれ、個人情報や識別情報は含まれていないんだ。
私たちの研究からのすべてのデータはオンラインで利用可能で、誰でも私たちの発見を再現できるようになっているよ。これには、各ツイートに関する詳細な情報と、特定の収集時間に基づくビュー数が含まれているんだ。
このアプローチは、ソーシャルメディアでの情報の広がりを調査する今後の研究に向けた枠組みを提供し、研究の透明性を高めることができるんだ。
タイトル: The Half-Life of a Tweet
概要: Twitter has started to share an impression_count variable as part of the available public metrics for every Tweet collected with Twitter's APIs. With the information about how often a particular Tweet has been shown to Twitter users at the time of data collection, we can learn important insights about the dissemination process of a Tweet by measuring its impression count repeatedly over time. With our preliminary analysis, we can show that on average the peak of impressions per second is 72 seconds after a Tweet was sent and that after 24 hours, no relevant number of impressions can be observed for ~95% of all Tweets. Finally, we estimate that the median half-life of a Tweet, i.e. the time it takes before half of all impressions are created, is about 80 minutes.
著者: Juergen Pfeffer, Daniel Matter, Anahit Sargsyan
最終更新: 2023-04-11 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2302.09654
ソースPDF: https://arxiv.org/pdf/2302.09654
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。