Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# 社会と情報ネットワーク

テレグラムグループでのユーザー行動分析

テレグラムの公開グループでのさまざまなトピックに関するインタラクションの研究。

Alessandro Perlo, Giordano Paoletti, Nikhil Jha, Luca Vassio, Jussara Almeida, Marco Mellia

― 1 分で読む


テレグラムグループのユーザテレグラムグループのユーザー行動研究タラクションの洞察。Telegramグループ内のユーザーイン
目次

Telegramは広く使われているメッセージアプリだけど、あんまり研究はされてないんだ。この文章では、教育、政治、暗号通貨みたいな色んなトピックを話し合うTelegramの公開グループを見ていくよ。俺たちは自動でメッセージを収集するツールを作って、669のグループから5000万以上のメッセージを集めたんだ。

Telegramの成長

Telegramは年々急成長してて、2023年7月には800百万以上のアクティブユーザーに達したんだ。ユーザーは、たくさんの人がチャットできるグループや、一人が多くのフォロワーにメッセージを共有するチャンネルみたいな、色んな方法でコミュニケーションをとっている。でも、Telegramに関する研究は成長に追いついてないんだ。

限られた研究

これまでの研究は、ヘイトスピーチやテロ組織みたいな特定のトピックに集中していて、よく単一の国だけを見てた。俺たちの研究は、グループ内でのユーザーの行動がどうなるかを、異なる議論のトピックに基づいて調べてる。

データ収集プロセス

データを集めるために、二段階のシステムを設計した。まず、TGStatってサービスを使って、いろんなトピックの公開グループを見つけた。そして、そのグループからメッセージを収集した。TGStatはトピック別にカテゴライズされた多くのグループやチャンネルを一覧にして、その活動に関するデータも提供してる。

TGStatの使用

TGStatは、Telegramのチャンネルとグループの膨大なデータベースで、ほぼ190万件のエントリーがある。俺たちはこれらのグループについて、名前、トピック、言語、アクティブユーザー数みたいな情報に簡単にアクセスできる。これは、以前の研究がソーシャルメディアや口コミに頼ってグループを探してたのに対して、もっと時間がかかることがあるんだ。

メッセージ収集

興味のあるグループを見つけたら、俺たちのツールが自動で参加してメッセージを集めた。プロセスを早めるために複数のアカウントを使いながら、Telegramのルールを守ってアカウントが禁止されないようにした。メッセージの入手可能性を維持するために、アクティブユーザーのいるグループに焦点を当て、オートデリート設定のグループは避けた。

収集データの特徴

2024年4月までに、993のアクティブグループから、2か月間で5000万以上のメッセージを収集した。TGStatのトピックカテゴリの正確さも確認して、基準に合わないグループは捨てた。

ユーザー活動の分析

データ分析の目的は、ユーザーが異なるグループでどのようにやり取りするかを理解することだった。メッセージの種類、ボットの存在、共有されたメディアを調べた。トピックに基づいてユーザーの行動に大きな違いがあることがわかった。

Telegramボット

多くのグループがコンテンツのモデレーションや統計提供など、様々な機能のためにボットを使ってる。俺たちのデータセットでは、ボットがいないグループは約10%だけだった。ボットのあるグループでは、メッセージの平均8.6%をボットが生成してたけど、トピックによっては異なってた。例えば、教育関連のグループではボットの役割が大きかったけど、政治関連のグループではそうでもなかった。

言語の使用

異なるトピックで使われる言語を調べた。一般的に、英語とロシア語が最も一般的な言語だった。特に教育や暗号通貨の分野では、英語メッセージの割合が高かったけど、他のトピックではロシア語話者が多かった。

メッセージの長さ

メッセージの長さはトピックによって大きく異なった。違法行為を話し合うグループは長めのメッセージが多かったけど、政治や言語学みたいな議論に重点を置いたグループは一般的に短いメッセージが多かった。

非テキスト要素の使用

グループが画像、動画、絵文字みたいな非テキスト要素をどれくらい使っているかも見た。政治関連のグループは、メッセージの20-30%に絵文字や画像を使う典型的なパターンがあった。一方で、エロ関連のグループは非テキスト要素をほとんど使ってなかった。

マルチメディアコンテンツ

グループで共有された動画を分析した結果、トピックによって動画の長さや質に大きな違いがあった。例えば、映画関連のグループで共有された動画は他のトピックに比べてかなり長い傾向があった。逆に、エロ関連のグループでは短くて質の高い動画が共有されてた。

外部ウェブサイトへのリンク

ユーザーが外部サイトへのリンクをどのように共有しているかも調べた。X(旧Twitter)、YouTube、Instagramみたいなソーシャルメディアプラットフォームは、様々な議論で人気があった。このパターンは、ユーザーがこれらのウェブサイトにどのように注意を向けているかを理解する手助けになった。

研究の倫理

研究を通じて倫理を重視した。TGStatをクローリングする際にウェブサイトの制限を尊重し、データ収集がサーバーに負担をかけないようにした。Telegramグループを監視する際はプライバシーポリシーを守り、誰でもリンクを持っている人がアクセスできる公開グループだけを分析した。

結論

俺たちの研究は、異なるコミュニティがTelegramをどのように利用しているかについての有益な知見を提供してる。議論のトピックに基づいて、様々な行動ややり取りがあることが観察された。この研究は始まりに過ぎないし、今後のTelegramプラットフォームやその多様なユーザーベースに関するさらなる研究を促進できたらいいなと思ってる。

このアプリや現代のコミュニケーションにおける役割をよりよく理解するために、もっと議論や研究が必要だよ。俺たちの発見が今後の研究の道を開き、Telegram上のユーザーのインタラクションに関する知識を深めるのに役立つことを目指してる。

オリジナルソース

タイトル: A Topic-wise Exploration of the Telegram Group-verse

概要: Although currently one of the most popular instant messaging apps worldwide, Telegram has been largely understudied in the past years. In this paper, we aim to address this gap by presenting an analysis of publicly accessible groups covering discussions encompassing different topics, as diverse as Education, Erotic, Politics, and Cryptocurrencies. We engineer and offer an open-source tool to automate the collection of messages from Telegram groups, a non-straightforward problem. We use it to collect more than 50 million messages from 669 groups. Here, we present a first-of-its-kind, per-topic analysis, contrasting the characteristics of the messages sent on the platform from different angles -- the language, the presence of bots, the type and volume of shared media content. Our results confirm some anecdotal evidence, e.g., clues that Telegram is used to share possibly illicit content, and unveil some unexpected findings, e.g., the different sharing patterns of video and stickers in groups of different topics. While preliminary, we hope that our work paves the road for several avenues of future research on the understudied Telegram platform.

著者: Alessandro Perlo, Giordano Paoletti, Nikhil Jha, Luca Vassio, Jussara Almeida, Marco Mellia

最終更新: 2024-09-04 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2409.02525

ソースPDF: https://arxiv.org/pdf/2409.02525

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

類似の記事