Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# コンピュータと社会# 人工知能# 計算と言語# 情報検索# 機械学習# 社会と情報ネットワーク

オンライン空間における反ユダヤ主義の追跡

過激派のソーシャルメディアで進化する反ユダヤ的な議論に関する研究。

― 1 分で読む


オンラインの反ユダヤ主義のオンラインの反ユダヤ主義の監視をリアルタイムで追跡。ソーシャルメディアでの反ユダヤ主義の議論
目次

オンラインのヘイトスピーチ、特に反ユダヤ主義は、仮想および現実のコミュニティに悪影響を及ぼす環境を作ることがある。この研究は、過激派のソーシャルメディアプラットフォームでの反ユダヤ主義に関する議論が時間とともにどのように変化するかを探る。これらの議論で使われている言葉やテーマを追跡することで、人々の感情や考えをよりよく理解し、憎しみが暴力につながる前に介入する方法を見つけるかもしれない。

オンラインヘイトの問題

ソーシャルメディアのおかげで、自分と同じ考えを持つ人々、特に有害な意見を持つ人たちとつながりやすくなった。昔は、レイシストや反ユダヤ主義的な意見は静かに表現されることが多かったが、インターネットは誰でも思ったことを公に発信できる場を提供した。このシフトによって、ヘイトスピーチがより一般的になり、現実の暴力を引き起こすこともあった。

ヘイトスピーチを自動的に検出するための多くの研究が行われているが、オンラインの議論の性質やそれが時間とともにどのように進化するかを理解することはあまり一般的ではない。現在の研究のほとんどは静的なコンテンツに焦点を当てており、オンラインの会話の速いペースに追いついていない。このようなリアルタイムでのモニタリングの不足は、今回の研究が解決を目指すギャップだ。

私たちのアプローチ

私たちは、過激派のソーシャルメディアプラットフォーム上の反ユダヤ主義的な議論を自動的にモニタリングする方法を提案する。このアプローチは、機械学習、特に教師なし学習というタイプを使用していて、手動でラベル付けされたデータを必要とせずに機能する。代わりに、似たような投稿をグループ化することでテーマやサブテーマを自動で特定する。

まず、方法は初期の投稿を見て、それらをテーマに基づいてグループ化する。このプロセスは新しい投稿のバッチが追加されるたびに続き、新しい議論やトレンドに適応できる。似た投稿をクラスター化することで、反ユダヤ主義的なテーマやその投稿で使われる言語を特定できる。

反ユダヤ主義の歴史的背景

反ユダヤ主義は新しい問題ではなく、何世紀にもわたって続いている。歴史を通じて、ユダヤ人に関するステレオタイプや陰謀論が一般的だった。「ユダヤ人が世界を支配している」とか「さまざまな社会問題の責任がある」という主張は、議論の中でしばしば出てくる。これらのテーマは、時事に適応しながら進化する。例えば、一部のオンライン議論では、ユダヤ人がCOVID-19パンデミックについての偽の陰謀論に関連づけられている。

これらのテーマを理解することは重要だ。私たちの目標は、憎しみがエスカレートする前に、反ユダヤ主義の議論の変化を捉えて行動を起こすことだ。

方法論の概要

方法は2つの主要なステップから成る。まず、ソーシャルメディアから継続的に更新される投稿のストリームを収集する。次に、各バッチの投稿を処理して反ユダヤ主義のテーマを特定する。このプロセスには、人間の介入なしにこれらのテーマをカテゴライズする知識ベースを作成することが含まれる。

  1. データ収集: 投稿はバッチで収集される。これには、過激なコンテンツに焦点を当てたコメントや議論が含まれる。

  2. テキスト前処理: 収集されたテキストはクリーンアップされる。これにはテキストを小文字に変換し、URLを削除し、特殊文字を排除することで、内容に焦点を当てる。

  3. エンベディング生成: BERTという言語モデルを使用して、クリーンアップされたテキストを数値表現に変換する。これにより、それらの意味や関係を捉えることができる。

  4. クラスタリング: 投稿のエンベディングはクラスタリング技術を使用して処理される。これにより、似た投稿をグループ化し、テーマを特定する。新しいデータが入ってくるたびに、これらのクラスターは継続的に調整され、過去の知識が保持される。

  5. テーマ抽出: これらのクラスターから、反ユダヤ主義的な用語やテーマを抽出し、一般的なフレーズや憎しみを強化する新たな言語を捉える。

ダイナミック・ラーニング

私たちのアプローチの重要な特徴の一つは、そのダイナミックな性質だ。新しい投稿が届くと、モデルはテーマに対する理解を継続的に更新する。システムは過去の情報を忘れることはなく、新しいデータを統合しつつ歴史的文脈を維持する。これは、ヘイトスピーチのパターンが急速に現れ、進化する可能性があるため重要だ。

ローカルとグローバルの調整

この継続的な学習プロセスを管理するために、ローカルとグローバルという2種類の更新を行う。ローカル更新は個々の概念に焦点を当て、グローバル更新は必要に応じてすべてのテーマにわたって軽微な修正を行う。このバランスにより、システムは安定を保ちながら新しい情報に適応する。

結果

私たちの方法は、既存の議論のクラスタリング手法と比較してテストされた。アプローチを評価するために、定量的および定性的な分析を行った。

  1. 定量的分析: クラスタリング結果を、Affinity Propagation、Birch、Spectral Clustering、Gaussian Mixture、Mean Shiftなどの最先端クラスタリング手法と比較した。私たちの方法は、合理的な数のクラスターを動的に推定できる唯一の方法だった。他の方法は、議論の性質を正確に捉えられず、クラスターが多すぎたり少なすぎたりした。私たちのアプローチは、異なる反ユダヤ主義のテーマを効果的に表す9つのクラスターを特定した。

  2. 定性的分析: 我々の方法によって捉えられた用語や議論の種類も調べた。この分析には、反ユダヤ主義的な感情に関連する特定の用語を探ることが含まれていた。例えば、「新世界秩序」や「文化マルクス主義」といったテーマに関する議論が特定され、これらのアイデアがオンラインでどのように現れるかを示している。

新たな反ユダヤ主義的言語の出現

研究の重要な側面の一つは、議論が進化する中で新たな反ユダヤ主義的言語を特定することだった。言語モデルを使用することで、新たに出現する用語の意味を既知の反ユダヤ主義的フレーズと比較できる。これにより、反ユダヤ主義的な感情の高まりを示す新しい言語トレンドをフラグ付けするのに役立つ。

ヘイトスピーチのモニタリングへの影響

この研究の最終的な目標は、オンラインの憎悪的な言説をモニタリングするための実用的なツールを提供することだ。ソーシャルメディアを継続的に分析することで、リアルタイムで反ユダヤ主義的な会話の変化を特定できる。これにより、憎しみのエスカレーションを防ぐための即時の介入が可能となる。

また、私たちのアプローチは、反黒人、反LGBTQ+、イスラムフォビアなど、他の形の憎悪を調査するために適応可能であり、複数の社会問題に対処するための多目的なツールとなることを認識している。

今後の課題

オンラインヘイトとの戦いは続いている。今後の取り組みには、データの可視化機能を開発し、モニタリングツールの使いやすさを向上させることが含まれる。社会科学者とのコラボレーションも重要で、彼らの洞察が私たちの方法を精緻化し、ユーザーのニーズに合ったものにするのに役立つだろう。

結論

この研究は、ソーシャルメディア上の反ユダヤ主義的な言説を理解し、モニタリングするための重要な一歩を示している。機械学習技術と自然言語処理を活用することで、既存のテーマを追跡するだけでなく、新しい形のヘイトスピーチが現れる前に予測し、対応することができる。これは、安全なオンライン環境を育むために重要であり、有害なイデオロギーの拡散を抑えることにつながる。

私たちのアプローチは、継続的なモニタリングと介入の基盤を築き、ヘイトスピーチとその結果についてのより広い議論に貢献する。私たちの方法を改善し、焦点を広げることで、デジタル空間における差別を減少させ、社会的調和を促進するために意義のある影響を与えたい。

オリジナルソース

タイトル: Monitoring the evolution of antisemitic discourse on extremist social media using BERT

概要: Racism and intolerance on social media contribute to a toxic online environment which may spill offline to foster hatred, and eventually lead to physical violence. That is the case with online antisemitism, the specific category of hatred considered in this study. Tracking antisemitic themes and their associated terminology over time in online discussions could help monitor the sentiments of their participants and their evolution, and possibly offer avenues for intervention that may prevent the escalation of hatred. Due to the large volume and constant evolution of online traffic, monitoring conversations manually is impractical. Instead, we propose an automated method that extracts antisemitic themes and terminology from extremist social media over time and captures their evolution. Since supervised learning would be too limited for such a task, we created an unsupervised online machine learning approach that uses large language models to assess the contextual similarity of posts. The method clusters similar posts together, dividing, and creating additional clusters over time when sub-themes emerge from existing ones or new themes appear. The antisemitic terminology used within each theme is extracted from the posts in each cluster. Our experiments show that our methodology outperforms existing baselines and demonstrates the kind of themes and sub-themes it discovers within antisemitic discourse along with their associated terminology. We believe that our approach will be useful for monitoring the evolution of all kinds of hatred beyond antisemitism on social platforms.

著者: Raza Ul Mustafa, Nathalie Japkowicz

最終更新: 2024-02-06 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2403.05548

ソースPDF: https://arxiv.org/pdf/2403.05548

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事

ニューラル・コンピューティングと進化コンピューティングスパイキングニューラルネットワークのトレーニングの進展

新しい方法がスパイキングニューラルネットワークのエネルギー効率と性能を向上させる。

― 1 分で読む