イギリスの政治家へのオンライン敵意:徹底分析
イギリスの議員に対するソーシャルメディアでの敵意の高まりを分析中。
Mugdha Pandya, Mali Jin, Kalina Bontcheva, Diana Maynard
― 1 分で読む
目次
最近、イギリスの政治家たちがソーシャルメディアを使って一般市民と交流するようになってきたね。彼らはX(以前のTwitter)みたいなサイトを使って、有権者の質問に答えたりフィードバックを受け取ったりしてる。でも、このオープンさが逆に想定外の注目を集めることもあるんだよね。政治家はしばしば、彼らの職業や個人のアイデンティティに対する敵意のあるコメントの波に直面することがあって、ソーシャルメディアは二面性を持ってる。
この敵意は、政治家や政府に対する公共の信頼を損なう可能性がある。一部のコメントはあまりにもひどくて、現実世界の暴力を引き起こす恐れもある。だから、この問題を理解して対処することは、健全な政治的ディスコースを維持するために重要なんだ。
データセット
政治家を狙ったオンラインコメントの敵意の問題に取り組むために、研究者たちは3,320件のツイートからなるデータセットを作成したよ。これらのツイートは、イギリスの国会議員(MP)に対する敵意の度合いが慎重にレビューされ、ラベル付けされてる。また、対象のアイデンティティ特性(人種、性別、宗教など)に関する詳細も含まれてる。
このデータセットはランダムなツイートの集まりじゃなくてね、イギリスの政治的議論で発生する独自の言語や問題に光を当てることを目指してるんだ。例えば、ブレグジットみたいな特定の問題はイギリスでは特に重要で、このデータセットにもそれが反映されてる。
なぜこれが重要なの?
この種のデータセットが必要なのは、政治的敵意に特有の言語が使われるから。一般的な敵意を検出するための既存のモデルは、政治的文脈に適用するとしばしば不十分なんだ。言語や公共の感情のニュアンスを見逃してしまうから、もっと特化したアプローチが重要なんだ。
この特化した取り組みがなければ、政治機関に対する公共の信頼がさらに失われる可能性がある。だから、このデータセットを作成して分析することは、敵意のあるツイートを分類するだけでなく、政治的文脈でのオンライン虐待を理解するための未来の研究への扉も開くんだ。
前の研究
このデータセットが作成される前に、政治家に対する敵意についての研究はあったけど、しばしば一般的な視点からだった。多くの研究は特定の事件やトレンドに焦点を当てていて、言語やアイデンティティの問題の包括的な分析を提供することはなかった。
研究では、女性政治家やマイノリティの背景を持つ人たちがより多くの敵意に直面する傾向があることが示された。ネガティブな感情をオンラインで測るために感情分析みたいな手法が使われてきたけど、政治の領域では必ずしも効果的ではなかった。
既存のデータセットは、敵意の具体的な性質を特定するラベルが欠けていることが多かった。いくつかのデータセットは一つの虐待のタイプ、例えばイスラムフォビアのみに焦点を当てていたり、他のデータセットは広範なヘイトスピーチを含んでいたけど、アイデンティティ特性には注目していなかった。
方法論
データ収集
研究者たちは、MPに関連するツイートを2年間にわたって集めるためにXのストリーミングAPIを使ったんだ。彼らはMPからのオリジナルツイートとその後のリプライやリツイートの両方を追跡した。この広範なアプローチのおかげで、3000万件以上のツイートが集まったんだけど、その数が多すぎたから、研究者たちは詳細な分析のためにより小さな管理しやすいサブセットをサンプリングする必要があった。
サンプリングプロセス
多様性を確保するために、研究者たちは異なるアイデンティティや政党を代表する18人のMPからツイートを選んだ。サンプルは、マイノリティとマジョリティのアイデンティティグループの両方を含むようにバランスを取った。また、異なる文脈やイベントを捉えるためにさまざまな時間帯に焦点を当てた。
合計で3,330件のツイートが手動でラベル付けされるために収集された。ツイートは敵意に基づいて分類され、研究者たちはMPに向けられたオンライン虐待の状況をより明確に把握できるようにした。
アノテーションプロセス
研究者たちは、アノテーターがツイートを効果的に分類するためのガイドラインを策定した。トレーニングセッションを通じて、関与する全員が敵意を正確に特定するための定義や基準を理解できるようにした。アノテーターはチームで作業し、知らない言語に直面したときは外部のリソースを参照することを奨励された。
3人の異なるアノテーターが各ツイートにラベルを付けて、データセットにある程度の信頼性を提供した。この複数のアノテーションプロセスは、エラーを最小限に抑え、ラベルができるだけ正確になるようにしたんだ。
ツイートの分析
言語パターン
敵意のあるツイートで使われる言語を理解するために、研究者たちは言語分析を行った。敵意のあるツイートには、政治家を貶めることを目的としたネガティブな用語やフレーズが多く含まれていることがわかったんだ。「嘘つき」「腐敗」「邪悪」みたいな言葉が、敵意のあるコメントに特に多かったよ。
逆に、敵意のないツイートは前向きなフレーズが多い傾向にあった。侮辱の代わりに、これらのツイートは感謝や建設的なフィードバックを表現していて、社会的な規範に従った言語を使っていたんだ。
トピック分析
研究者たちは、敵意のあるツイートと敵意のないツイートに関連するトピックも探った。ブレグジットやパンデミック中の医療の扱いのような、現在の政治的イベントに関連するツイートが多いことが確認された。この現在のイベントとオンラインの敵意の関連性は、特定の問題がどのように政治家に対する公共の怒りを増幅させるかを示してるんだ。
敵意の特定
研究者たちは、このデータセットを使ってツイートの敵意を検出するためのモデルをトレーニングした。これは主に二つのタスクから成り立っていて、まずツイートが敵意のあるものかどうかを特定し、次に人種、性別、宗教などのアイデンティティ特性に基づいて敵意のタイプを分類することだった。
どのモデルがバイナリの敵意(敵意あり vs 敵意なし)や多クラスの敵意タイプを特定するのに最も良い結果を出すかを試験した。
発見
敵意検出の結果
モデルのパフォーマンスを分析したところ、RoBERTa-Hateのような特定のモデルが敵意の検出において特に良いパフォーマンスを発揮し、高いマクロF1スコアを達成した。データセットを使ってトレーニングしたモデルは、以前のデータセットでトレーニングしたものよりも良い結果を出すことが明らかになった。
敵意のトレンド
データで見られた顕著なトレンドは、特定のアイデンティティ背景を持つ政治家(たとえば、女性や少数民族の人たち)が、より多くの敵意を受ける傾向があることだ。これは、人種、性別、宗教の組み合わせが、政治家が直面する虐待の量を増幅することを示してる。
コンテキストの重要性
研究はまた、ツイートが送信されたコンテキストが使用される言語を決定する上で重要な役割を果たすことも示した。敵意は、重要な政治的イベントの周りでピークに達することが多く、社会的なコメントと政治の密接な関係を明らかにしている。
結論
このデータセットの作成は、イギリスの政治家を狙ったオンラインの敵意をより良く理解し、特定するためのステップだ。これは、政治的な文脈でこの問題に効果的に取り組むための専門的なツールの必要性を強調している。
敵意のあるコメントに関与する言語やアイデンティティ特性に焦点を当てることで、研究者たちはオンラインの虐待を減らすための未来の研究への道を開く重要な洞察を得ることができるんだ。
ソーシャルメディアが進化し続ける中で、一般市民との関わり方や、そこから生まれる敵意に対処する方法も進化しなきゃね。
もしMPたちが厚い皮膚とユーモアのセンス、そしてデジタルシールドを持っていれば、オンラインコメントの嵐を乗り越えられるかもしれないね!
オリジナルソース
タイトル: Hostility Detection in UK Politics: A Dataset on Online Abuse Targeting MPs
概要: Numerous politicians use social media platforms, particularly X, to engage with their constituents. This interaction allows constituents to pose questions and offer feedback but also exposes politicians to a barrage of hostile responses, especially given the anonymity afforded by social media. They are typically targeted in relation to their governmental role, but the comments also tend to attack their personal identity. This can discredit politicians and reduce public trust in the government. It can also incite anger and disrespect, leading to offline harm and violence. While numerous models exist for detecting hostility in general, they lack the specificity required for political contexts. Furthermore, addressing hostility towards politicians demands tailored approaches due to the distinct language and issues inherent to each country (e.g., Brexit for the UK). To bridge this gap, we construct a dataset of 3,320 English tweets spanning a two-year period manually annotated for hostility towards UK MPs. Our dataset also captures the targeted identity characteristics (race, gender, religion, none) in hostile tweets. We perform linguistic and topical analyses to delve into the unique content of the UK political data. Finally, we evaluate the performance of pre-trained language models and large language models on binary hostility detection and multi-class targeted identity type classification tasks. Our study offers valuable data and insights for future research on the prevalence and nature of politics-related hostility specific to the UK.
著者: Mugdha Pandya, Mali Jin, Kalina Bontcheva, Diana Maynard
最終更新: 2024-12-05 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2412.04046
ソースPDF: https://arxiv.org/pdf/2412.04046
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://zenodo.org/records/10809695
- https://anonymous.4open.science/r/ohtukmp-21D8
- https://huggingface.co/cardiffnlp/twitter-roberta-base-hate-latest
- https://huggingface.co/meta-llama/Meta-Llama-3-8B
- https://platform.openai.com/docs/models/gpt-3-5-turbo
- https://developer.twitter.com/en/docs/twitter-api/tweets/lookup/api-reference/get-tweets-id