NFLファンのコメントにおける言語バイアス
NFLファンがゲーム中にどんなふうにバイアスを言葉で表現するかを調べてる。
― 1 分で読む
近年、私たちの言葉が異なるグループに対する見方にどれだけ影響を与えるかについて、みんながますます意識するようになってきたよね。たとえば、チームについての話し方が、自分のチームに対する偏見を見せることがあるんだ。特にサッカーなどのスポーツでは、ファンがオンラインフォーラムで自分の感情を表現することが多いから。コメントには、使われる言葉や選手の呼び方から、偏見が見えることがあるんだ。
この研究では、NFLの試合中にファンが書いたコメントを見てみたよ。試合がライブの時にファンが投稿した600万以上のコメントを集めたんだ。自分のチームと相手チームについての話し方を調べることで、言葉がどう偏見を反映し、感情がコメントにどんな役割を果たすのかを理解しようとしてるんだ。
背景
グループ間の偏見
グループ間の偏見っていうのは、人々が他のグループよりも自分のグループを好むことを指すよね。これは、チームについて話すときの支持や批判の表現に見られるんだ。人々は自分のチームについてはポジティブに話し、相手チームに対してはあまり良い言葉を使わないことが多い。言葉の中のこれらの偏見を理解すると、特定のステレオタイプがコミュニケーションにどれだけ根付いているのかが見えてくるんだ。
スポーツにおける言語の使用
スポーツは言語を研究するのに特別な領域なんだ。ファンは自分のチームに対して非常に感情的に投資しているから。試合中、彼らはソーシャルメディアで自分の考えをシェアすることができて、どのように自分のチームや相手チームについて言及するかを調べることができるんだ。使われる言葉は、どんな態度や偏見が隠れているのかを示すことがあるよ。
私たちの研究では、RedditのNFL試合のスレッドからコメントを集めたよ。ファンが試合中に議論するためのスレッドがあるから、ゲームに参加している両チームの視点を得ることができたんだ。
2021-22年と2022-23年のNFLシーズンのコメントを集めて、試合が進行中のものをフィルタリングしたよ。生のデータセットには、さまざまな試合からの600万以上のコメントが含まれていて、それぞれには試合中の勝利確率がリンクしてる。このリアルタイムの試合の進行状況をもとに、ファンの発言がどう影響されるかを分析できるんだ。
ファンのコメントを理解する
リファレンスのタグ付け
分析の重要な部分の一つは、ファンが誰について言っているのかをタグ付けすることだったよ。自分のチーム、相手チーム、または他のチームについて話しているかを分類したんだ。これらのリファレンスは3つのグループに分けたよ:
- イングループ: コメントを書いた人が支持しているチーム。
- アウトグループ: 特定の試合の相手チーム。
- 他: 試合に関与していない他のチーム。
リファレンスにタグを付けることで、ファンがチームや対戦相手についてどのようにコミュニケーションをとっているのかのトレンドやパターンを後で分析できるようにしたんだ。
注釈
タグ付けの正確性を確保するために、アメリカンフットボールやコメントの文脈を理解した注釈者と一緒に作業したんだ。彼らは、人やチーム、サブグループを指す言葉やフレーズを強調して、適切なタグを付けた。このプロセスでは、ファンがイングループとアウトグループをどう見ているかを判断するために、コメントの背後にある意味を慎重に考えたよ。
注釈のプロセスを通じて、多くのコメントには暗黙のリファレンスが含まれていることがわかったんだ。つまり、チームの名前を直接言わなくても、文脈からどのグループが話されているのかが明らかになるコメントのこと。たとえば、「ポイントを取らなきゃ」と言うファンは、自分のチームを支持していることを暗に示しているんだ。
コメントの偏見を分析する
言語使用のパターン
かなりの数のコメントにタグを付けたところで、言語使用のパターンを分析し始めたよ。顕著な観察点は、イングループやアウトグループへの言及の可能性が、チームの勝利確率によってどう変わるかだった。チームの勝つ可能性が高まると、ファンは自分のチームについて言及することが少なくなり、逆に相手チームや直接的な言及なしでコメントすることが多くなるんだ。
これは、ファンが自分のチームがうまくやっていると感じると、チームとの直接的な同一視から焦点がずれるかもしれないことを示唆してる。また、チームが苦戦しているときは、チームの識別を強める傾向があり、パフォーマンスについてもっとコメントするかもしれないんだ。
言語と感情
ファンがコメントで自分を表現する方法は、試合中の感情とも密接に関連しているんだ。チームが勝っているときは、コメントはしばしば興奮、自信、ゲームに関するある程度の抽象化を反映するよ。ファンは「私たちは止まらない!」みたいなことを言って、特定の選手やアクションを名指ししないことが多いんだ。
その一方で、チームが負けているときは、コメントはより批判的で詳細になる。ファンは特定の選手やプレイに言及することが多く、フラストレーションや失望を反映するんだ。この感情的な側面は、言語がどうイングループ間の偏見に影響するかをさらに際立たせているね。
分析における大規模言語モデル
コメントのタグ付けのために、大規模言語モデル(LLM)を使ったよ。これらのモデルは、大規模な言語を分析してパターンを特定することができ、コメントを素早く効率的にタグ付けする手助けをしてくれるんだ。私たちはデータセットを使ってモデルを訓練し、言語がスポーツ関連の議論における偏見を反映する方法をより深く理解しようとしたんだ。
モデルのパフォーマンス
さまざまなモデルのセットアップを試して、イングループ、アウトグループ、その他のラベルでコメントをタグ付けできる能力を見たよ。LLMは強いパフォーマンスを示していて、しばしば人間の注釈者を超えるタグ付けの精度を達成していた。ただ、勝利確率を効果的に組み込むのが難しかったことがわかったんだ。偏見を特定できても、試合の状態にリンクするのがあまりうまくいかなかったんだ。
パフォーマンスからの洞察
モデルの実験を通じて、ファンのコメントが勝利確率に基づいて変わることがわかったよ。チームの勝利確率が低いとき、ファンはより多く自分のチームを直接言及することで忠誠を示す傾向があった。一方で、勝利確率が高いときは、特定のリファレンスから抽象化する傾向が高まるんだ。
これらの発見は、言語が試合についての情報を伝えるだけでなく、ファンの感情状態やチームへの偏見も明らかにすることを反映しているよ。
結論
要するに、私たちの研究はNFLファンが試合中に使用する言語が、根底にある偏見や感情的反応をどのように反映しているかを強調しているんだ。オンラインフォーラムからの豊富なコメントデータセットを調べることで、ファンがチームに対する支持や批判をどのように表現しているかを示したよ。大規模言語モデルの活用が、これらのコメントをスケールで分析するのに役立ち、手作業では発見しにくいトレンドやパターンを明らかにしたんだ。
この結果は、言語が偏見を表現する強力なツールであることを強調していて、これらのダイナミクスを理解することで、さまざまな文脈における異なるグループについてのコミュニケーションについての幅広い議論に貢献できるんだ。今後も、他のスポーツや社会的相互作用における類似の言語パターンを探求して、言語におけるグループ間の偏見についての理解を深めていきたいと思ってるよ。
タイトル: Do they mean 'us'? Interpreting Referring Expressions in Intergroup Bias
概要: The variations between in-group and out-group speech (intergroup bias) are subtle and could underlie many social phenomena like stereotype perpetuation and implicit bias. In this paper, we model the intergroup bias as a tagging task on English sports comments from forums dedicated to fandom for NFL teams. We curate a unique dataset of over 6 million game-time comments from opposing perspectives (the teams in the game), each comment grounded in a non-linguistic description of the events that precipitated these comments (live win probabilities for each team). Expert and crowd annotations justify modeling the bias through tagging of implicit and explicit referring expressions and reveal the rich, contextual understanding of language and the world required for this task. For large-scale analysis of intergroup variation, we use LLMs for automated tagging, and discover that some LLMs perform best when prompted with linguistic descriptions of the win probability at the time of the comment, rather than numerical probability. Further, large-scale tagging of comments using LLMs uncovers linear variations in the form of referent across win probabilities that distinguish in-group and out-group utterances. Code and data are available at https://github.com/venkatasg/intergroup-nfl .
著者: Venkata S Govindarajan, Matianyu Zang, Kyle Mahowald, David Beaver, Junyi Jessy Li
最終更新: 2024-10-31 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2406.17947
ソースPDF: https://arxiv.org/pdf/2406.17947
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。