言語と政治信条:分断された対話
この研究は、政治的な見解がソーシャルメディアの言葉にどのように影響するかを調べているよ。
― 1 分で読む
言語は様々な理由で時間とともに変化していくけど、これは異なる話し方が共存するところから始まることが多いんだ。例えば、地域やバックグラウンドが違う人たちが話す言葉は異なったりする。言語が変わる大きな要因の一つは政治的信念なんだ。人々が自分の政治的見解に基づいてグループ化し始めると、その見解を反映する言語を使うようになるかもしれない。この分断の進行は社会の中で大きな懸念になってる。
この研究は、アメリカの人々の間での言語の違いを、左派か右派の政治的信念に基づいて調べていて、ソーシャルメディアプラットフォームからのデータを使用してる。特にTwitterに焦点を当てて、左派と右派の人々の言語の使い方の違いを観察したんだ。
方法論
これらの違いを調べるために、約10,000人のユーザーからの約150万ツイートの大規模データセットを分析したよ。ユーザーを左寄りか右寄りに分けるために、フォローしているニュースアカウントを見たんだ。どのニュースソースに注目しているかを確認することで、彼らの政治的嗜好についての推測をしたのさ。
72の政治的偏向があることで知られるニュースアカウントから情報を集め、そのフォロワーを調べてユーザーをカテゴライズしたよ。ユーザーの行動や会話のトピックを調べることで、左派と右派の言語の違いを探ったんだ。
言語の変異
言語は自然に時間とともに変化するし、地域的、文化的、社会的な要因がその変化に影響を与える。この研究は、特に政治的分極化が言語の変異にどのように寄与しているかを調査してる。アメリカでは、政治的分極化は人々の住む場所や子育て、情報との接し方など、いろんな側面に影響を与えている。
ソーシャルメディアでは、人々は自分の政治的見解に合ったニュースソースをフォローする傾向があるから、話題や使う言葉が異なるようになる。特定のメッセージを強調するソーシャルメディアの役割を考えると、この分断を理解することが重要なんだ。
結果
私たちの分析では、政治的スペクトルの両側で言語の使い方に明らかな違いが見られたよ。多くのトピックは全ユーザーで共通だったけど、特定のテーマは一方のグループの方が目立ってた。アメリカ英語全体は理解できるけど、調査結果は政治的分断による誤解が生じる可能性があることを示してる。
具体的には、左寄りのユーザーは特定の非標準的な用語や絵文字をより頻繁に使う傾向があったのに対し、右寄りのユーザーは自分たちの信念に関連した政治用語や名前を多く使っていた。この違いは重要で、言語が分岐することで誤解が増え、さらなる分極化を引き起こす可能性があることを示唆してる。
データ収集プロセス
Twitterで使われる言語を分析するために、収集したツイートをフィルタリングして、無関係なコンテンツや非英語コンテンツを除外したよ。ユーザーの活動に関して厳格な基準を設けて、両方の政治的側のバランスの取れたサンプルのツイートを作成したのさ。特定のニュースソースのフォロワーのアカウントを調べることで、政治的傾向が正確に評価できるユーザーに絞ったんだ。
最終的なデータセットには、重複や関係のないハッシュタグ、その他のノイズデータを取り除いた後、2000万語以上が含まれてた。これだけのデータセットを使って、幅広い言語の使い方を捕らえることを目指したよ。
分析手法
言語の違いを理解するために、単語頻度分析、感情分析、意味の分岐評価など、いくつかの分析手法を用いたんだ。
単語頻度分析
ツイートに使われる特定の単語の頻度を調べることで、左寄りユーザーと右寄りユーザーの間でどの単語がよく使われるかがわかったよ。政治的な話題に関連する単語は、右寄りのユーザーのツイートでより頻繁に使われてたのに対し、左寄りのユーザーは若いオーディエンスに響くようなカジュアルな言葉や絵文字をよく使ってた。
感情分析
感情分析ツールを使って、ツイートの言語が持つ感情的なトーンを測ったよ。全体的に、左寄りのユーザーのツイートはよりポジティブな感情を表現する傾向があり、右寄りのユーザーはよりネガティブな感情を伝えることが多かった。この違いは、各グループが政治環境をどう認識し、特定のトピックに対してどう感じているかを示すヒントになるんだ。
意味の分岐
ツイートで使われる単語の意味を調べて、特定の用語が二つの政治グループで異なる意味を持つかどうかも見たよ。単語埋め込み技術を使って、特定の用語の意味が両サイドでどれだけ似ているか、あるいはどれだけ異なっているかを測定できた。
この分析で、言語の使い方がユーザーの政治的立場によって異なることがわかったんだ。単純に見える用語でも、異なる含意を持つことがあるから、コミュニケーションに混乱を招く可能性があるんだよね。
会話のトピック
両グループの会話のトピックをマッピングした結果、明確なテーマの違いが見られたよ。多くの一般的なトピックは共通してたけど、政治問題に関連する内容には顕著な違いがあった。左側は社会正義、日常生活、コミュニティの問題について話すことが多い一方で、右側は国家安全保障、伝統的価値観、政府政策に対する批判にもっと焦点を当ててた。
このパターンは、政治的信念が言語だけでなく、個人が関心を持ち、議論に値すると考えるトピックそのものをどう形作るかを示してる。
結果の意味
この研究の結果は、政治的に緊張した環境でのコミュニケーションを理解する上で重要な意味を持ってる。言語が分かれることで、誤解の可能性が高まり、その結果、分断が続くことになる。
教育者、政策立案者、コミュニケーターにとっては、言語の選び方や、それが異なるオーディエンスにどう解釈されるかに気を付ける必要性を示してる。グループ間にバリアができる中で、対話を促進することの重要性が、さらに強調されているんだ。
結論
言語は社会の変化や影響に適応する動的な存在なんだ。この研究は、政治的信念がソーシャルメディアでの言語使用にどう影響するかのスナップショットを提供してる。150万ツイートを分析することで、アメリカの左寄りと右寄りのグループ間の言語的な分断を示したのさ。
これらのトレンドを理解することは、社会がますます激化する分極化に悩む中で重要なんだ。言語が進化する中で、効果的かつ共感的にコミュニケーションをとる必要があることが、一層重要になってくる。今後の研究は、分極化された世界でのコミュニケーションのニュアンスをより深く理解するために、言語、メディア、政治の関係を探り続けるべきだよ。
タイトル: Evolving linguistic divergence on polarizing social media
概要: Language change is influenced by many factors, but often starts from synchronic variation, where multiple linguistic patterns or forms coexist, or where different speech communities use language in increasingly different ways. Besides regional or economic reasons, communities may form and segregate based on political alignment. The latter, referred to as political polarization, is of growing societal concern across the world. Here we map and quantify linguistic divergence across the partisan left-right divide in the United States, using social media data. We develop a general methodology to delineate (social) media users by their political preference, based on which (potentially biased) news media accounts they do and do not follow on a given platform. Our data consists of 1.5M short posts by 10k users (about 20M words) from the social media platform Twitter (now "X"). Delineating this sample involved mining the platform for the lists of followers (n=422M) of 72 large news media accounts. We quantify divergence in topics of conversation and word frequencies, messaging sentiment, and lexical semantics of words and emoji. We find signs of linguistic divergence across all these aspects, especially in topics and themes of conversation, in line with previous research. While US American English remains largely intelligible within its large speech community, our findings point at areas where miscommunication may eventually arise given ongoing polarization and therefore potential linguistic divergence. Our methodology - combining data mining, lexicostatistics, machine learning, large language models and a systematic human annotation approach - is largely language and platform agnostic. In other words, while we focus here on US political divides and US English, the same approach is applicable to other countries, languages, and social media platforms.
著者: Andres Karjus, Christine Cuskley
最終更新: 2023-09-04 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2309.01659
ソースPDF: https://arxiv.org/pdf/2309.01659
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。