Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# 計算と言語# 社会と情報ネットワーク

政治ニュースを分析する: 新しいアプローチ

政治ニュースを深く公平に検討する方法。

Evan Dufraisse, Adrian Popescu, Julien Tourille, Armelle Brun, Olivier Hamon

― 1 分で読む


政治ニュース分析フレームワ政治ニュース分析フレームワーク政治メディア報道を分析する新しいシステム
目次

今の時代、多くの人が政治ニュースを求めてインターネットにアクセスしてるよね。情報が溢れてるから、全部を理解する方法を見つけるのが大事だ。政治の研究者や専門家たちは、自動的にコンテンツを分析するツールを使って、政治的なテキストを理解しようとしてるんだ。このツールは、客観的な事実と主観的な意見の両方を考慮しなきゃ役に立たない。

現在の方法では、客観的な事実については面白い洞察を得られるけど、主観的な意見の理解には苦労してる。一般的には全国ニュースに注目して、説明が難しいことが多いんだ。私たちは、両方の観点を組み合わせた新しいテキスト分析方法を提案するよ。この方法では、ニュースの意見を詳しく見ることができるんだ。

先進的な言語処理手法やさまざまな情報源を使って、みんなが理解しやすい結果を出してる。私たちのアプローチは、大量のフランスのニュース記事でテストされてるけど、他の言語や国でも使えるよ。

政治ニュースはめっちゃ重要で、これをどう解釈するかが政治的な行動や出来事の見方を形作るんだ。オンラインの膨大な政治ニュースを分析するには自動化が必要だし、この分析は徹底していて、政治に関わる人たちに役立つように適応できるものでなきゃいけない。

今あるツールのほとんどは客観的な測定に焦点を当てたり、基本的な主観的な洞察を提供したりしてる。私たちの方法「Textmap」は、エンティティとその関係を特定するけど、感情を基本的なレベルでしか分析できないから、深い感情分析ができないんだ。私たちは、ニュースメディアを政治的な偏りでグループ化するために引用グラフも使って、テレビやラジオの放送からデータを集めて政治的バイアスを推定してる。

最近、研究者たちは大規模な言語モデルを使ってニュース記事の政治的傾向を分類しようとしてるけど、これらの方法には詳細や説明が不足してる。政治的な文脈が変わると、新しいデータセットを作成する必要もあるしね。これらの問題に対処するために、私たちは客観的な事実と主観的な洞察の両方を全体として提供するニュース分析システムを提案するよ。

私たちが提供する洞察は、ニュースメディア、政治的トピック、個人、そして人口統計グループの視点を柔軟に組み合わせることができるんだ。そのために、最新の言語処理技術、情報収集方法、そしてニュースメディアに関するメタデータを組み合わせてる。特に、ターゲット依存の感情分類を使って、記事の詳細な視点を得るんだ。

私たちのフレームワークは、複数の国で効率的に機能できるように作られてて、私たちの処理ツールは多言語に対応してるし、私たちの知識ベースはどんな政治的文脈にも適してる。私たちはフランスの政治ニュースのコレクションを使ってこれをデモンストレーションしてるよ。

主な発見

私たちの発見は、いくつかの重要なポイントを明らかにするよ:

  1. 主要なニュースメディアは主流の政治的視点を比較的均等に提示してるけど、極端な左派と右派の見解にはバイアスがある。
  2. 政治的な見解に関連する感情や言及は、重要な政治的トピックによって変わる。
  3. 概して、感情スコアはほとんどネガティブで、ニュースメディアによってばらつきがある。
  4. 政治家に関連するポジティブとネガティブな感情スコアは、一般的に人々がその行動をどう認識するかに相関してる。
  5. ニュースでの言及は男性政治家を優先する傾向があるけど、女性政治家は一般的にもっとポジティブな感情を受け取ることが多い。
  6. 年配の政治家が若い政治家よりも多く言及される。
  7. フランスの半大統領制はニュース報道に影響を与えていて、しばしば大統領や大統領候補が強調される。

これらの洞察はさまざまなグループに役立つよ。ニュースメディアは自分たちの立ち位置を評価して、公共に理解されやすくなることができる。社会科学者は、オンラインでの政治的な風景がどのように表現されているかを学べるし、政治グループは自分たちの活動がどのように報道されているかを追跡できる。市民はニュース報道の潜在的なバイアスにもっと気づけるようになるんだ。

関連研究

メディア分析は、政治学や経済学などのさまざまな分野にルーツがあり、これらの分野のツールや発見を活用してる。政治的、テーマ的、あるいは人口統計的なバイアスを理解するのは重要だ。研究によれば、女性は異なる国のニュースメディアでしばしば過少表現されてるって。例えば、比例代表制のある国では男性政治家がより多く報道される一方で、英語のニュースメディアでは女性の代表が不足してるって他の研究が示してる。

特定の国向けにメディアの性別バイアスを追跡するツールも開発されてるよ。性別を超えて、いくつかの研究では地方新聞におけるトピック関連のバイアスを調べてる。他の研究では、ドイツのニュースの単語バイアスを調査し、政治的な見解が放送メディア全体で均等に表現されていないことがわかってる。また、フレーミング-特定の事実を他の事実よりも強調する行為-がメディアコンテンツにどう影響するかもいくつかの研究で調査されてる。

最近では、立場でラベル付けされたデータベースを使って、立場分類のための言語モデルを統合的にトレーニングする手法が使われてる。ただ、これらの方法はメディアバイアスを分析するための有用なツールを提供するけど、コンテンツの感情的な部分を見落としがちなんだ。このギャップは、政治における感情分類のリソースが不足していることから生じてる。ターゲット依存の感情分類は、特定のエンティティに対する感情を予測できて、ニュースメディアの見解をより明確に示すことができるんだ。

でも、ニューステキストは分析が難しいんだ。感情は通常、間接的に表現されるか、1つの文の中で複数のターゲットと一緒に表現されるから。

ニュース処理フレームワーク

コーパス収集

私たちは、2016年1月から2022年12月までの間に280以上の多様なフランスのニュースメディアからニュース記事を収集してデータセットを構築したよ。HTMLから記事のテキストを抽出することで、幅広いコンテンツを確保したんだ。重複を避けるために、MinHashLSHという方法を使って記事をフィルタリングした。最終的に、200文字以上の内容を含む457,000以上の記事を保持したよ。

エンティティ検出

次に、記事を文に分割して、フランス語用にデザインされた特定の言語モデルを使ってエンティティを特定した。私たちの結果では、コーパス内に数百万の人々の言及が示されたよ。

エンティティリンク

エンティティ検出でのあいまいさをクリアにするために、特定されたエンティティを有名なデータソースであるWikidataにリンクした。成功率は95%以上だったよ。

知識ベースの利用

リンクされたエンティティから、政治家に関する情報を集めた。性別や政党などの情報ね。ParlGovというシステムからは、政党の政治的な方向性を得て、それを分析用のスケールに簡略化したんだ。

ターゲット依存の感情分類

次に、ニュースでのさまざまなエンティティに対して表現された感情を特定することに焦点を当てたよ。多くの課題があったけど、政治的エンティティに対する感情を分類するために設計された特定のデータセットを使ってモデルをトレーニングしたんだ。これで、感情をネガティブ、ニュートラル、ポジティブとして評価できたよ。

トピック分析

さまざまな政治的テーマを分析するために、関連するニュース記事を気候変動や腐敗などのトピックに分類した。情報検索アプローチを使用することで、柔軟にトピックを定義することができたんだ。

政治ニュース分析

この研究を通じて、ニュースにおける政治的表現の詳細な検証を実現し、客観的かつ主観的な視点を組み合わせたよ。

メディア指向の分析

ソース感情

私たちの発見では、すべてのニュースメディアで平均的にネガティブな感情が示されたけど、メディアによってこの感情は大きく異なったよ。特に低いスコアを持つメディアもあって、専門家による分類でそれぞれの政治的傾向が確認された。逆に、地方のニュースメディアや経済メディアは、しばしば感情スコアが高かった。

政治的方向性のマッピング

言及と感情スコアを集計することで、ニュースの中でのさまざまな政治的方向性の表現を評価した。言及の数とこれらの方向性に関連する感情との間に直接の相関はなかったから、両方の分析が補完的な洞察を提供することがわかったんだ。

トピック指向の分析

政治トピックの探求では、特にCovid-19の健康影響やウクライナ戦争についての中道的な見解が主導的だった。腐敗については、中心右派の見解が重要人物を含むスキャンダルのためにより多く言及されることがあったよ。

政治家指向の分析

最も多く言及された政治家と彼らの感情スコアを見たよ。全体的な言及は大統領職に非常に集中していた。特に、さまざまな政治家に対する感情は幅広く異なっていて、ある政治家には明確なネガティブな認識があった一方で、他の政治家には好意的な言及があったよ。

性別表現

私たちの研究では、ニュースメディアで男性が女性よりも多く言及されることを確認した。フランスの政治における女性の代表は比較的高いけど、ニュースでの言及率はかなり低くて、依然として過少表現が続いていることを示してるよ。

年齢表現

ニュースで言及される政治家の平均年齢は、現在のフランスの政治家の平均年齢よりもかなり高いことがわかった。これは、政治的な議論において年配の人物への偏りがあることを示してる。

限界

私たちの分析にはいくつかの限界があるよ。データセットは主に古典メディアを含んでいて、ソーシャルメディアを欠いているから、より広範な洞察が得られないかもしれない。また、記事の数や言及は異なるニュースメディア間で大きく異なっていて、意見の表現に影響を与えてる。

結論

この研究では、さまざまな政治のステークホルダーにとって役立つニュース分析フレームワークを開発したよ。高度な言語処理手法、情報検索、そして構造化データを組み合わせて、政治的表現をよりよく理解できるようにしたんだ。得られた洞察は、ニュースで表現される感情の明確な視点を提供し、バランスの取れた報道の必要性を示してる。結果は、いくつかの進展があったものの、政治ニュースにおける人口統計のより公平な表現を達成するためにはまだ多くの作業が必要であることを示してる。

このフレームワークは、異なる国や言語の政治ニュースを分析するために適応可能で、世界的な政治的表現の理解をより包括的にすることができるんだ。この結果は、ニュースメディアが報道の公正とバランスを追求する必要性を強調してるよ。

オリジナルソース

タイトル: Combining Objective and Subjective Perspectives for Political News Understanding

概要: Researchers and practitioners interested in computational politics rely on automatic content analysis tools to make sense of the large amount of political texts available on the Web. Such tools should provide objective and subjective aspects at different granularity levels to make the analyses useful in practice. Existing methods produce interesting insights for objective aspects, but are limited for subjective ones, are often limited to national contexts, and have limited explainability. We introduce a text analysis framework which integrates both perspectives and provides a fine-grained processing of subjective aspects. Information retrieval techniques and knowledge bases complement powerful natural language processing components to allow a flexible aggregation of results at different granularity levels. Importantly, the proposed bottom-up approach facilitates the explainability of the obtained results. We illustrate its functioning with insights on news outlets, political orientations, topics, individual entities, and demographic segments. The approach is instantiated on a large corpus of French news, but is designed to work seamlessly for other languages and countries.

著者: Evan Dufraisse, Adrian Popescu, Julien Tourille, Armelle Brun, Olivier Hamon

最終更新: 2024-08-20 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2408.11174

ソースPDF: https://arxiv.org/pdf/2408.11174

ライセンス: https://creativecommons.org/licenses/by-sa/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事