Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# 計算と言語# 計算工学、金融、科学

ソーシャルメディアのストーリーが経済予測に与える影響

ソーシャルメディアのストーリーとその経済動向への影響を分析中。

― 1 分で読む


ソーシャルメディアの経済的ソーシャルメディアの経済的影響物語が金融予測に与える影響を評価する。
目次

この研究は、ソーシャルメディアで共有されるストーリーが経済にどう影響するかを探ってるんだ。これらのストーリーが人々の信念や行動を形成し、それが経済活動の変化につながる可能性があるって考えてる。私たちは、経済に関連する投稿を対象に、特にX(以前のTwitter)からのデータを見てるんだ。

自然言語処理NLP)の技術を使って、ツイートからこれらの物語を抽出し、要約してる。そして、これらの物語が将来の経済トレンドを予測できるかどうか、いろんな金融予測のタスクで試してるよ。

私たちの研究は、物語データと伝統的な経済モデルを組み合わせるのが難しいことを示してるけど、オンラインで見つかる経済ストーリーを分析するのに役立つ方法や洞察も提供してる。この研究は、ストーリーテリングと経済の関係を調べる科学者にとって重要なステップなんだ。論文が受理され次第、データを共有する予定だよ。

ナラティブ経済学

ナラティブ経済学は、人気のあるストーリーが時間とともにどう変化し、人々の経済的選択とどう相互作用するかを見てる。ここでの重要なアイデアは、これらのストーリーが経済の変化を促す可能性があるってこと。これは特に、広く共有されたストーリーが何百万もの人々の決定に影響を与えるときに面白いんだ。

でも、この考え方はマクロ経済に適用する場合、ミクロ経済に比べてもっと複雑になる。いろんな要素が絡むし、様々なトピックをカバーしたストーリーが必要で、正確な因果関係を特定するのが難しいから。物語が実際に経済の変化を引き起こしているって証明するのは難しいんだ。代わりに、我々はソーシャルメディアからのナラティブを分析し、それがマクロ経済の変化をどれだけ予測できるかをテストするためにNLP手法を提案してる。

経済に関連するナラティブをキャッチするために、2つのTwitterデータセットを作成したよ。これらのナラティブを抽出して、予測に活用するための2つの異なるNLPの使い方を探ってる。まず、ツイートを直接使って予測モデルを構成し、その中のストーリーをキャッチする。次に、LLM(大規模言語モデル)を使ってこれらのナラティブを抽出し、要約して、さらに別のデータセットを作成する。

結果として、ストーリーはデータセットに存在するけど、それを他の方法と組み合わせても、金融データだけを使う場合と比較して、経済予測がほんの少ししか改善されないことがわかった。このことは、マクロ経済設定におけるナラティブ経済学理論の効果について疑問を投げかける。

研究の貢献

私たちの研究は、ナラティブ経済学の理解にいくつかの方法で貢献してる:

  1. マクロ経済の変化を予測する上でのナラティブの役割を調べるためのフレームワーク。
  2. Twitterからの2つと、LLMの分析に基づく1つの、3つの注意深く作られたデータセット。
  3. 私たちの手法を示し、経済におけるナラティブの影響をより良くテストする新しいモデルの必要性を強調した詳細な分析。

データリソース

Twitterデータセット

経済ナラティブをキャッチするためにTwitterを選んだのは、リアルタイムで多様な意見が反映されるから。私たちの2つのデータセットは、経済に関連するツイートに焦点を当ててる。特定の株や企業に関連したツイートだけを見た以前の研究とは異なり、私たちのアプローチはより広範な話題とストーリーをカバーしてる。

最初のデータセットは、Twitterの初期からCOVID-19パンデミックまでをカバーし、2つ目のデータセットは2021年後半からのトレンドを扱ってる。どちらのデータセットも、特定のキーワードを使って慎重に編纂され、英語のオリジナルツイートのみを含む。

パンデミック前Twitterデータセット

TwitterのAPIを使って、2007年1月から2020年12月までの240万のツイートの大規模データセットを集めた。このデータセットは、ビジネス、政治、時事問題など、経済に関連する6つの分野をカバーしてる。時間をかけてツイートを集めるために、対象となるキーワードを使用した。

より広いリーチを持つツイートを優先するために、まずフォロワー数に基づいて200件の最も人気のあるツイートを集めてから、バイアスを減らすためにランダムに100件を抽出した。このプロセスで、各トピックについて約40万のツイートが得られ、約25万人のユーザーから寄与された。

2021年以降のTwitterデータセット

このデータセットは、LLMを使った分析のために特別に作成され、2021年9月から2023年7月までのツイートをカバーしてる。ビジネスと経済に関連するトピックに焦点を当て、最低でも1,000人のフォロワーを持つユーザーのツイートに制限した。精査した結果、1,255人のユーザーから2,881ツイートを集めた。

マクロ経済指標

私たちは、3つの重要な経済指標に焦点を当ててる:

  1. フェデラルファンド金利(FFR):これは、銀行が準備金を夜間に貸し出す際の金利。FFRは重要な金融政策ツールであり、経済の健康状態を測るために広く監視されてる。
  2. SP 500:この株式市場指数は、アメリカの500社の上場企業のパフォーマンスを追跡するもの。投資家の信頼感を反映しており、経済のバロメーターと見なされてる。
  3. CBOEボラティリティ指数(VIX):この指数は、SP 500オプション価格に基づく将来のボラティリティに対する市場の期待を測定し、しばしば投資家の恐怖や市場の安定を示す。

これらの指標は、ナラティブデータが経済トレンドを予測する可能性を評価するのに理想的なもので、それは公の意見に非常に敏感だから。

実験設定

ナラティブが金融の変化を予測するのに役立つかどうかをテストするために、いくつかの予測タスクを設計した。各タスクは、異なる時間枠での3つの経済指標のうちの1つをターゲットにしてる:次の日、次の週、次の月。

回帰タスクでは平均二乗誤差を、分類タスクでは正確さに基づいてモデルを評価してる。また、様々なベースラインと比較して、そのパフォーマンスを評価してる。

予測タスク

ナラティブの予測能力を3つの時間枠で評価する:

  • 次の値:指定された時間枠でのターゲット値を予測する。
  • パーセンテージ変化:前日からのターゲット値の変化を予測する。
  • 方向の変化:ターゲット値が増加するか減少するかを分類する。

金融ベースライン

また、いくつかのベースラインモデルを作成した:

  • 前回と同じ:次の値は前回と同じ。
  • 逆の前回:次の値は前回の逆。
  • 週間多数決:前週のトレンドの多数決。
  • 上昇予測者:常に増加を予測する。
  • 下降予測者:常に減少を予測する。

モデル

入力に基づいてモデルを3種類に分類した:

  1. 金融(F):歴史的な金融データに依存するモデル。
  2. テキスト(T):ツイートからのテキストデータのみに基づくモデル。
  3. テキスト金融(TF):テキストデータと金融データの両方を組み合わせたモデル。

目標は、ナラティブと金融データを組み合わせることで予測が向上するかを見ること。

金融モデル

伝統的な機械学習モデル、例えば線形回帰や新しいモデルとしてDA-RNNやT5を使用した。これらのモデルは歴史的な金融値を見て予測を行う。

テキストモデル

テキストモデルでは、異なるテキスト表現を使用した。これには:

  • デイリーセンチメント:ツイートの全体的なトーンをセンチメント分析を使って捉える。
  • 埋め込みベースの表現:事前にトレーニングされたモデルを使用してツイートから意味を導出する。

テキストと金融モデルの統合

テキストモデルと金融モデルを組み合わせて予測を向上させるために取り組んだ。戦略には簡単な連結と、前の値をナラティブデータと一緒に使うDA-RNNのようなもっと複雑なモデルが含まれる。

テキストデータのナラティブ分析

ナラティブは私たちの入力データの基礎となるため、まずはデータセット内の存在を確認する。

ツイートのナラティブ分析

Twitterデータセットからナラティブを分析した。これにより、Brexitや金融危機のような特定のストーリーが時間とともにどう変動するかがわかり、実世界の出来事を反映していることが示された。

LLMベースのナラティブ分析

次に、LLMがツイートからナラティブを抽出し、要約する能力を探った。2021年以降のデータセットにわたる分析を生成し、ツイートと市場への影響を結びつけて、これらのナラティブが金融トレンドにどう影響するかの洞察を提供した。

LLM分析を使った予測

ツイートの使用から、LLMが生成した分析も含めるようにシフトした。これにより、予測を行う際により微妙な理解とリッチなコンテキストが得られるようになった。

センチメントベースの翌日の予測

ツイートのデイリーセンチメントスコアを使って、次の日のFFR予測のために様々な伝統的機械学習モデルをテストした。結果は、金融データを組み込んだモデルが、テキストデータのみを依存したモデルを大幅に上回ることが示された。

時系列予測のための埋め込み

ツイートからより複雑な情報をキャッチするために、埋め込み表現に目を向けた。データに存在するダイナミクスをよりよく捉えることを目指して、これらのモデルを時系列アプローチで評価した。

LLM分析を使った予測

ツイートを直接分析した後、LLMが生成した分析を用いて金融指標について予測を行った。この方法は期待が持てるものの、モデルの予測には一貫性がないことも示され、さらなる精緻化の必要性が示唆された。

結果の議論と意味合い

この研究の結果は、ナラティブ経済学のアイデアについて考えさせる。データセット内にナラティブを特定し、分析のためのNLP技術を確立したにもかかわらず、これらのストーリーがマクロ経済予測に与える影響は限られていた。ナラティブデータを含む私たちのモデルは、金融データのみで構成されたモデルよりも明らかに優れていなかった。

LLMがソーシャルメディアからマクロ経済のナラティブを学ぶことができたものの、この知識を予測に活かす実用的な応用は不確かである。このことは、特にマクロレベルでナラティブ単体が経済の変化を駆動または予測できる程度についての質問を呼び起こす。

制限事項

この研究はいくつかの課題に直面した。短期的な予測は市場の予測不可能な性質により困難である。効率的市場の理論によると、公共の情報は価格にすぐに反映されることが多く、これがナラティブベースの予測の有効性を制限する可能性がある。

また、限られた数の経済目標を調査した。様々な金融ターゲットやタスクを含めることで、ナラティブの影響の強い証拠が得られるかもしれない。

ナラティブが発生してから経済指標に影響を与えるまでの時間差を特定するのは複雑だ。分析が徹底していても、ナラティブはより微妙な定義や明確な特定プロセスを必要とするかもしれない。

最後に、公開されているLLMに依存していて、より高度なモデルを使用することで結果が改善される可能性がある。経済予測における技術の使用にはリスクが伴うことを認識することが重要で、不適切な使用が悪影響を及ぼす可能性がある。

結論

この研究は、ソーシャルメディアにおけるナラティブと主要な経済指標との関係を調査した。経済に関連するツイートを分析することで、LLMがこれらのナラティブからより正確な予測を学ぶことができるかを理解しようとした。

私たちの初期の発見は、ナラティブは抽出できるものの、経済予測の改善に与える影響は大きくなかったことを示している。この洞察は、ナラティブが経済に与える影響を評価するためのより洗練されたモデルや方法の未来の研究への扉を開く。

全体的に、この研究は経済予測の複雑さを浮き彫りにし、ナラティブが重要かもしれないが、それがマクロ経済行動に与える役割はさらに探求される必要がある質問であることを示唆している。私たちの経済的風景を形作るストーリーをよりよく理解する可能性は広大であり、この研究はこの分野でのさらなる調査への足がかりとなる。

オリジナルソース

タイトル: Can LLMs Learn Macroeconomic Narratives from Social Media?

概要: This study empirically tests the $\textit{Narrative Economics}$ hypothesis, which posits that narratives (ideas that are spread virally and affect public beliefs) can influence economic fluctuations. We introduce two curated datasets containing posts from X (formerly Twitter) which capture economy-related narratives (Data will be shared upon paper acceptance). Employing Natural Language Processing (NLP) methods, we extract and summarize narratives from the tweets. We test their predictive power for $\textit{macroeconomic}$ forecasting by incorporating the tweets' or the extracted narratives' representations in downstream financial prediction tasks. Our work highlights the challenges in improving macroeconomic models with narrative data, paving the way for the research community to realistically address this important challenge. From a scientific perspective, our investigation offers valuable insights and NLP tools for narrative extraction and summarization using Large Language Models (LLMs), contributing to future research on the role of narratives in economics.

著者: Almog Gueta, Amir Feder, Zorik Gekhman, Ariel Goldstein, Roi Reichart

最終更新: 2024-06-17 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2406.12109

ソースPDF: https://arxiv.org/pdf/2406.12109

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事