ボラティリティ予測モデルの評価: HAR vs 機械学習
株のボラティリティ予測におけるHARモデルと機械学習の比較研究。
― 1 分で読む
金融の世界では、株価がどう変動するかを予測するのがめっちゃ重要だよね。特に、価格が上下する幅、つまりボラティリティを理解するのが大事。これをうまくやれば、リスク管理やオプションの価格設定、投資戦略の向上に役立つんだ。
ボラティリティ予測に役立つ方法の一つが、異質自己回帰(HAR)モデル。これは、前日や前週、前月の平均ボラティリティを見て次に何が起こるかを予測するアプローチ。シンプルだけど、HARモデルは複雑な機械学習(ML)技術と比べてもよく機能するから人気なんだ。
最近、機械学習が金融分野で注目を集めてるけど、伝統的な方法では見逃しがちなデータのパターンを見つける可能性がある一方で、これらの方法が常にHARのような簡単なモデルより優れているかには疑問がある。
私たちの研究では、HARモデルがボラティリティ予測で様々な機械学習技術とどのように比較されるかに焦点を当ててる。HARモデルの設定方法、特にデータウィンドウのサイズや予測更新の頻度が、その精度に重要な役割を果たすことが分かったんだ。機械学習モデルをしっかり調整しても、HARがきちんと設定されていれば、性能で勝ることはなかったよ。
HARモデルの大きな利点の一つは、そのわかりやすさ。複雑な数学に深入りせずに、予測を理解できるっていうのが、みんなにとっていいところ。HARモデルを動かすのにかかる計算コストも、より処理能力が必要な機械学習モデルよりも低いんだ。
パフォーマンスを評価するために、QLIKEや平均二乗誤差(MSE)などの指標を使ったんだけど、一貫してHARモデルは、実現ボラティリティやVIX(市場のボラティリティ指標)を使ったときに、機械学習アプローチよりも良い結果を出してた。これは、モデルのフィッティングを慎重に選ぶことの重要性を示してるね。
全体的に見て、私たちの研究は、HARモデルが適切なフィッティング方法で強力な予測ツールになれることを示しているし、特定のタスクに対する機械学習アプローチの実務的限界についての疑問も浮かび上がってきたんだ。
イントロダクション
株価変動の正確な予測は金融において超重要。これができればトレーダーはリスクから身を守り、オプションの価格を設定し、賢い投資判断ができるんだ。最近、株のボラティリティモデル化について多くの研究が進んでいるよ。
HARモデルは、そのシンプルさと効果的なところが際立ってる。過去のデータの平均に基づいて次の日の期待されるボラティリティを計算するんだ。この基本的な性質にもかかわらず、HARモデルは常に良い予測能力を示して広く使われている。
機械学習はボラティリティ予測に新しい可能性をもたらした。これらの方法は、金融データの複雑な関係を見つける可能性があるけど、機械学習が進んでいるからといって、常にHARのようなシンプルなモデルよりも優れた結果を出すわけじゃないと考える人もいる。
私たちの分析では、機械学習が強力とはいえ、HARモデルよりも株のボラティリティ予測には必ずしも良い結果を出すわけじゃないと論じてる。この研究では、HARモデルがデータにどうフィットするかの感度を調べてる。
HARモデルを推定する際には、トレーニングウィンドウのサイズ(どれだけ過去のデータを使うか)とモデルを更新する頻度(再推定の頻度)を選ぶことが重要。私たちの調査結果は、これらの選択がモデルの精度に大きく影響することを示唆しているよ。
もしモデルを毎日更新しなかったら、予測性能が大幅に落ちちゃう。一方で、大きなトレーニングウィンドウは予測誤差を下げる傾向があるんだ。大きなウィンドウや頻繁な更新が計算コストを増やすかもしれないけど、HARモデルの効率性によってそれがあまり問題にならないんだよ。
関連文献の探求
ボラティリティ予測の改善を目指した研究がたくさんある。機械学習を含む様々な方法が、従来のアプローチを超えた予測を試みてる。
いくつかの研究者は、予測のために最小絶対収縮選択オペレーター(ラッソ)を使うことを探った。この技術はデータから重要な特徴を選ぶことができ、HARモデルの構造を回復するのに有望だって示されてる。さらに、経済指標などの追加変数を組み込むことで、予測を改善する研究もあるよ。
機械学習が進化しても、HARモデルが特定の場面で競争力があるか、むしろ優れているという研究が多い。この点は、HARモデルが適切にフィットされ、適切なトレーニングと再推定の選択がされた場合に特に当てはまるんだ。
私たちの研究でも、機械学習がHARモデルを上回ることは常になかったし、特にHARが最適なパラメータでフィットされていたときにはそうだった。以前の研究の差異は、研究者がモデルを指定した方法に起因することが多く、予測ツールを構築する際に慎重な考慮が必要であることを強調しているよ。
データと方法論
私たちの分析では、主要な米国取引所で取引されている株に注目し、多様な株の包括的なデータセットを調べた。これにより、予測モデルの徹底的な評価が可能になったんだ。
予測ボラティリティを測るために、実現ボラティリティという指標を使った。これは、複数の取引所からの高頻度取引データを使って株価のボラティリティを推定するっていう方法なんだ。これは金融文献で信頼性の高い結果をもたらすことが知られてる方法を使ったよ。
HARモデル自体は、過去のボラティリティの読み取り値に加えて、市場全体のボラティリティの指標であるVIXを組み合わせて予測力を強化してる。このアプローチは、シンプルさを保ちながらも広範な市場動向にアクセスできるようにしてるんだ。
私たちの研究では、HARモデルを普通最小二乗法(OLS)と加重最小二乗法(WLS)を使って推定し、それぞれのパフォーマンスを個別に評価し、複数の株にわたるプール推定を通じて評価した。
また、これらの伝統的なモデルを様々な機械学習技術と比べた。ラッソやランダムフォレスト、勾配ブースティング、フィードフォワードニューラルネットワークなどが含まれていて、これらのアプローチそれぞれの強みと弱みを並行比較で評価したよ。
評価とパフォーマンス指標
予測モデルのパフォーマンスを評価するために、ほぼ2年間にわたるテストデータセットを使った。各株の予測精度を測るために、平均二乗誤差(MSE)やQLIKEなどの指標に焦点を当てたんだ。
モデル信頼性セット(MCS)手順を適用することで、異なるモデルの結果を統計的に比較し、どのモデルが一貫してより良い予測を提供したかの洞察を得ることができた。この結果、特に最適なフィッティング技術を使ったときに、HARモデルの強いパフォーマンスが示されたんだ。
予測の経済的影響も考慮に入れた。効用ベースのフレームワークを使って、投資家がモデルの予測からどれだけの価値を得るかを評価した。この分析は、統計的なパフォーマンスを現実の金融意思決定に結びつける助けになるんだ。
主な発見
徹底的なテストの結果、HARモデルが全体的に機械学習方法を上回ることが分かった。特に、MLモデルを使用してもHARモデルとの間に有意な改善は見られなかったんだ。
結果は、HARモデルにVIXを含めることでパフォーマンスが大幅に向上したことを示してる。一方で、機械学習モデルは追加情報を加えても一貫した改善は見られなかったことが多い。
さらに、HARモデルのフィッティング方式の選択が予測精度に重要な要素であることが分かった。このフィッティングの選択に対する感度は、以前の研究で報告された結果の違いを説明するかもしれないし、ボラティリティ予測におけるモデル仕様の重要性を強調しているよ。
経済的なパフォーマンスの観点から見ると、HARモデルは優れた実現効用を生み出した。つまり、投資家はHARモデルの予測を利用するためにもっとお金を払いたいと思うだろう、機械学習の代替案と比べてね。
この発見は、HARモデルが株価ボラティリティの予測において信頼できるベンチマークとして実用的であることを確認してる。機械学習への興奮が続く中、私たちの研究は、HARのようなシンプルでしっかりフィットしたモデルが驚くほど効果的であり得ることを強調してるんだ。
結論
私たちの株に関する広範な分析は、HARモデルが金融ボラティリティ予測において強力なツールであることを示している。機械学習技術が金融分野で注目されているけど、私たちの研究は、特にHARモデルが正確に指定されている場合には、必ずしもそれがHARモデルを上回るわけではないことを示しているよ。
HARモデルのシンプルな性質は、簡単に解釈でき、計算コストが低いっていう利点を持ってる。フィッティング方式の感度は、最高の予測結果を得るために慎重なモデル選択の重要性をも浮き彫りにしているね。
今後、私たちの研究はHARモデルの価値と、機械学習アプローチを金融予測にうまく統合する方法に対するさらなる調査の必要性を確立している。将来の研究では、よりリッチなデータセットや異なる文脈を探求して、これらのツールがどのようにお互いを補完できるか、そして変化し続ける金融の世界での予測精度を改善できるかを見ていけるといいな。
タイトル: HARd to Beat: The Overlooked Impact of Rolling Windows in the Era of Machine Learning
概要: We investigate the predictive abilities of the heterogeneous autoregressive (HAR) model compared to machine learning (ML) techniques across an unprecedented dataset of 1,455 stocks. Our analysis focuses on the role of fitting schemes, particularly the training window and re-estimation frequency, in determining the HAR model's performance. Despite extensive hyperparameter tuning, ML models fail to surpass the linear benchmark set by HAR when utilizing a refined fitting approach for the latter. Moreover, the simplicity of HAR allows for an interpretable model with drastically lower computational costs. We assess performance using QLIKE, MSE, and realized utility metrics, finding that HAR consistently outperforms its ML counterparts when both rely solely on realized volatility and VIX as predictors. Our results underscore the importance of a correctly specified fitting scheme. They suggest that properly fitted HAR models provide superior forecasting accuracy, establishing robust guidelines for their practical application and use as a benchmark. This study not only reaffirms the efficacy of the HAR model but also provides a critical perspective on the practical limitations of ML approaches in realized volatility forecasting.
著者: Francesco Audrino, Jonathan Chassot
最終更新: 2024-06-12 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2406.08041
ソースPDF: https://arxiv.org/pdf/2406.08041
ライセンス: https://creativecommons.org/licenses/by-sa/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。