INARモデルのフィット感テスト:新しいアプローチ
厳しい仮定なしでINARモデルの適合性を評価する柔軟な方法を紹介するよ。
― 1 分で読む
カウントデータのモデルの中で、整数値自己回帰(INAR)プロセスは結構人気。これらのモデルは、時間とともに変化するカウントデータを分析するのに役立つから、パターンやトレンドを解析できる。普通、統計学者がINARモデルを使うときは、ポアソン分布や負の二項分布など、基礎となるデータについていくつかの仮定をすることが多いんだ。
この記事では、特定のデータ分布の種類について仮定を課さずに、INARモデルがうまくフィットしているかをテストする新しい方法を紹介するよ。特定の分布を仮定する代わりに、データを調べる際にもっと柔軟性を持たせる半パラメトリックアプローチを提案する。
INARモデルの紹介
INARモデルは、イベントや発生のカウントなど、非負の整数値からなる時系列データのモデリングに特に適してる。INARモデルを定義する主な方法は、再帰方程式を通じて行う。この方程式では、特定の時間における現在のカウントは、以前のカウントやデータのランダムショック(イノベーション)に依存している。
この仕組みでは、モデルの係数が重要な役割を果たして、プロセスが整数値のままであることを保証する。これを実現するために、シリーズの整数性を維持するのに役立つ操作を導入する。具体的には、バイノミアルスリムオペレーターという手法を使って、モデルに関与するランダム変数が適切に動作するようにしている。
INARモデルは柔軟で多くの応用があるけど、文献での一般的な実践では、イノベーションに特定の分布を仮定することが多い。この仮定は、モデルの適用可能性を制限して柔軟性を損なうことがあるんだ。
半パラメトリックモデルの柔軟性
INARモデルのフィットをテストするには、しばしば基礎となるイノベーション分布に関する特定の帰無仮説が必要になる。この状況は、厳格な分布を仮定することでデータの本質を捕らえられないことがあるから、困難をもたらすんだ。私たちのアプローチは、イノベーション分布を特定せずにデータがINARモデルに従うという帰無仮説をテストすることを提案している。
この柔軟性により、より複雑でデータに対して適切なモデルを探ることができ、統計分析に基づいたより良い洞察や決定につながる。目標は、これらの厳格な仮定なしにINARモデルを正確に検証できるテスト手続きの作成だ。
テスト統計量の構築
帰無仮説に適したテスト統計量を作るために、私たちは結合確率生成関数(pgf)の推定量を利用する。この関数は、観測されたカウントと基礎モデルとの関係を包括的に記述する。pgfの二つの異なる推定量に基づいてテスト統計量を構築することで、モデルがデータにうまくフィットしているかを評価できる。
一つの推定量はさまざまな設定で一般的一貫性を提供し、もう一つは帰無仮説の下で適合するように調整されている。この二重アプローチにより、特定のパラメトリック制約に縛られることなく、適合度をテストできる。
結合確率生成関数
テスト手続きの鍵となる要素は、連続するランダム変数の結合pgfで、これがデータの依存構造をキャッチする。この関数は、データが期待されるINARの振る舞いを示すかどうかを判断するのに重要だ。結合pgfを導出することで、モデルがデータにどれだけフィットしているかを分析できる。
結合pgfは二つの要素の積として表現できる。一つはイノベーション分布のみに依存し、もう一つはモデル係数に関連している。この表示は、基礎となる分布について追加の仮定を必要とせず、私たちのテスト方法論にとって堅実な選択肢になる。
INARモデルの推定
パラメトリックな仮定をせずにINARモデルを推定すると、モデル係数やイノベーションの性質を決定するのが難しくなる。伝統的な推定法に頼る代わりに、モデル係数とイノベーションの分布を共同で推定する半パラメトリック推定量を提案する。
この半パラメトリック推定量は、不要な制約を課さずに基礎データの本質的な特徴を捉えるので、効果的かつ効率的だ。この適応性は、分布に関する厳格な仮定に従わない実データを扱う際に重要になる。
テスト手続き
時系列カウントデータのサンプルを観察して、帰無仮説のためのテスト統計量を構築することからスタートする。pgfの二つの推定量を使用して、堅牢でデータの変動を考慮できるテスト統計量を確立する。
私たちのテスト手続きには統合が含まれるので、臨界値を推定するためにブートストラップ手法も導入して、方法の実用性を高める。このステップは、さまざまなデータセットを持つ現実のシナリオでテスト手続きをより簡単に適用できるようにするために重要だ。
シミュレーション研究
提案した適合度テストの性能を評価するために、広範なシミュレーションを実施する。このシミュレーションでは、帰無仮説の下やさまざまな代替案の下でデータを生成して、私たちのテストが帰無からの逸脱をどれだけ検出できるかを評価する。
シミュレーション研究の結果は、私たちの半パラメトリックテストがうまく機能し、データがINARモデルに従うときにそのレベルを維持することを示している。特に、テスト統計量を適切に調整した場合、帰無仮説からの逸脱を検出する強力な力を持っている。
実世界データへの応用
適合度テストの効果を示すために、実世界のデータセットに適用する。最初のデータセットは、エネルギーセクターの需要を示すアクティブな掘削リグの週間カウント。分析の結果、これらのカウントはINARモデルに従うことが示され、テストは帰無仮説を棄却しない。
次の応用では、株取引における取引カウントを分析し、データが過分散を示すことがわかった。この場合、データが厳密なパラメトリック仮定にフィットしなくても、私たちの柔軟性によりINARモデル構造を受け入れることができる。
第三のデータセットでは、特定の株の取引カウントを考慮。データの不規則な性質は、当初、帰無仮説を保持することにつながった。しかし、より高次のテスト統計量を使用すると、帰無を棄却するのに十分な証拠を見つけ、基礎データ構造の複雑さを検証した。
結論
結論として、私たちの新しい半パラメトリック適合度テストは、INARモデルに対する既存のパラメトリック手法に対して柔軟な代替手段を提供する。イノベーション分布に関する厳格な仮定を避けることで、INARモデルが基礎データ構造を適切に捉えているかを評価できる。
シミュレーション研究の結果は、このアプローチがさまざまなシナリオで良好なパフォーマンスを維持し、現実のケースに効果的に適用できることを示している。全体的に、提案されたテスト方法論は、時系列カウントデータの分析に貴重な洞察を提供し、統計モデリングにおける柔軟性と適応性の重要性を強調している。
タイトル: Semi-parametric goodness-of-fit testing for INAR models
概要: Among the various models designed for dependent count data, integer-valued autoregressive (INAR) processes enjoy great popularity. Typically, statistical inference for INAR models uses asymptotic theory that relies on rather stringent (parametric) assumptions on the innovations such as Poisson or negative binomial distributions. In this paper, we present a novel semi-parametric goodness-of-fit test tailored for the INAR model class. Relying on the INAR-specific shape of the joint probability generating function, our approach allows for model validation of INAR models without specifying the (family of the) innovation distribution. We derive the limiting null distribution of our proposed test statistic, prove consistency under fixed alternatives and discuss its asymptotic behavior under local alternatives. By manifold Monte Carlo simulations, we illustrate the overall good performance of our testing procedure in terms of power and size properties. In particular, it turns out that the power can be considerably improved by using higher-order test statistics. We conclude the article with the application on three real-world economic data sets.
著者: Maxime Faymonville, Carsten Jentsch, Christian H. Weiß
最終更新: 2024-10-15 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2402.17425
ソースPDF: https://arxiv.org/pdf/2402.17425
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。