ファイダシアル推論の復活:現代的アプローチ
この記事では、一般化手法を使った基準推論への再興味について話してるよ。
― 1 分で読む
フィデューシャル推論は1900年代初頭に始まった方法で、データに基づいてパラメータの分布を作成することを目指していました。あらかじめ事前分布を選ぶ必要はありませんでした。年月が経つにつれて、この方法は特に複数の変数が関わる複雑な状況であまり人気がなくなりました。しかし、過去10年でフィデューシャル推論への関心が再び高まっています。この再興は、フィデューシャル推論を一般化された信頼区間に結びつける一般化フィデューシャル推論(GFI)のアイデアが一因です。
GFIはデータのみに依存して近似的な信頼分布を見つける方法を提供します。この章では、フィデューシャルアプローチの実用的な利点を示します。一般化フィデューシャル分布が何であるかを定義し、さまざまな例を通じてその応用を示します。
フィデューシャル推論は、頻度主義とベイズ主義という2つの一般的な統計的視点の間で妥協を見つけようとします。このアプローチでは、データのみに基づいてターゲットパラメータの分布を作成し、時には恣意的な事前分布の選択を避けることができます。データ生成アルゴリズム(DGA)を逆にすることで、データとパラメータ、既知の分布のランダム成分を結びつけます。DGAを解くことで、一般化フィデューシャル分布(GFD)を導出でき、これはデータのみに依存し、ベイズの定理を使用する必要がありません。
GFIの利点と限界はまだ調査中ですが、その実用性はさまざまな分野で明らかです。最近の研究では、フィデューシャルのアイデアがバイオエクイバレンス、測定問題、実験、国際比較などの分野に応用されています。さらに、GFIはウェーブレット回帰や極値推定など、現代の統計研究テーマでも役に立っています。また、線形モデルの選択やベクトル自己回帰グラフの選択に新しいアイデアをもたらしました。
フィデューシャルの議論を示すために、既知の平均を持つ正規分布からの単一の観測値の単純なケースを考えます。ここでは、平均とは独立した既知の分布を持つランダムな量があります。DGAを逆にすることによって、パラメータに分布を付与します。この単純な正規のケースでDGAを逆にするのは代数的には簡単ですが、より複雑な状況ではかなり難しいことがあります。
一般的に、滑らかなDGAは観測データ値の近くで線形関数のように振る舞うと考えることができます。したがって、ランダム量の各実現値に対して、DGAが観測値に最も近い明確に定義された点を見つけることができます。
GFDは、特定のイベントに条件付けられたランダム変数の分布からの暗黙の関数定理に基づいて、パラメータの分布として決定されます。GFDを正式に定義するために、リミットを使用できます。DGAの擬似逆を最適化問題を解くことで定義します。通常、L1またはL2ノルムを使用して、前述の最も近い点を特定します。技術的には逆ではありませんが、この量は常に定義されています。
次に、ランダム変数の小さな値を考え、別のランダム変数を定義します。これは特定の値をカバーするように条件付けられた切り捨て分布を持っています。ランダム変数が分布に収束することを仮定すると、GFDはこの制限された分布として表現できます。
離散分布の場合、しきい値を適切に設定できますが、連続の場合は暗黙の関数定理を利用して制限分布を見つけます。基本的な条件のもとで、得られた分布は定義された演算子に基づく特定の密度シグネチャを持ち、ノルムの参照も使用します。
GFDは明確なガイドラインを提供します。データ、パラメータ、ランダム量を関連づけるDGAを定義し、その後で逆を見つける。しかし、このアイデアを実際に実装するのは繊細で慎重な考慮を要します。この章は、詳細な事例を通じてGFIの徹底的な概要を提供することを目的としています。
場合によっては、DGAを解くことが特定の実現に関連付けられた単一の点に繋がらないことがあります。その代わり、パラメータの集合に対するフィデューシャル分布を見つけることがあります。多変量正規データを含む2つのシナリオと、未知の試行回数を持つ二項分布を含む1つのシナリオに焦点を当てます。これらの例は、関連性があるだけでなく、現代のツールを使用して一般化フィデューシャルソリューションを示すことを可能にします。
他の人が使用できるコンピュータコードを共有します。二項アルゴリズムの完全な擬似コードを提供します。
この議論を通じて、多くの近似フィデューシャル信頼区間に言及します。「信頼」という用語を使用しながら、これらの区間はベイズの信用区間に密接に関連しています。これらの各区間は、ターゲットパラメータに対する分布を定義し、この分布を使用して所望のカバレッジレベルに一致するセットを作成します。これらのフィデューシャル区間を「信用区間」と呼ぶ代わりに、近似信頼区間と呼びます。
これらの区間が近似であることに関する注意はさまざまな理由から生じます。連続多変量正規の場合には、複雑な計算を避けるためにマルコフ連鎖モンテカルロ(MCMC)サンプリングを推定ツールとして使用します。試行回数が不確かな二項の場合でも同様のサンプリング技術が必要です。さらに、両方の二項シナリオでは、パラメータの無限のサンプル空間に関連する問題に対処するために近似が必要です。
これらのさまざまな不確実性の源は、これらの区間を「近似」と呼ぶ正当化となります。このことを強調する主な理由は、カバレッジが常に正確であるとは限らないからです。「近いけど正確ではない」というカバレッジの概念は、正規性の仮定に基づいて頻度主義の信頼区間が直面するかもしれない不確実性を反映しています。シミュレーションを使用して、私たちの計算方法が実際に理論的な期待に一致するカバレッジを提供しているかどうかを評価します。
シミュレーションの結果は、これらの近似にもかかわらず、フィデューシャル法が実用的な応用に対してしっかりと機能することを示しています。
多変量正規分布
共分散行列の推定は、さまざまな多変量手法において重要な問題です。例えば、判別分析、時系列分析、空間データ分析などがあります。最近、ベイズ文脈で一般に使用される逆ウィシャート事前が、これらの推定にとって最善の選択ではないかもしれないことが指摘されました。特に、逆ウィシャートの事後分布は共分散行列の固有値を歪め、推定に悪影響を与える可能性があります。
独立で同一分布のデータを持つシナリオを考え、特定の共分散行列について推論を行うことを目指します。平均パラメータが未知であると仮定します。
この目的のために、モデルのGFDを定義するために2つの主要なアプローチが提案されています。どちらも標準的なガウスベクトルを使用したDGAから始まりますが、行列の設定が異なります。一つのアプローチは下三角行列を使用し、座標の任意の順序に依存するGFDを得ます。もう一つのアプローチは任意の行列を使用して依存性を除去しますが、過剰パラメータ化の問題が生じます。
私たちは、過剰パラメータ化の問題を回避し、ウィシャート分布に至らない代替DGAを提案します。このアプローチでは、正規直交行列と正のエントリを持つ対角行列を考慮します。これにより、明確な構造を持ったGFDを計算できます。
このアプローチから導出されたヤコビアンは簡略化された結果をもたらし、一般化フィデューシャル区間の容易な計算を可能にします。私たちの方法を使うことで、共分散行列について、真の共分散行列と照らし合わせながらフィデューシャル信頼区間を効率的に作成できます。
シミュレーション研究を実施し、多変量正規分布からデータを生成してフィデューシャル信頼区間のカバレッジを計算します。これらの区間がさまざまな指標でどのように機能するかを確認します。これらの区間の経験的カバレッジを評価し、期待されるカバレッジに近い性能を目指します。
シミュレーションから得られた経験的結果は、私たちの方法がかなり効果的であることを示し、フィデューシャル信頼区間を作成するためのアプローチが有効であることを示しています。
一般化された一方向ランダム効果モデル
多変量正規分布についての議論を続け、標準的な不均衡一方向ランダム効果モデルというより制約されたパラメータ化を見ていきます。最初のフィデューシャル解はこの問題に特化していましたが、固定効果に対する同時推論を許可しませんでした。
より一般的なDGAを考え、特定のパラメータに対してGFDを提供する推論の問題を簡素化します。これまでの研究では、よく機能するGFDが提供されていましたが、私たちのアプローチは、広範な計算なしでこれらの区間を得る方法を提供します。
簡素化されたヤコビアン行列を使用して、フィデューシャル信頼区間をより効率的に実装するために必要な量を導出します。さまざまなグループサイズやパラメータ値にわたるシミュレーションの結果は、一般化フィデューシャル法が通常、保守的な推定をもたらすことを示しています。
私たちの発見は、一般化フィデューシャルアプローチが利用可能なソフトウェアツールを使用して効率的に実行でき、最小限の計算努力で正確な結果を得られることを示しています。
二項分布
二項分布のような離散分布を扱う際、以前の方法は同じようには適用できません。これを示すために、まず既知のパラメータを持つ二項分布に関心があるケースを概説します。
このシナリオでは、未知のパラメータとデータを独立な一様変数で結びつけるDGAを定義します。データを観測した後、関連する一様変数は新しいサンプルに置き換えられます。関連する方程式を解くことで、未知のパラメータに対する区間を見つけることができます。
ここで重要なのは、離散データに対するフィデューシャルアプローチが単一の点ではなく集合に基づいていることです。連続データのシナリオと比較して、これらの集合はデンプスター・シャファー理論のような理論を使用して解釈でき、基礎となる関係についての理解を豊かにします。
未知のパラメータがある二項分布からの複数の独立した観測があるとき、私たちは潜在的なパラメータ値の合理的な集合に対するフィデューシャル確率を求めます。私たちの提案するアルゴリズムは、観測データに基づいて候補集合の確率を計算することから始まります。
両方のパラメータが未知であるより複雑な状況に移行する際、同じDGAフレームワークを使用します。分布関数の逆を利用することで、GFDを決定する方法を開発しますが、計算をパラメータの合理的な範囲に制限する必要があります。
このシナリオでGFI法を実装すると、ベイズ事後分布に密接に一致する結果が得られることがよくわかります。この状況は、両者のアプローチの違いについての理解を深め、フィデューシャル法の強みを明らかにします。
さまざまなデータサイズのシミュレーションを行った結果、一般化フィデューシャル法とベイズ法の両方が同様の結果を示すことがわかりました。これは、フィデューシャルアプローチがパラメータ推定における不確実性を効果的にモデル化する能力に自信をもたらします。
結論と議論
一般化フィデューシャル推論フレームワークは、古典的な推論問題に対する堅実な代替視点を提供します。これにより、恣意的な事前を前提とすることなく、データのみに依存してターゲットパラメータの意味のある分布を導出することができます。
フィデューシャル法の約束にもかかわらず、特定の応用におけるDGAの逆を求める際にはまだ課題があります。今後の研究は、このプロセスを自動化するツールの開発を目指し、フィデューシャル推論をより広い聴衆にアクセスしやすくします。
時間が経つにつれてGFIは、現代の統計的課題に取り組むための強力な方法であることが証明されています。さまざまな応用から生まれた明確なイラストを伴い、この手法は多くの統計的問題に効果的に対処する準備が整っています。
タイトル: Introduction to Generalized Fiducial Inference
概要: Fiducial inference was introduced in the first half of the 20th century by Fisher (1935) as a means to get a posterior-like distribution for a parameter without having to arbitrarily define a prior. While the method originally fell out of favor due to non-exactness issues in multivariate cases, the method has garnered renewed interest in the last decade. This is partly due to the development of generalized fiducial inference, which is a fiducial perspective on generalized confidence intervals: a method used to find approximate confidence distributions. In this chapter, we illuminate the usefulness of the fiducial philosophy, introduce the definition of a generalized fiducial distribution, and apply it to interesting, non-trivial inferential examples.
著者: Alexander C. Murph, Jan Hannig, Jonathan P. Williams
最終更新: 2023-02-28 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2302.14598
ソースPDF: https://arxiv.org/pdf/2302.14598
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。