十分統計量について
十分
統計量とは、特定の条件下において
確率分布が
母数に依存しない
統計量のことを指します。この概念は、
ロナルド・フィッシャーによって導入され、
統計学の推定理論において非常に重要な役割を果たしています。
定義
統計量 T(X) がある
確率変数 X の値に基づいて
母数 θ に対して十分であるとは、以下の条件が成り立つことを意味します。
条件付き確率分布 Pr(X = x | T(X) = t, θ) が
母数 θ に依存せず、以下のように表現できる場合です。
$$
Pr(X = x | T(X) = t, θ) = Pr(X = x | T(X) = t)
$$
つまり、T(X) が既知であれば、データ X の
条件付き確率分布が
母数 θ に依存しないことを示します。これは、T(X) がデータから得られる
情報を最大限に含んでいることを示唆します。これにより、
統計的推定において重要な
情報を提供し、より良いモデルの構築に寄与します。
フィッシャーの因子分解定理
十分
統計量を特定する基準には、フィッシャーの因子分解定理があります。この定理は、
確率密度関数 f(x; θ) が以下のように因子化できる場合、T(X) は
母数 θ に対して十分であることを示します。
$$
f(x; θ) = h(x) g(T(x); θ)$$
ここで、h(x) は θ に依存せず、g(T(x); θ) は T(x) に依存します。この場合、T(X) の値を変更しても、θ に対する推定に影響を与えないことが示されます。つまり、十分な
情報を持っていると言えます。
例
確率変数 X1, X2, ..., Xn が
ベルヌーイ分布に従い、成功の確率を p とします。この場合、和 $$T(X) = X_1 + X_2 + ... + X_n$$ は p に対する十分
統計量となります。これは、同時
確率分布を考慮することで確認できます。
一様分布に従う独立な
確率変数 X1, ..., Xn において、T(X) = max(X1, ..., Xn) もまた、十分
統計量です。これは、最大値を通じてのみ
母数 θ と関連する
情報を保持しているため、
条件付き確率分布の因子分解の条件を満たします。
ポアソン分布に従う独立な
確率変数 X1, ..., Xn の場合、和 $$T(X) = X_1 + ... + X_n$$ は λ に対する十分
統計量となります。この特性も、同様に因子分解に基づいて検証できます。
ラオ・ブラックウェルの定理
十分
統計量 T(X) が与えられた場合、その条件付き
期待値も
母数 θ に依存しないという重要なラオ・ブラックウェルの定理が存在します。この定理により、十分
統計量を用いることで、他の
推定量よりも良い結果が得られ学問的に重要視されています。
これにより、実践的には、第一の
推定量から条件付き
期待値を求めることで、最適な
推定量を得ることが可能になります。
まとめ
十分
統計量は
統計学的推定において、データがもたらす
情報を最大限に活用するための鍵となる概念です。適切に選定された十分
統計量は、信頼性の高い推定や、より良い
統計解析の実施に大いに寄与することでしょう。