ジャック=ベラ検定について
ジャック=ベラ
検定(Jarque–Bera test)は、
標本データが正規分布に従っているかを評価するための
統計的手法です。この
検定は、データの特性である尖度(Kurtosis)と歪度(Skewness)を利用しています。
検定名は、
統計学者のCarlos JarqueとAnil K. Beraに由来しています。
この
検定では、
検定統計量をJBとして定義し、以下の数式を用います:
\[ JB = \frac{n}{6}\left[S^2 + \frac{1}{4}(K - 3)^2\right] \]
ここで、nは
標本のサイズ、Sは
標本の歪度、Kは
標本の尖度を示します。歪度(S)と尖度(K)はそれぞれ次のように計算されます:
\[ S = \frac{\hat{\mu_3}}{\hat{\sigma^3}} = \frac{\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^3}{\left[\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^2\right]^{3/2}} \]
\[ K = \frac{\hat{\mu_4}}{\hat{\sigma^4}} = \frac{\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^4}{\left[\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\bar{x})^2\right]^{2}} \]
ここで、\( \hat{\mu_3} \)と\( \hat{\mu_4} \)は三次および四次の中心モーメントの推定値、\( \bar{x} \)はサンプル
平均、\( \hat{\sigma^2} \)は分散を表します。
データが正規分布から得られる場合、JB
統計量は漸近的に自由度2のカイ二乗分布に従います。これにより、
標本データが正規分布に由来するかどうかを
検定できます。帰無仮説は、歪度が0、すなわち正常な分布であることと、過剰尖度が0であることが結合されていることを意味します。逆に、歪度や尖度が期待値から外れた場合、JBの値は大きくなります。
小標本での注意
小さな
標本サイズではカイ二乗近似が過剰に敏感であり、帰無仮説が正しい場合でも
検定により
棄却されることがあります。特にp値が小さい場合は、分布の偏りが影響を及ぼし、第一種誤り率(α)が増加することが報告されています。この問題を緩和するために、適切な
標本サイズを使用することが推奨されます。
歴史的背景
1975年、BowmanとShentonはJB
統計量がカイ二乗分布に漸近することに言及しましたが、その成立には大きな
標本サイズが必要であると強調しました。その後、1979年頃にAnil BeraとCarlos Jarqueは、ラグランジュの未定乗数法を用いて回帰残差の正規性を
検定する手法を提案し、ジャック=ベラ
検定が最適であることを示しました。1980年に発表された論文では、堅牢な正規性の
検定について述べられ、その後、1987年のInternational Statistical Reviewでは、より詳細な事例が取り上げられました。
ソフトウェアの利用
ジャック=ベラ
検定を実施できるソフトウェアはいくつか存在します。例えば、ALGLIBやR(tseriesパッケージ内のjarque.bera.test関数、momentsパッケージ内のjarque.test関数)、MATLAB(jbtest関数)、gretl、IGOR Proなどが利用可能です。
関連項目
他にも、正規性の
検定に用いられる
検定手法には、コルモゴロフ-スミルノフ
検定、リリフォース
検定、シャピロ-ウィルク
検定、アンダーソン-ダーリング
検定などがあります。これらの方法も、ジャック=ベラ
検定と同様にデータの正規性を確認するために使われます。