シャピロ–ウィルク検定とは？意味をやさしく解説

シャピロ–ウィルク検定について

シャピロ–ウィルク検定は、統計学において特に重要な検定手法の一つであり、標本が正規分布から抽出されたものであるかを確かめるために使用されます。この検定は、1965年にサミュエル・シャピロとマーティン・ウィルクによって発表されました。特に、データ分析において正規分布の仮定が重要な場合に、その妥当性を調べるために利用されます。

定義と検定統計量

シャピロ–ウィルク検定では、以下の検定統計量Wが計算されます:

$$ W = \frac{\left(\sum_{i=1}^{n} a_{i} x_{(i)}\right)^{2}}{\sum_{i=1}^{n}(x_{i} - \overline{x})^{2}} $$

ここで、$x_{(i)}$は標本のi番目の順序統計量、すなわち、標本の中でi番目に小さい値を示します。また、$\overline{x}$は標本平均であり、次の式で計算されます:

$$ \overline{x} = \frac{x_{1} + \dots + x_{n}}{n} $$

定数aiの計算

検定統計量Wの計算に用いる定数$a_i$は、以下のように与えられます:

$$ (a_{1},\dots,a_{n}) = \frac{m^{\intercal} V^{-1}}{(m^{\intercal} V^{-1} V^{-1} m)^{1/2}} $$

ここで、$m$は標準正規分布から得られた独立同分布の順序統計量の期待値を含むベクトルで、$V$はこれに対応する分散共分散行列です。このようにして算出される$a_i$の値によってWが定義され、正規性の検定のための基礎となります。

帰無仮説と結論

シャピロ–ウィルク検定の主要な目的は、帰無仮説を評価することにあります。帰無仮説は、「標本が正規分布に従っている」というもので、この仮説が成り立つかどうかを判断します。具体的には、Wが所定の大きさよりも小さくなった場合、帰無仮説を棄却します。逆に、Wが大きい場合は帰無仮説を受け入れることになります。

この検定は、特に小さなサンプルサイズ（通常n<50）で高いパワーを持つことが知られており、正規性の検定として非常に広く用いられています。データ分析や多変量解析では、正規性が前提とされることが多いため、この検定を適用することで、仮定の妥当性を評価することができます。

参照文献

シャピロ–ウィルク検定に関する興味深い文献や実装例も多く存在します。特に、CRAN（Comprehensive R Archive Network）内には、この検定を実施するためのRやFORTRANのコードが多数公開されています。実際のデータを用いた分析において、これらのリソースを活用することは非常に有益でしょう。さらに、シャピロ–ウィルク検定以外にも、正規性を評価するためのさまざまな検定手法（アンダーソン-ダーリング検定、コルモゴロフ-スミルノフ検定など）がありますので、用途に応じて使い分けることが大切です。

もう一度検索