マン・ホイットニーのU検定
マン・ホイットニーのU検定は、
ノンパラメトリック手法の一つであり、2つの独立した
母集団が同じであるかを検定する方法です。この検定は、特に一方の
母集団がもう一方よりも大きい値を持つ傾向があるときに有効です。この手法は、ウィルコクソンの順位和検定としても知られており、両者は実質的に同じアプローチです。
検定の概要
この検定では、観察された2つの標本が同じ
母集団から抽出されたという
帰無仮説を検定します。ノンパラメトリックであるため、データが
正規分布に従わない場合でも使用できます。マン・ホイットニーのU検定は、t検定と比較しても、小さな標本サイズに対して
有意性が高く、
正規分布の場合にも
近似的な有効性があります。
データセットを比較する際、Uと呼ばれる
統計量を求めます。この値は、標本サイズが20以上のケースでは、
正規分布を用いて
近似することができます。U値は、2つの標本の間の順位の和を用いて計算され、標本サイズが小さい場合には手計算で求めることも可能です。
1.
小標本の場合:
各標本について、他方の標本内でそれより小さい値を持つ観察の数を計 ascertainします。この度数の総和がUとなります。
2.
大標本の場合:
所与の観察を一つの順位系列として並べ、小さい方の標本の順位の総和を求めます。この値を利用してUを計算します。具体的には、次の数式に従います。
- $$ U_1 = n_1 n_2 + \frac{n_1(n_1 + 1)}{2} - R_1 $$
- $$ U_2 = n_1 n_2 + \frac{n_2(n_2 + 1)}{2} - R_2 $$
この2つのUの値のうち、より小さい方を検定に使用します。
ここで、n1およびn2はそれぞれの標本のサイズ、R1は標本1の順位の総和を表します。
使用方法
標本サイズが大きい場合、zスコアを用いた
近似が可能で、
正規分布に従う
有意性が確認できます。具体的には、以下の式を使用します。
$$ z = \frac{U - m_U}{\sigma_U} $$
ここで、m_UはUの期待値、σ_UはUの標準
偏差です。これらは、次の式で表されます。
- - $$ m_U = \frac{n_1 n_2}{2} $$
- - $$ \sigma_U = \sqrt{\frac{n_1 n_2 (n_1 + n_2 + 1)}{12}} $$
具体例
例えば、イソップの寓話に登場するカメとウサギの競走を考えた場合、6匹のカメとウサギを用いてその結果を基に
有意差検定を行います。得られた順位に基づいて、各カメが勝ったウサギの数を数えたり、順位の合計を計算したりします。この過程を経て、得られたUの値から、カメがウサギよりも速いとは言えないことが示されます。
検定の適用に関する注意
U検定は、独立した標本に対してt検定と同じ状況で使用されますが、両者の特性を理解し、適切な場面で使い分ける必要があります。特に、両標本が異なる
母集団に基づく場合、偽の
有意結果が得られることがあります。
関連の検定方法としては、
ウィルコクソンの符号順位検定などがあります。マン・ホイットニーのU検定は、なじみがあり、今でも多くの分野で広く使用されています。