二項検定とは
二項検定(にこうけんてい、英:binomial test)は、データが2つの異なるカテゴリに分類される場合に、そのカテゴリの比率が理論的に期待される分布から
有意に偏っているかを評価するための
統計的手法です。この検定は、
確率を直接計算する方法の一つであり、特に小さなサンプルサイズでも使用できる正確な
確率検定として位置づけられています。
使用方法
二項検定では、ある事象の成功
確率を示す仮説(
帰無仮説)を検定します。具体的には、成功
確率を
π
{ootnotesize {π}} とした場合、次のようになります。
H₀: π = π₀
ここで、
π₀ は検定者が設定した成功
確率の理論的な期待値です。この検定では、実際の成功回数を
k
のように
標本サイズ
n
に対して、二項分布の公式を用いて成功
確率を計算します。
$$
Pr(X = k) = {n race k} p^k (1 - p)^{n - k}
$$
成功回数が
帰無仮説で期待される成功数に対し、実際の結果がどのくらいの
確率で発生するかを評価します。具体的には、観測された成功回数
k
に対し、どの程度の非偶然性を持つ結果であるか判断します。
また、片側検定では次のような計算を行います。
$$
p = ∑_{i=0}^{k} Pr(X = i)
$$
このようにして、特定の事象の成功
確率が期待値 よりも小さい(または大きい)かどうかを検定します。
両側検定の場合
両側検定の場合は、片側の
確率を2倍にするだけではなく、観測された結果に相当する極端な事象が得られる
確率を考慮に入れる必要があります。そのため、次のように、条件を設定し、観測結果に基づく
確率を計算します。
$$
p = ∑_{i ∈ I} Pr(X = i)
$$
ここで、
Iは観測された事象と同等またはそれ以上に起こる
確率をまとめたものであり、この場合はもっと複雑な計算が必要となります。
典型的な使用例
二項検定は、特に成功
確率が同じであるという
帰無仮説であるときに効果的です。たとえば、コイン投げや
サイコロ転がしなど、2つの結果の発生
確率が均等であることを想定して行います。ただし、カテゴリが3つ以上の場合には、多項分布を用いた多項検定を実施する必要があります。
標本サイズが大きい場合
標本サイズが大きくなった場合、二項分布は近似的に連続分布として扱われるため、
カイ二乗検定などの他の手法も使われます。しかし、小規模なサンプルの場合、二項検定がより適切です。
標本サイズが大きい場合、正規分布を利用して、以下の
Z検定が行われることがあります。
$$
Z = rac{k - nπ}{ ext{√}(nπ(1 - π))}
$$
連続性補正が適用されることもあります。
二項検定の具体例
例えば、ある
ボードゲームでは
サイコロを235回振って6の目が51回出たとしましょう。この場合、
サイコロが公平であれば、期待される6の目の出現回数は39.17回です。ここで二項検定を適用して、6の目が出る
確率が
有意に高いかどうかを検討します。この検定の結果、p値が0.02654となり、5%の
有意水準で
帰無仮説を
棄却する根拠が得られます。これにより、
サイコロが公平でないと結論が導かれます。
このように、二項検定は特に小規模なデータセットにおいて、
帰無仮説の妥当性を評価する強力な手法です。