G検定(ジーけんてい)について
G検定は、
統計学における検定方法の一つで、尤度比による検定を行う手法です。これまで、カイ二乗検定が多くの場面で使用されてきましたが、G検定はその改善版として広まってきています。カイ二乗検定は、あるデータセットが特定の分布に従っているかどうかを確認するために利用されており、特に独立性の検定や分割表における適合性の検討において重宝されています。この検定は、カール・ピアソンによって提案されたものであり、計算が簡単であったため、多くの研究に採用されました。
G検定は、従来のカイ二乗検定が採用する方法論を刷新し、対数尤度を直接使用します。このアプローチにより、データの分析がより厳密になったのです。1994年に発表されたソーカルとロルフの著書「生物
統計学」の第3版がG検定の普及に大きく寄与し、幅広い分野で利用されています。
カイ二乗検定とG検定の比較
カイ二乗検定の
統計量は、以下の式で表されます。
\[ \chi^{2} = \sum_{i} \frac{(O_{i} - E_{i})^{2}}{E_{i}} \]
ここで、Oiは観察された頻度、Eiは帰無仮説に基づく期待頻度を示します。対して、G検定の式は以下のようになります。
\[ G = 2 \sum_{i} O_{i} \cdot \ln \left( \frac{O_{i}}{E_{i}} \right) \]
これらの検定方法は、観察データが期待される分布から得られた無作為標本であるという仮定のもとで利用され、その結果はカイ二乗分布に従います。標本サイズが適切であれば、両者は同じ結論を導き出すことが可能ですが、観察頻度と期待頻度の差が大きい場合や、特に全てのマス目に対して\(|O_{i} - E_{i}| > E_{i}\)が成立する場合には、G検定を用いるほうが適切です。
使用の注意点
サンプルサイズが小さい場合には、G検定やカイ二乗検定を使用するのは望ましくありません。このような状況では、多項検定(適合性検定)やフィッシャーの正確検定(分割表)などの他の手法を考慮することが推奨されます。また、ベイズ式仮説選択も有効な選択肢となるでしょう。これらの手法を適応することで、小規模なデータセットにおける解析の精度を高めることができます。
結論
G検定は、カイ二乗検定の限界を克服するために発展してきた手法であり、
統計学的検定において重要な役割を果たしています。特に、質の高いデータを必要とする生物
統計学や社会科学の領域での有用性が高く、その正確性と信頼性から多くの研究者に採用されています。