シェッフェの方法
統計学における「シェッフェの方法」は、多重比較を行う際に発生する問題に対処するための手法の一つです。この方法は、
線形回帰分析の枠組み内で、特に複数の母集団
平均に関する様々な
対比(コントラスト)について、全体の
有意水準を調整することを目的としています。アメリカの
統計学者、ヘンリー・シェッフェ氏にその名が由来します。
シェッフェの方法は、
分散分析のような回帰分析の特殊なケースにおいて、あるいは
基底関数を含む複数の回帰モデルを扱う場面で特に有効です。これは、分析の対象が単なる二つの
平均の差(一
対比較)にとどまらず、複数の
平均間のあらゆる種類の線形結合(
対比)に及ぶ場合に、信頼できる結論を同時に得ることを可能にするためです。
テューキー=クレーマー法などが主に一
対比較の分析に焦点を当てるのに対し、シェッフェの方法はより広範で、「可能な全ての
対比」と呼ばれる一連の推定値に適用できる一段階の手順です。
方法論
複数の母集団から得られたいくつかの変数について、それぞれの
平均を $\mu_1, \dots, \mu_r$ とします。これらの
平均間の「
対比」は、以下の形式で定義される線形結合です。
$$ C = \sum_{i=1}^{r} c_i \mu_i $$
ここで、係数 $c_i$ は次の条件を満たします。
$$ \sum_{i=1}^{r} c_i = 0 $$
もし全ての母集団
平均 $\mu_1, \dots, \mu_r$ が等しいならば、定義により全ての
対比 $C$ はゼロになります。逆に、これらの
平均の中に等しくないものが存在するならば、少なくとも一つの
対比はゼロではない値をとります。
シェッフェの方法は、このような非常に多数存在する可能性のある
対比の中から、関心のある任意の
対比 $C$ について推定を行い、その信頼区間を構築することを可能にします。特に注目すべきは、サンプルの大きさが各母集団で異なっていても、全ての可能な
対比に対する信頼区間が同時に正しい確率は、正確に $1 - \alpha$(ここで $\alpha$ は
有意水準)となる点です。この同時信頼係数の正確さは、シェッフェ法の重要な特性です。
実際の計算では、母集団
平均 $\mu_i$ の推定値として、それぞれの母集団から得られたサンプルの
平均 $\bar{Y}_i$ を用います。これにより、
対比 $C$ は以下のように推定されます。
$$ \hat{C} = \sum_{i=1}^{r} c_i \bar{Y}_i $$
この推定値の分散は、以下のように計算されます。
$$ s_{\hat{C}}^2 = \hat{\sigma}_e^2 \sum_{i=1}^{r} \frac{c_i^2}{n_i} $$
ここで、$n_i$ は $i$ 番目の母集団からのサンプルサイズ、そして $\hat{\sigma}_e^2$ は誤差の推定分散です。
シェッフェの方法による信頼限界は、推定値を中心に、以下のように算出されます。
$$ \hat{C} \pm s_{\hat{C}} \sqrt{(r-1)F_{\alpha; r-1; N-r}} $$
この式における $F_{\alpha; r-1; N-r}$ は、自由度 $(r-1)$ と $(N-r)$ を持つF分布の、上側 $\alpha$ 点を示します($N$ は全サンプルサイズ、$r$ は母集団またはグループの数)。この信頼限界が全ての
対比に対して同時に有効である確率が、$1-\alpha$ となります。
他の方法との比較
もし分析者が主に二つの
平均間の一
対比較のみに関心がある場合、テューキー=クレーマー法の方が一般的に狭い信頼区間を与えるため、より望ましい選択肢となります。
しかし、多くの、あるいは可能な全ての
対比について同時に分析を行いたいという一般的なシナリオにおいては、シェッフェの方法がより狭い信頼区間を提供し、したがって好ましい方法となる傾向があります。限定された数の比較にのみ強い関心がある場合、シェッフェの方法は通常、非常に保守的な結果となり、実験あたりの誤り率(ファミリーワイズエラー率)は設定した $\alpha$ よりもかなり小さくなることが多いです。しかし、その最大の強みは、無数の
対比の中から任意に選んだもの全てに対して、同時に信頼できる推論を保証できる点にあります。
参考文献:
- - Scheffé, H. (1959). The Analysis of Variance. Wiley, New York.