スケールパラメータとは
スケールパラメータは、
確率論や
統計学において
確率分布の特徴を示す重要な数値です。このパラメータは、
確率分布のばらつきを表すものであり、その値が大きいほどばらつきも大きくなることを意味します。スケールパラメータが小さい場合は、分布はより集中し、ばらつきが少ないことを示します。
定義
確率分布が特定の
母数を持つとき、スケールパラメータはこの
確率分布の性質を記述します。具体的には、ある
確率分布の
累積分布関数が次の様な形を持つ場合、
$$F(x; s, θ) = F\left(\frac{x}{s}; 1, θ\right)$$
ここで、$s$がスケールパラメータであり、他のパラメータとして$θ$が存在します。この関係から、スケールパラメータは量的なばらつきを定義するものであるとわかります。
位置母数との関係
確率分布に位置
母数が含まれている場合、定義には微妙な変化があります。位置
母数を$m$、スケールパラメータを$s$と表した場合、
累積分布関数は以下のようになります:
$$F(x; s, m, θ) = F\left(\frac{x - m}{s}; 1, 0, θ\right)$$
このようにすることで、
正規分布などで平均が0でない場合でも、
標準偏差をスケールパラメータとして扱うことができるようになります。ただしすべてのケースでこの定義が利用されるわけではコ地ません。
確率分布が
確率密度関数を持つ場合、スケールパラメータを考慮すると次のように表されます:
$$f_{s}(x) = \frac{1}{s} f\left(\frac{x}{s}\right)$$
この式は
累積分布関数の定義を元に証明されるもので、スケールパラメータがどのように分布を変化させるのかを示しています。このことから、
確率分布の性質を理解する上で、スケールパラメータの重要性が浮き彫りになります。
レートパラメータとの違い
一部の
確率分布では、スケールパラメータの代わりにレートパラメータが利用されることもあります。レートパラメータは、スケールパラメータの逆数であり、例えば指数分布では次のように表現されます:
$$f(x; β) = \frac{1}{β} e^{-\frac{x}{β}}, \quad x ≥ 0$$
この同じ分布はレートパラメータを用いて次のようにも表現されます:
$$f(x; λ) = λ e^{-λx}, \quad x ≥ 0$$
例
連続一様分布の場合、位置
母数は$(a + b) / 2$、スケール
母数は$(b - a)$として観察されます。また、
正規分布は位置
母数$μ$とスケール
母数$σ$を持ち、ガンマ分布は形状
母数と尺度
母数で特徴づけられます。
さらに、特定の条件が満たされる場合、尺度
母数が1である「標準」分布と呼ばれるものもあります。例えば、標準
正規分布や標準
コーシー分布があります。
スケール母数の推定
スケール
母数は様々な統計量を用いて推定できます。これには、位置に対して不偏であり、尺度
母数に線形に比例する統計量が必要です。また、サンプル数が増えることで統計量が尺度
母数に収束します。
例えば、
正規分布の
標準偏差を推定する際には、中央値絶対偏差(MAD)を使用することがあります。この場合、スケール係数は特定の式で計算され、サンプル数を増やすことによってMADは
標準偏差に収束することが示されます。
これにより、スケールパラメータの理解とともに、統計手法の応用が見えてきます。