ベータ分布
ベータ分布(英: beta distribution)は、統計学において用いられる重要な連続
確率分布の一つです。この分布には大きく分けて「第1種ベータ分布」と「第2種ベータ分布」が存在しますが、単にベータ分布と呼ぶ場合は、一般的に第1種ベータ分布を指すことが多いです。
第1種ベータ分布
第1種ベータ分布(英: beta distribution of the first kind)は、主に0以上1以下の区間 $[0, 1]$ で定義されます。この分布は、試行において特定の事象が発生する確率や割合といった量をモデリングする際によく利用されます。
その
確率密度関数(PDF)は、形状パラメータと呼ばれる二つの正の実数 $\alpha$ および $\beta$ を用いて、次のように定義されます。
$$ f(x;\alpha, \beta) = \frac{x^{\alpha - 1}(1 - x)^{\beta - 1}}{B(\alpha, \beta)} \quad \text{for } 0 \le x \le 1 $$
ここで、$x$ は確率変数が取る値、$B(\alpha, \beta)$ はベータ関数と呼ばれる特殊関数です。パラメータ $\alpha$ と $\beta$ の値によって、ベータ分布の形状は大きく変化します。例えば、$\alpha = 1, \beta = 1$ の場合は
一様分布になり、$\alpha = 1/2, \beta = 1/2$ の場合は両端が無限大に近づく逆正弦分布のような形状になります。また、$\alpha > 1, \beta > 1$ の場合は単峰性の山形の分布となり、$\alpha < 1, \beta < 1$ の場合は両端でピークを持つ分布になります。
第1種ベータ分布の
期待値と分散は、パラメータ $\alpha$ と $\beta$ を用いてそれぞれ次のように計算できます。
期待値: $$ E[X] = \frac{\alpha}{\alpha + \beta} $$
分散: $$ \mathrm{Var}[X] = \frac{\alpha \beta}{(\alpha + \beta)^2 (\alpha + \beta + 1)} $$
また、ベータ分布は
指数型分布族に分類されます。これは、その
確率密度関数が特定の形式で書き換えられる性質を持つためです。
累積分布関数(CDF)は、
確率密度関数を0から特定の点 $x$ まで積分することで得られます。これは正規化された不完全ベータ関数として知られており、記号 $I_x(\alpha, \beta)$ で表されます。
$$ F(x;\alpha, \beta) = \int_{0}^{x} f(t;\alpha, \beta) dt = I_x(\alpha, \beta) $$
第2種ベータ分布と一般化ベータ分布
ベータ分布には第1種の他に第2種ベータ分布も存在します。こちらは主に正の実数全体 $(0, \infty)$ で定義される分布です。
さらに、これらの分布を拡張したものとして一般化ベータ分布(英: generalized beta distribution)があります。これは複数のパラメータ($a, b, c, p, q$)を持ち、その特定の条件(例えば、$c=0$ や $c=1$)の下で、一般化第1種ベータ分布や一般化第2種ベータ分布といった形を含みます。
第2種ベータ分布は、一般化ベータ分布で $c=1$ とした場合に対応し、その
確率密度関数は以下の形で与えられます。
$$ GB2(x;a, b, p, q) = \frac{|a|x^{ap-1}}{b^{ap}B(p,q)(1+(x/b)^a)^{p+q}} \quad \text{for } x > 0 $$
ベータ分布とその一般化された形は、統計的モデリング、特に割合や確率のベイズ的な推論、信頼性分析、経済学、ファイナンスなど、幅広い分野で利用されています。その柔軟な形状は、多様なデータパターンに対応できる強力なツールとなっています。
参考文献
- - 蓑谷千凰彦. (2003). 統計分布ハンドブック. 朝倉書店.
- - B. S. Everitt. (2002). 統計科学辞典 (清水良一訳). 朝倉書店.
関連項目