連続一様分布は、
確率論および
統計学の分野で頻繁に登場する基本的な連続
確率分布の一つです。この分布が持つ最も重要な特性は、「一様性」にあります。すなわち、分布が定義される特定の有限区間において、同じ長さを持つ任意の副区間を選んだ場合、そこに
確率変数の値が含まれる確率は、その副区間が区間内のどの位置にあるかに関わらず一定である、という性質です。
この分布は、その範囲の下限となるパラメータ `a` と上限となるパラメータ `b` によって完全に特徴付けられます。通常、記号 U(a, b) を用いて表現されます。無限に存在する可能性のある連続的な値を取る
確率変数の中で、この連続一様分布は、特定の範囲内での全ての根元事象(つまり、単一の値を取る事象)が同様に確からしいとみなせる、唯一のケースと言えます。
数学的な表現
連続一様分布の性質は、以下の数学的な関数によって定義されます。
確率密度関数 (Probability Density Function, PDF)
確率変数 X が区間 [a, b] 上の連続一様分布に従うとき、その
確率密度関数 f(x) は次のように定義されます。
$$ f(x) = \begin{cases} \frac{1}{b-a} & \text{for } a \leq x \leq b \\ 0 & \text{for } x < a \text{ or } x > b \end{cases} $$
これは、区間 [a, b] の内部では確率密度が一定値 1/(b-a) を取り、その区間の外では密度がゼロであることを示しています。境界点 `a` と `b` での値は、積分に影響を与えないため、文脈によって 0 とされたり、1/(b-a) とされたりすることがありますが、分布の定義において本質的な問題とはなりません。
累積分布関数 (Cumulative Distribution Function, CDF)
累積分布関数 F(x) は、
確率変数 X が x 以下の値を取る確率を示し、以下のように定義されます。
$$ F(x) = \begin{cases} 0 & \text{for } x < a \\ \frac{x-a}{b-a} & \text{for } a \leq x < b \\ 1 & \text{for } x \geq b \end{cases} $$
この関数は、x < a では確率が 0、x > b では確率が 1 となり、区間 [a, b] 内では x に対して線形に増加することがわかります。
分布の主要な統計量
連続一様分布 U(a, b) に従う
確率変数 X の
期待値(平均)E[X] および分散 Var[X] は、それぞれ以下のようになります。
期待値: $ E[X] = \frac{a+b}{2} $
分散: $ Var[X] = \frac{(b-a)^2}{12} $
期待値が区間 [a, b] のちょうど中央になること、分散が区間幅の二乗に比例することが分かります。
応用と重要性
連続一様分布は、その単純さにも関わらず非常に多くの応用を持ちます。
乱数生成の基盤: コンピューターシミュレーションにおいて、多くの
擬似乱数生成器は、まず [0, 1] 区間上の標準一様分布に従う乱数を生成します。これを
標準一様分布 (Standard Uniform Distribution) と呼び、特に U(0, 1) と表します。この標準一様分布の乱数を適切に変換することで、他の様々な
確率分布に従う乱数を生成することができます。例えば、標準一様分布 U(0, 1) から得られた乱数 u を用いると、a + (b-a)u という値は U(a, b) に従います。また、他の分布からのサンプリング手法として、
累積分布関数の逆関数を用いる
逆関数法や
棄却サンプリング法などが存在し、これらは標準一様分布からの乱数を基礎として利用します。特に、
正規分布に従う乱数を生成する際には、標準一様分布に従う2つの独立な乱数から
正規分布に従う2つの独立な乱数を得る
ボックス-ミューラー変換などが用いられます。
統計的検定: 統計的検定におけるp値は、
帰無仮説が真である場合に、連続的な検定統計量を用いる際には通常、[0, 1] 区間上の一様分布に従うことが知られています。
パラメータ推定: 観測されたデータから分布のパラメータ(例えば未知の区間 [0, N] の N)を推定する問題において、一様分布がモデルとして使われることがあります。これは「ドイツ戦車問題」としても知られる古典的な推定問題に関連します。
その他の関連事項
独立な2つの一様分布に従う
確率変数の和は対称な
三角分布に従います。
独立な複数の一様分布に従う
確率変数の和はアーウィン゠ホール分布に従います。
* 連続一様分布の
確率密度関数は、
ヘヴィサイドの階段関数や
矩形関数など、他の基本的な関数を用いて表現することも可能です。
連続一様分布は、
確率変数が一定の範囲内で全く偏りなく発生する場合をモデル化する上で最も基本的な分布であり、その性質の理解は、より複雑な
確率分布や統計手法を学ぶ上で不可欠となります。