三角分布
三角分布(さんかくぶんぷ、英: triangular distribution)は、
確率論および
統計学の分野で利用される連続
確率分布です。この分布は、その
確率密度関数が特定の区間上で三角形の形状を示すことに由来して名付けられました。ある事象の発生しうる値の範囲が明確であり、かつ最も可能性の高い値が一つだけ存在し、その値から離れるにつれて可能性が線形に減少していくような状況をモデル化するのにしばしば用いられます。
三角分布は、定義区間 $[a, b]$ 上で定義されます。この区間は、確率変数 $X$ が取りうる値の最小値 $a$ と最大値 $b$ によって定められます。加えて、分布の形状を決定する重要なパラメータとして、
最頻値 $c$ があります。
最頻値 $c$ は、確率密度が最大となる点であり、常に最小値と最大値の間に位置します($a \le c \le b$)。これらの3つのパラメータ、$a, b, c$ が三角分布を特徴づけます。
三角分布の
確率密度関数 $f(x)$ は、定義区間 $[a, b]$ 内において、以下の区分的に線形な関数として表現されます。
$$
f(x) = \begin{cases}
{\cfrac {2(x-a)}{(b-a)(c-a)}} & \mathrm {for\ } a\leq x
{\cfrac {2}{b-a}} & \mathrm {for\ } x=c,
{\cfrac {2(b-x)}{(b-a)(b-c)}} & \mathrm {for\ } c
\end{cases}
$$
この関数は、$x=a$ で $0$ の値から出発し、$x=c$ に向かって直線的に増加し、
最頻値 $c$ でピークに達します。その後、$x=b$ まで直線的に減少し、そこで再び $0$ となります。
確率密度関数をグラフに描くと、底辺が $b-a$ の区間に広がり、高さが ${\cfrac {2}{b-a}}$ となる三角形になります。任意の
確率分布と同様に、この三角形の面積は $1$ となります。
分布関数
三角分布の分布関数 $F(x)$ は、確率変数 $X$ が $x$ 以下の値をとる累積確率 $P(X \le x)$ を示し、以下のように定義されます。
$$
F(x) = \begin{cases}
{\cfrac {(x-a)^{2}}{(b-a)(c-a)}} & \mathrm {for\ } a\leq x\leq c,
1-{\cfrac {(b-x)^{2}}{(b-a)(b-c)}} & \mathrm {for\ } c
\end{cases}
$$
この分布関数は、区間 $[a, b]$ 上で $0$ から $1$ まで増加する単調非減少関数であり、$x=a$ で $F(a)=0$、$x=b$ で $F(b)=1$ となります。
三角分布の重要な統計量である
平均 $E(X)$ と分散 $V(X)$ は、パラメータ $a, b, c$ を用いて計算できます。
平均 (Expected Value):
$$ E(X) = \frac{a+b+c}{3} $$
平均は、最小値、最大値、
最頻値の単純な算術
平均で与えられます。もし
最頻値 $c$ が区間 $[a, b]$ の中央に位置する場合、すなわち $c = \frac{a+b}{2}$ であれば、分布は対称となり、
平均は
最頻値および中央値と一致します。
分散 (Variance):
$$ V(X) = \frac{a^{2}+b^{2}+c^{2}-ab-ac-bc}{18} $$
分散は、確率変数が
平均値からどれだけ散らばっているかを示す指標です。三角分布の分散は、3つのパラメータ全てに依存します。$c$ の位置が区間の中央からずれるほど、分布は非対称になり、それに伴って
平均と
最頻値も一致しなくなります。
三角分布は、情報が限られている状況下で
確率分布を近似的に推定する場合や、シミュレーションモデリングにおける入力データの表現などに利用される、比較的単純ながらも実用的な
確率分布の一つです。