三角分布

三角分布



三角分布(さんかくぶんぷ、英: triangular distribution)は、確率論および統計学の分野で利用される連続確率分布です。この分布は、その確率密度関数が特定の区間上で三角形の形状を示すことに由来して名付けられました。ある事象の発生しうる値の範囲が明確であり、かつ最も可能性の高い値が一つだけ存在し、その値から離れるにつれて可能性が線形に減少していくような状況をモデル化するのにしばしば用いられます。

三角分布は、定義区間 $[a, b]$ 上で定義されます。この区間は、確率変数 $X$ が取りうる値の最小値 $a$ と最大値 $b$ によって定められます。加えて、分布の形状を決定する重要なパラメータとして、最頻値 $c$ があります。最頻値 $c$ は、確率密度が最大となる点であり、常に最小値と最大値の間に位置します($a \le c \le b$)。これらの3つのパラメータ、$a, b, c$ が三角分布を特徴づけます。

確率密度関数



三角分布の確率密度関数 $f(x)$ は、定義区間 $[a, b]$ 内において、以下の区分的に線形な関数として表現されます。

$$
f(x) = \begin{cases}
{\cfrac {2(x-a)}{(b-a)(c-a)}} & \mathrm {for\ } a\leq x {\cfrac {2}{b-a}} & \mathrm {for\ } x=c,
{\cfrac {2(b-x)}{(b-a)(b-c)}} & \mathrm {for\ } c \end{cases}
$$

この関数は、$x=a$ で $0$ の値から出発し、$x=c$ に向かって直線的に増加し、最頻値 $c$ でピークに達します。その後、$x=b$ まで直線的に減少し、そこで再び $0$ となります。確率密度関数をグラフに描くと、底辺が $b-a$ の区間に広がり、高さが ${\cfrac {2}{b-a}}$ となる三角形になります。任意の確率分布と同様に、この三角形の面積は $1$ となります。

分布関数



三角分布の分布関数 $F(x)$ は、確率変数 $X$ が $x$ 以下の値をとる累積確率 $P(X \le x)$ を示し、以下のように定義されます。

$$
F(x) = \begin{cases}
{\cfrac {(x-a)^{2}}{(b-a)(c-a)}} & \mathrm {for\ } a\leq x\leq c,
1-{\cfrac {(b-x)^{2}}{(b-a)(b-c)}} & \mathrm {for\ } c \end{cases}
$$

この分布関数は、区間 $[a, b]$ 上で $0$ から $1$ まで増加する単調非減少関数であり、$x=a$ で $F(a)=0$、$x=b$ で $F(b)=1$ となります。

平均と分散



三角分布の重要な統計量である平均 $E(X)$ と分散 $V(X)$ は、パラメータ $a, b, c$ を用いて計算できます。

平均 (Expected Value):
$$ E(X) = \frac{a+b+c}{3} $$
平均は、最小値、最大値、最頻値の単純な算術平均で与えられます。もし最頻値 $c$ が区間 $[a, b]$ の中央に位置する場合、すなわち $c = \frac{a+b}{2}$ であれば、分布は対称となり、平均最頻値および中央値と一致します。

分散 (Variance):
$$ V(X) = \frac{a^{2}+b^{2}+c^{2}-ab-ac-bc}{18} $$
分散は、確率変数が平均値からどれだけ散らばっているかを示す指標です。三角分布の分散は、3つのパラメータ全てに依存します。$c$ の位置が区間の中央からずれるほど、分布は非対称になり、それに伴って平均最頻値も一致しなくなります。

三角分布は、情報が限られている状況下で確率分布を近似的に推定する場合や、シミュレーションモデリングにおける入力データの表現などに利用される、比較的単純ながらも実用的な確率分布の一つです。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。