離散
確率分布とは、
確率論や
統計学において、
確率変数の値が限られた数量(可算個)の場合に成り立つ
確率分布のことを指します。具体的には、0でない確率を持つ可能な
確率変数の値の集まりが高々可算個であることを意味します。この定義は、
確率変数が離散型である場合に常に成り立ちます。
定義と特性
確率分布が離散である場合、次のように表されます。
$$
\{u \in \mathbb{R} \mid P(X = u)
eq 0\} \leq \aleph_0
$$
ここで、$
\aleph_0$
は可算濃度を表し、
確率変数がいくつの異なる確率を持っていても、その全ての値は高々可算個である必要があります。この場合、
確率質量関数がこの分布を具体的に表現しています。
また、離散
確率分布の
累積分布関数(CDF)は階段関数の形を持っています。これは、特定の点でのみその値が増加し、不連続点間では一定であるという性質です。これにより、離散型
確率変数が持つ確率の全ての値は孤立点として表現され、離散集合と呼ばれるわけです。
代表的な離散
確率分布には、以下のようなものがあります:
これらの分布は、さまざまな現象をモデル化するために広く利用されており、例えば
ポアソン分布は一定期間内の事象の発生回数をモデル化します。
さらに、離散一様分布は、コンピュータプログラムで無作為な選択を行う際に頻繁に使用されています。これにより、特定の範囲内の数値が同様の確率で選ばれるようになります。
離散型
確率変数は、一部の定義ではその
累積分布関数が不連続な点でのみ増加するように説明されます。これにより、CDFが増加する点は、その変数の取り得る値と直接的にリンクしています。このジャンプ不連続の数は、有限または可算無限であることが一般的です。
例えば、全ての
有理数でジャンプするような状況も考えられますが、これが必ずしも離散的であるとは限りません。この分布は、
ディラックのデルタ関数の形を取り入れることで、連続分布との融合が可能であり、特に連続部分と離散部分が組み合わさったプロセスにおいて役立ちます。
確率変数は、
指示関数を用いて表現することも可能です。設定された0でない
確率変数値を$u_0, u_1, ext{...}$とし、それぞれに対応する事象を次のように定義できます。
$$
\Omega_i = X^{-1}({u_i}) = \{\omega \in \Omega \mid X(\omega) = u_i\},\, i = 0, 1, 2, \cdots
$$
確率変数$X$は次の式で表現でき、この形式により、離散型
確率変数を別な視点から理解することが可能です。
$$
X = \sum_i \alpha_i 1_{\Omega_i}
$$
ここで、$
\alpha_i = P(X = u_i)
$は
確率質量関数を示し、$1_A$は事象Aの
指示関数です。
まとめ
離散
確率分布は、限られた確率の取り得る値に基づく数理的枠組みを提供するものであり、さまざまな具体的な分布を通じて実世界の現象をモデル化する手法として重要な役割を担っています。