確率質量関数 (PMF)
確率質量関数、略してPMF(Probability Mass Function)は、
確率論および
統計学の分野において、離散型
確率変数が特定の値を取る確率を定義する重要な関数です。PMFは、事象の発生確率を高々可算個の要素に対応づけて計算し、その結果をもとに様々な統計的解析を行う基盤となっています。
定義と性質
離散型
確率変数Xが
標本空間Sにおいて定義された場合、確率質量関数fXはAから[0, 1]への関数として次のように表現されます:
$$
f_{X}(x) = P(X = x) = P(\{s \in S \mid X(s) = x\})
$$
ここで、Xの各可能な値xに対し、確率が振り分けられます。例えば、
確率変数が値aをとる場合、その質量はP(X = a)であり、その総和は全ての可能なxに対して常に1に等しくなります:
$$
\sum_{x \in A} f_{X}(x) = 1
$$
この特性により、確率質量関数は離散なデータの解析に際して特に有用です。
不連続性とグラフ
離散型
確率変数は、数え上げ可能な値を持つため、この確率質量関数は高々可算集合を形成します。よって、確率質量関数の値は、離散な点以外では0となります。したがって、特定のxがXの像に属さない場合には、
fX(x) = 0となります。この特徴により、確率質量関数は不連続な関数であり、離散型
確率変数の
累積分布関数(CDF)も同様に不連続となることが確認できます。
PMFは、
[測度論]]的な枠組みでも定義されることがあります。確率空間]を考え、選ばれる測度空間(B, B)が離散的な場合、離散型[[確率変数Xはその像が可算集合に属することから、PMFを数え上げ測度に関連付けることが可能です。この文脈では、
確率変数Xの分布は次のように表されます:
$$
f_{X}(b) = P(X^{-1}(b))
$$
これにより、確率質量関数は、
確率変数の特性を表す重要な要素となります。
実例
例えば、公正なコインを一度投げる場合を考えましょう。
標本空間Sは投げられたコインが表(1)または裏(0)になる全ての組み合わせを含みます。この時、確率質量関数は次のように定義されます:
$$
f_{X}(x) = \begin{cases}
\frac{1}{2}, & x \in \{0, 1\} \\
0, & x
otin \{0, 1\}
\end{cases}
$$
このPMFは二項分布の特別な場合に当たり、確率質量関数の具体的な適用例として理解されます。さらに、多値をとる離散分布においては、多項分布が代表的な例となるでしょう。これらの概念により、確率質量関数は離散事象の解析において不可欠な存在となっています。
まとめ
確率質量関数は、離散型
確率変数の性質を利用した確率の解析を行うための基本的なツールです。不連続性や様々な数学的基礎に基づいて、多くの応用が期待されます。