条件付き確率分布(conditional probability distribution)は、2つの
確率変数XとYがあるとき、Xの値が特定の値であることがわかったときのYの
確率分布を示します。この概念は、
確率論において非常に重要であり、
条件付き確率や条件付き
期待値の計算に使われます。
条件付き
累積分布関数(conditional cumulative distribution function)は、
確率変数Xと事象Aが与えられたときに定義されます。事象Aが発生する確率P(A)が0より大きい場合、条件付き
累積分布関数は次のように表示されます:
$$
F_{X|A}(x) = \frac{P(X \leq x \cap A)}{P(A)}
$$
これは、Xがx以下の値を取る確率が、事象Aが起こる条件のもとでの確率を計算する方法です。
離散
確率変数の
条件付き確率は、特定の値xにおけるYの確率を考えます。
条件付き確率質量関数(conditional probability mass function)は次のように定義されます:
$$
p_{Y|X}(y|x) = \frac{P(Y=y \cap X=x)}{P(X=x)}
$$
この表現は、Xがxである時にYがyを取る確率を示しています。
連続
確率変数の場合、
条件付き確率密度関数(conditional probability density function)について考えます。与えられたXの値に基づいてYの確率密度を計算し、以下の式で表されます:
$$
f_{Y}(y|X=x) = \frac{f_{X,Y}(x,y)}{f_{X}(x)}
$$
ここで、$f_{X,Y}(x,y)$はXとYの
同時分布、$f_{X}(x)$はXの
周辺分布を意味します。
特に、次の等式が成り立ちます:
$$
f_{Y}(y|X=x)f_{X}(x) = f_{X,Y}(x,y) = f_{X}(x|Y=y)f_{Y}(y)
$$
直観的な理解とパラドックス
連続
確率分布における条件付き分布を理解するのは直観的ではないことがあります。特に、$f_{X}(x) = 0$のときに発生するボレル-コルモゴロフのパラドックスは、座標変換に対して
確率密度関数が常に不変ではないことを示しています。
条件付き確率分布は確率的なXとYの関係を示しており、次のように表現されます:
$$
Y_{|X} \sim f(Y|X)
$$
一方、決定論的な
写像$Y = f(X)$では、特定のXに対するYの一意的な値が定義されます。この場合、
条件付き確率分布も次のように記述できます:
$$
Y_{|X} \sim f(Y|X) = \delta(Y - f_{\theta}(X))
$$
ここで、$
abla(Y)$は
ディラックのデルタ関数を示し、この関数は特定の点でのみ非ゼロである
確率密度関数を表しています。
以上のように、
条件付き確率分布は
確率論の中でも非常に重要な概念であり、様々な
確率変数の関係性を理解するために不可欠です。この知識は、統計解析や機械学習などの多くの分野で活用されます。