周辺分布とは
周辺分布(marginal distribution)とは、同時確率分布から特定の確率変数を考慮せずに得られる確率分布のことです。周辺分布を計算するプロセスは「周辺化(marginalizing)」と呼ばれ、特定の変数を除外して他の変数の情報を集約します。周辺分布は通常、確率質量関数や確率密度関数を用いた和や積分を用いて計算されます。
周辺分布という用語は、表の欄外(マージン)に行や列の総和が示されることに由来しています。このように、周辺分布は、ある確率変数の全ての可能性を含むことから「周辺」と名付けられました。周辺分布は非常に重要で、様々な確率分布において周辺化が可能です。
周辺分布と条件付き確率分布
周辺分布に関連して、条件付き確率分布(conditional probability distribution)という概念があります。条件付き確率分布は、特定の確率変数が特定の値を持つ条件のもとでの確率分布を指します。このように、条件付き確率分布は特定の条件を満たす確率を示すのに対し、周辺分布は変数を除外し全体の分布を示します。
周辺分布の定義
周辺分布は主に以下のように定義されます。まず、
同時分布として表される確率関数 P(X, Y) および条件付き確率分布 P(X|Y) をもとに定義されます。
離散型確率分布
離散型の確率変数の場合、特定の変数 Y に対して周辺化された変数 X の周辺確率質量関数 P_X(X) は次のように定義されます:
P_X(X) = Σ_{y ∈ Y} P(X, y) = Σ_{y ∈ Y} P(X|y)P_Y(y)
ここで、Σは和を表し、P(X, y)は同時確率分布、P(X|y)は条件付き確率分布、P_Y(y)は変数 Y の確率です。
連続型確率分布
一方、連続型確率分布においては、確率密度関数が存在し、関数 P_X(X) は次のように定義されます:
P_X(X) = ∫ P(X, y) dy = ∫ P(X|y)P_Y(y) dy
ここで、∫は積分を表します。連続型分布の場合、周辺分布は確率密度関数を用いることで導出されます。
まとめ
周辺分布は確率論や統計学において重要な役割を果たしています。データを扱う際、全体の関係性を理解するために、特定の変数を周辺化して分析することは非常に有用です。特定のケースにおいて、周辺分布による分析は、データのパターンや特性をよりクリアに示すことができます。そのため、確率論を学ぶ上で周辺分布についての理解は欠かせません。