同時確率分布についての概要
同時確率分布という用語は、確率論の分野で使用される重要な概念であり、複数の確率変数が組になった時の確率分布を指します。
英語では「joint probability distribution」とも表現され、一般的に様々な場面で利用されます。
定義と表現
同時確率分布は、n 個の確率変数 X1, X2, …, Xn の組み合わせに対して、それぞれの組 (X1, X2, …, Xn) に確率を対応づける関数として定義されます。この関数は Rn 上の測度を形成し、記号 P_{X_{1},X_{2}, ext{...},X_{n}}(⋅) として表されます。また、同時分布に関連するその他の表現、例えば同時累積分布関数や同時確率密度関数も重要です。
多次元の確率分布の理解を助けるために、日本の工業規格ではこれらの定義が詳しく説明されています。
離散型確率変数の場合
2種類の離散型確率変数の同時確率分布は、同時確率質量関数によって表されます。具体的な例として、1円硬貨と5円硬貨を振る実験を考えてみましょう。この試行では、各硬貨の点数をそれぞれ1点と0点にして、X を1円硬貨の点数、Y を2つの硬貨のうち大きい方の点数とします。
ここで、Y はXより小さくなることはなく、得られる組み合わせには特定の確率があります。具体的には、表と裏の結果によって (X, Y) の組み合わせが決まり、結果として (0, 0)、(0, 1)、(1, 1) などが得られます。全ての可能性を考慮すると、これらの組み合わせには合計4通りの異なる結果が存在します。
この事例を用いて同時確率質量関数を作成することができます。表を作成すると、各確率は一目で分かる形になり、その中で特定の条件付き確率や周辺確率も簡単に算出できるようになります。たとえば、期待値や分散も同様に計算可能で、E(X) = 1/2, V(X) = 1/4 などの値が得られます。
共分散と相関係数
同時確率質量関数を利用することで、確率変数XとYの積の期待値や共分散を計算することが可能です。共分散はCov(X, Y) = E(XY) − E(X)E(Y)で算出でき、これによりXとYがどれだけ関連しているかを示す指標を得ることができます。さらに、相関係数ρはCov(X, Y)を各変数の分散の平方根で割ったもので定義されます。これにより、XとYの間の関連性の強さを数値で把握できます。
条件付き確率質量関数
条件付き確率質量関数は、同時確率質量関数から特定の行や列を選び、その合計が1になるよう調整したものです。例えば、Yの値が1である条件を加えた場合、Xの条件付き分布は異なった確率分布に変わります。
条件付き期待値や分散は、条件付き確率質量関数を使い、期待する確率の計算を行うことによって得られ、その変化を理解することができます。例えば、Y = 1の条件下におけるXの期待値はE(X | Y = 1) = 2/3となり、Y = 0の時はE(X | Y = 0) = 0といった形です。
参考文献
このように、同時確率分布は確率論や統計学において基本的かつ不可欠な概念です。さらに深く理解するための文献として、西岡康夫や
伏見康治の著書を参照することが有益です。