同時確率分布についての概要
同時
確率分布という用語は、
確率論の分野で使用される重要な概念であり、複数の
確率変数が組になった時の
確率分布を指します。
英語では「joint probability distribution」とも表現され、一般的に様々な場面で利用されます。
定義と表現
同時
確率分布は、n 個の
確率変数 X1, X2, …, Xn の組み合わせに対して、それぞれの組 (X1, X2, …, Xn) に
確率を対応づける関数として定義されます。この関数は Rn 上の測度を形成し、記号 P_{X_{1},X_{2}, ext{...},X_{n}}(⋅) として表されます。また、同時分布に関連するその他の表現、例えば同時
累積分布関数や同時
確率密度関数も重要です。
多次元の
確率分布の理解を助けるために、日本の工業規格ではこれらの定義が詳しく説明されています。
離散型確率変数の場合
2種類の離散型
確率変数の同時
確率分布は、同時
確率質量関数によって表されます。具体的な例として、1円硬貨と5円硬貨を振る実験を考えてみましょう。この試行では、各硬貨の点数をそれぞれ1点と0点にして、X を1円硬貨の点数、Y を2つの硬貨のうち大きい方の点数とします。
ここで、Y はXより小さくなることはなく、得られる組み合わせには特定の
確率があります。具体的には、表と裏の結果によって (X, Y) の組み合わせが決まり、結果として (0, 0)、(0, 1)、(1, 1) などが得られます。全ての可能性を考慮すると、これらの組み合わせには合計4通りの異なる結果が存在します。
この事例を用いて同時
確率質量関数を作成することができます。表を作成すると、各
確率は一目で分かる形になり、その中で特定の
条件付き確率や周辺
確率も簡単に算出できるようになります。たとえば、
期待値や分散も同様に計算可能で、E(X) = 1/2, V(X) = 1/4 などの値が得られます。
同時
確率質量関数を利用することで、
確率変数XとYの積の
期待値や
共分散を計算することが可能です。
共分散はCov(X, Y) = E(XY) − E(X)E(Y)で算出でき、これによりXとYがどれだけ関連しているかを示す指標を得ることができます。さらに、
相関係数ρはCov(X, Y)を各変数の分散の平方根で割ったもので定義されます。これにより、XとYの間の関連性の強さを数値で把握できます。
条件付き確率質量関数は、同時
確率質量関数から特定の行や列を選び、その合計が1になるよう調整したものです。例えば、Yの値が1である条件を加えた場合、Xの条件付き分布は異なった
確率分布に変わります。
条件付き
期待値や分散は、
条件付き確率質量関数を使い、期待する
確率の計算を行うことによって得られ、その変化を理解することができます。例えば、Y = 1の条件下におけるXの
期待値はE(X | Y = 1) = 2/3となり、Y = 0の時はE(X | Y = 0) = 0といった形です。
参考文献
このように、同時
確率分布は
確率論や
統計学において基本的かつ不可欠な概念です。さらに深く理解するための文献として、西岡康夫や
伏見康治の著書を参照することが有益です。