ポアソン二項分布 (Poisson binomial distribution)
ポアソン
二項分布は、
統計学および
確率論の分野で扱われる重要な離散
確率分布です。この分布は、それぞれが独立した試行であり、結果が成功か失敗かのいずれかである
ベルヌーイ試行を複数回(n回)行った際に、成功した合計回数が従う
確率分布として定義されます。
通常の
ベルヌーイ試行では、各試行で成功する確率は一定(p)ですが、ポアソン
二項分布の定義では、これらのn回の試行において、成功する確率が各試行ごとに異なっていても構いません。例えば、1回目の試行では成功確率p₁、2回目はp₂、…、n回目はpₙのように、個別の確率が設定されている場合です。このような独立かつ成功確率が異なるn回の
ベルヌーイ試行を行い、その合計成功回数をXとすると、Xが従う分布がポアソン
二項分布となります。
もし、これら全ての試行において成功確率が同じ値(p)であるならば、この分布はよく知られた
二項分布と全く同じになります。つまり、ポアソン
二項分布は、
二項分布をより広範なケース(成功確率が異なる場合)に一般化したものと言えます。
ポアソン
二項分布において、n回の試行でちょうどk回成功する確率P(X=k)は、定義から直接導出できます。k回の成功が得られる可能性のある全ての組み合わせ(n回の試行のうちどのk回が成功し、残りのn-k回が失敗するか、という組み合わせ)を考慮し、それぞれの組み合わせが発生する確率を計算して合計することで求められます。
具体的には、成功する試行の確率の積と、失敗する試行の確率の積を掛け合わせたものを、k回の成功が得られる全ての組み合わせについて足し合わせるという形になります。しかし、このような組み合わせの数は、試行回数nが増えると非常に急速に増加します。例えば、n=30のときに15回成功する場合の組み合わせ数は10²⁰を超えるほどになります。そのため、nの値が大きい場合には、定義に従って確率を直接計算することは現実的ではありません。
幸いなことに、ポアソン
二項分布の
確率質量関数を計算するための効率的なアルゴリズムがいくつか開発されています。これらには、確率P(X=k)をk-1以下の確率から順に計算していく再帰的な手法や、複雑な計算を高速化するために
離散フーリエ変換を利用する方法などが含まれます。これらの手法を用いることで、nが大きい場合でも比較的容易に確率を計算することが可能になっています。
平均と分散
ポアソン
二項分布は、独立な複数の
確率変数の合計として定義されるため、その平均(
期待値)と分散は、それぞれの
確率変数(各
ベルヌーイ試行)の平均と分散を単純に足し合わせることで求められます。
各試行iの成功確率をpᵢとすると、試行iの平均はpᵢ、分散はpᵢ(1-pᵢ)となります。したがって、ポアソン
二項分布に従う
確率変数Xの平均μと分散σ²は、以下の式で与えられます。
平均: μ = Σ pᵢ (全てのpᵢの合計)
分散: σ² = Σ pᵢ(1-pᵢ) (全てのpᵢ(1-pᵢ)の合計)
ポアソン分布による近似(レ・カムの定理)
ポアソン
二項分布の重要な性質の一つに、
ポアソン分布による近似の可能性を示すレ・カムの定理があります。この定理は、試行回数nが多い場合に、ポアソン
二項分布が特定の条件下で
ポアソン分布に近づくことを定量的に示しています。
定理によれば、合計成功回数Snがポアソン
二項分布に従うとき、その分布の確率と、平均をλn(各成功確率pᵢの合計)とする
ポアソン分布の確率との差の合計(総変動距離)が、各成功確率pᵢの二乗の合計の2倍未満に抑えられることが保証されます。
これは非常に重要な結果であり、成功確率が非常に小さい試行を多数行う場合に、合計成功回数が
ポアソン分布で近似できるというポアソン極限定理を、成功確率が異なる場合にも拡張した、より一般的な結果と言えます。この定理は、ポアソン
二項分布を
ポアソン分布で近似することの妥当性とその近似誤差の目安を与えてくれます。
ポアソン
二項分布は、様々な確率的な事象(例:稀な出来事の発生回数、品質管理における不良品の数など)のモデリングに応用されます。
関連項目
二項分布
ポアソン分布