確率論や統計学において、「再生性」(さいせいせい、英: reproductive property)とは、特定の
確率分布の「族」、つまり同じ種類の分布の集まりが持つ重要な性質の一つです。具体的には、ある分布族 $\mathbb{F}$ に属する任意の二つの
確率分布 $F_1$ と $F_2$ を考えます。これらの分布にそれぞれ従う、互いに独立な二つの確率変数 $X_1$ および $X_2$ を取ったとき、それらの和 $X_1 + X_2$ の
確率分布が、元の分布族 $\mathbb{F}$ に再び属する場合、その分布族 $\mathbb{F}$ は再生性を持つと言います。
より形式的に述べると、分布族 $\mathbb{F}$ に対して、任意の $F_1, F_2 \in \mathbb{F}$ に従う独立な確率変数 $X_1 \sim F_1, X_2 \sim F_2$ を考えます。このとき、和 $X_1 + X_2$ の
確率分布を $F$ としたとき、$F \in \mathbb{F}$ が成り立つならば、分布族 $\mathbb{F}$ は再生性を有します。
この再生性という性質は、確率変数の和に関する計算を非常に単純化することがあります。例えば、同じ種類の分布に従う複数の独立な事象の結果を合計した際の分布を容易に知ることができます。統計学における標本平均の分布などを考える際に有用となります。
また、この性質は、数学的には「分布族が
畳み込み演算について閉じている」ことと同義です。二つの独立な確率変数の和の分布は、それぞれの
確率分布の
畳み込みによって得られるため、再生性とは、
畳み込みを行ってもその結果が元の分布族の枠内に収まることを意味しているのです。
再生性を持つ代表的な分布族
いくつかの主要な
確率分布族は再生性を持っています。ただし、多くの場合、再生性が成り立つためには分布を特徴づけるパラメータの一部が共通である必要があります。以下に代表的な例を挙げます(ここで扱う $X_1, X_2$ はすべて互いに独立であると仮定します)。
正規分布 (Normal Distribution)
正規分布族は再生性を持つ代表例です。平均 $\mu_i$、分散 $\sigma_i^2$ の
正規分布 $N(\mu_i, \sigma_i^2)$ に従う独立な確率変数 $X_1, X_2$ があるとき、その和 $X_1 + X_2$ は、平均 $\mu_1 + \mu_2$、分散 $\sigma_1^2 + \sigma_2^2$ の
正規分布 $N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2)$ に従います。パラメータによらず常に
正規分布族に属するため、非常に使いやすい性質です。
$X_1 \sim N(\mu_1, \sigma_1^2), X_2 \sim N(\mu_2, \sigma_2^2) \implies X_1 + X_2 \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2)$
コーシー分布 (Cauchy Distribution)
コーシー分布族も再生性を持ちます。
コーシー分布に従う独立な二つの確率変数の和は、再び
コーシー分布に従うことが知られています。
ガンマ分布 (Gamma Distribution)
ガンマ分布族は、尺度母数(スケールパラメータ)が共通である場合に再生性を持ちます。形状母数 $k_i$、尺度母数 $\theta$ のガンマ分布 $Gamma(k_i, \theta)$ に従う独立な確率変数 $X_1, X_2$ があるとき、その和 $X_1 + X_2$ は、形状母数 $k_1 + k_2$、尺度母数 $\theta$ のガンマ分布 $Gamma(k_1 + k_2, \theta)$ に従います。尺度母数 $\theta$ が異なる場合は、和の分布は一般にガンマ分布族に属しません。
$X_1 \sim Gamma(k_1, \theta), X_2 \sim Gamma(k_2, \theta) \implies X_1 + X_2 \sim Gamma(k_1 + k_2, \theta)$
ガンマ分布の特殊な場合として、形状母数 $k$ が整数の場合はアーラン分布、形状母数 $k$ が半整数の場合は
カイ二乗分布に相当します。したがって、これらの分布族も、対応するパラメータ(アーラン分布では率パラメータ、
カイ二乗分布では自由度)が適切であれば再生性を持つことがわかります。
二項分布 (Binomial Distribution)
二項分布族は、試行の成功確率 $p$ が共通である場合に再生性を持ちます。試行回数 $n_i$、成功確率 $p$ の
二項分布 $B(n_i, p)$ に従う独立な確率変数 $X_1, X_2$ があるとき、その和 $X_1 + X_2$ は、試行回数 $n_1 + n_2$、成功確率 $p$ の
二項分布 $B(n_1 + n_2, p)$ に従います。これは、$n_1$ 回のベルヌーイ試行での成功数と $n_2$ 回のベルヌーイ試行での成功数を合計すると、$n_1+n_2$ 回のベルヌーイ試行での成功数になる、と直感的に理解できます。成功確率 $p$ が異なる場合は再生性は成り立ちません。
$X_1 \sim B(n_1, p), X_2 \sim B(n_2, p) \implies X_1 + X_2 \sim B(n_1 + n_2, p)$
負の二項分布 (Negative Binomial Distribution)
負の
二項分布族は、成功確率 $p$ が共通である場合に再生性を持ちます。成功するまでの試行回数などをモデル化する際に用いられます。成功回数 $\alpha_i$、成功確率 $p$ の負の
二項分布 $NB(\alpha_i, p)$ に従う独立な確率変数 $X_1, X_2$ があるとき、その和 $X_1 + X_2$ は、成功回数 $\alpha_1 + \alpha_2$、成功確率 $p$ の負の
二項分布 $NB(\alpha_1 + \alpha_2, p)$ に従います。成功確率 $p$ が異なる場合は再生性は成り立ちません。
$X_1 \thicksim NB(\alpha_1, p), X_2 \thicksim NB(\alpha_2, p) \implies X_1 + X_2 \thicksim NB(\alpha_1 + \alpha_2, p)$
ポアソン分布 (Poisson Distribution)
ポアソン分布族は再生性を持ちます。単位時間あたりの平均事象発生数 $\lambda_i$ の
ポアソン分布 $Po(\lambda_i)$ に従う独立な確率変数 $X_1, X_2$ があるとき、その和 $X_1 + X_2$ は、平均事象発生数 $\lambda_1 + \lambda_2$ の
ポアソン分布 $Po(\lambda_1 + \lambda_2)$ に従います。これは、異なる時間間隔(または空間領域など)で独立に発生する稀な事象の合計回数が、その時間間隔(または空間領域)を合わせた全体での稀な事象の発生数に対応することから直感的に理解できます。
$X_1 \sim Po(\lambda_1), X_2 \sim Po(\lambda_2) \implies X_1 + X_2 \sim Po(\lambda_1 + \lambda_2)$
カイ二乗分布 (Chi-squared Distribution)
カイ二乗分布族は再生性を持ちます。自由度 $n, m$ の
カイ二乗分布 $\chi^2_n, \chi^2_m$ に従う独立な確率変数 $X_1, X_2$ があるとき、その和 $X_1 + X_2$ は、自由度 $n + m$ の
カイ二乗分布 $\chi^2_{n+m}$ に従います。これは、標準
正規分布に従う独立な確率変数の平方和が
カイ二乗分布に従う性質から導かれます。
$X_1 \sim \chi^2_n, X_2 \sim \chi^2_m \implies X_1 + X_2 \sim \chi^2_{n+m}$
関連概念
再生性と関連する概念として「
安定分布」(Stable distribution)があります。
安定分布とは、独立同分布に従う確率変数の和が、元の分布と同じ「型」(location-scale transformation を除いて)を持つ分布族です。
正規分布、
コーシー分布、レヴィ分布などは
安定分布に含まれます。再生性は、和の分布が全く同じ族に属する性質であり、
安定分布はもう少し広い概念と言えます(スケールや位置が変換される可能性を含む)。
これらの再生性を持つ分布は、統計モデリングや確率過程論など、様々な分野で基本的な役割を果たしています。