概要
対数
正規分布は、
確率論および
統計学において用いられる、正の数のみを値として取る連続
確率分布です。この分布の最大の定義上の特徴は、それに従う
確率変数 X の自然対数 ln(X) を取ったときに、その結果が
正規分布に従うという点にあります。この
正規分布との密接な関連性から、「対数
正規分布」という名前がついています。
正規分布が実数全体を値域とするのに対し、対数
正規分布はゼロより大きい値のみを取る事象をモデル化するのに適しています。
定義
対数
正規分布は、
正規分布と同様に2つのパラメータによって特徴づけられます。通常、
確率変数 X の対数 ln(X) が従う
正規分布の
平均 μ と標準偏差 σ (ただし σ > 0) をパラメータとし、Λ(μ, σ²) と表記されます。
確率変数 X が対数
正規分布 Λ(μ, σ²) に従うとき、その
確率密度関数 f(x) は x > 0 の範囲で以下のように定義されます。
$$f(x; \mu, \sigma^2) = \frac{1}{x\sigma\sqrt{2\pi}} \exp\left(-\frac{(\ln x - \mu)^2}{2\sigma^2}\right), \quad x > 0$$
この関数形は、
正規分布の
確率密度関数における変数変換(y = ln x)とヤコビアン(dx/dy = exp(y) = x)を用いて導出されます。この
確率密度関数を積分することで得られる分布関数 F(x) は、標準
正規分布の分布関数 Φ などを用いて表現できます。
標準対数正規分布
正規分布における標準
正規分布と同様に、対数
正規分布にも標準形が存在します。パラメータ μ = 0、σ² = 1 の場合の対数
正規分布 Λ(0, 1) を、特に標準対数
正規分布と呼びます。これは、
確率変数 X の対数 ln(X) が標準
正規分布 N(0, 1) に従う場合に相当します。
正規分布との関係
対数
正規分布と
正規分布の間の関係は、名称の由来でもあり、この分布を理解する上で最も重要です。
確率変数 Y が
正規分布 N(μ, σ²) に従うならば、その指数関数 $X = e^Y$ (または exp(Y)) で得られる
確率変数 X は対数
正規分布 Λ(μ, σ²) に従います。逆に、
確率変数 X が対数
正規分布 Λ(μ, σ²) に従うならば、その自然対数 $Y = \ln X$ は
正規分布 N(μ, σ²) に従います。この相互変換の関係性から、対数
正規分布に関連する多くの計算や性質は、
正規分布に関する既存の知識を利用して導き出すことができます。
主要な性質
対数
正規分布はいくつかの重要な性質を持っています。
平均と分散: 対数
正規分布 Λ(μ, σ²) に従う
確率変数 X の
期待値(
平均)と分散は、
正規分布のパラメータ μ と σ² を用いて与えられます。
平均 $E(X) = e^{\mu + \sigma^2/2}$、分散 $V(X) = e^{2\mu + \sigma^2}(e^{\sigma^2}-1)$ となります。これらの式からも分かるように、対数
正規分布の
平均や分散は
正規分布の場合と比べて複雑な形をしており、特に分散は σ² が大きくなると急激に増加する傾向があります。
再生性: 互いに独立な2つの
確率変数 X₁ と X₂ がそれぞれ対数
正規分布 Λ(μ₁, σ₁²) と Λ(μ₂, σ₂²) に従う場合、それらの積 X₁X₂ もまた対数
正規分布に従います。この積の分布は Λ(μ₁ + μ₂, σ₁² + σ₂²) となります。これは、ln(X₁) が N(μ₁, σ₁²)、ln(X₂) が N(μ₂, σ₂²) に従い、独立な
正規分布に従う変数の和 ln(X₁) + ln(X₂) = ln(X₁X₂) が
正規分布 N(μ₁ + μ₂, σ₁² + σ₂²) に従うという、
正規分布の
再生性の直接的な結果です。
*
中心極限定理の類似:
独立同分布に従う
確率変数 X₁, ..., Xn が全て正の値を取り、かつその対数 ln(Xᵢ) の
平均 E[ln(Xᵢ)] = μ および分散 V[ln(Xᵢ)] = σ² が有限であるという条件を満たすとき、これらの
確率変数の「積」である $P_n = X_1 X_2 \dots X_n$ の分布は、サンプルサイズ n を大きくするにつれて漸近的に対数
正規分布 Λ(nμ, nσ²) に近づきます。これは、
正規分布における「和」に関する
中心極限定理が、対数
正規分布では「積」に対して成り立つという重要な類似を示しており、経済学や物理学など、乗法的な過程を経て生成されるデータが対数
正規分布に従うことが多い理由を説明しています。
関連分布
一般的な対数
正規分布を拡張した「n次対数
正規分布」という概念も存在します。これはエスペンシェイドらによって提案されたもので、その
確率密度関数は通常の対数
正規分布(n=-1の場合に相当)を特殊な場合として含みます。
特に、n=0 の場合の「0次対数
正規分布 (ZOLD: Zero-th Order Lognormal Distribution)」は、その
最頻値がパラメータ μ に等しく、別のパラメータ σ に依存しないという性質を持つため、直感的にも理解しやすい分布形として知られています。このため、特定の物理現象のモデリングなどで利用されることがあります。
応用
対数
正規分布は、自然科学、社会科学、工学など、様々な分野で観測されるデータの分布を記述するために広く用いられています。例えば、個人の所得分布(特に高所得層)、都市の人口規模、物理的な粒子のサイズ分布(粉体工学)、森林における木の直径、生物の成長速度、病気の潜伏期間、さらには金融市場における資産価格の変動やオプション価格のモデル化(ブラック-ショールズモデルなど)にも応用されています。これらの現象の多くは、時間経過とともに値が乗法的に変化したり、物理的に負の値を取り得ないといった特性を持つため、対数
正規分布が自然なモデルとして適合します。
まとめ
対数
正規分布は、正の値を取り、その対数が
正規分布に従うというユニークな性質を持つ
確率分布です。積に関する
中心極限定理の類似や
再生性といった性質を持ち、乗法的な過程や正の値に限定される様々な現象のモデル化において重要な役割を果たしています。
正規分布と表裏一体の関係にあり、多くの分野で実データの分布を理解し、分析するための基盤となっています。