対数正規分布

対数正規分布



概要

対数正規分布は、確率論および統計学において用いられる、正の数のみを値として取る連続確率分布です。この分布の最大の定義上の特徴は、それに従う確率変数 X の自然対数 ln(X) を取ったときに、その結果が正規分布に従うという点にあります。この正規分布との密接な関連性から、「対数正規分布」という名前がついています。正規分布が実数全体を値域とするのに対し、対数正規分布はゼロより大きい値のみを取る事象をモデル化するのに適しています。

定義

対数正規分布は、正規分布と同様に2つのパラメータによって特徴づけられます。通常、確率変数 X の対数 ln(X) が従う正規分布平均 μ と標準偏差 σ (ただし σ > 0) をパラメータとし、Λ(μ, σ²) と表記されます。確率変数 X が対数正規分布 Λ(μ, σ²) に従うとき、その確率密度関数 f(x) は x > 0 の範囲で以下のように定義されます。

$$f(x; \mu, \sigma^2) = \frac{1}{x\sigma\sqrt{2\pi}} \exp\left(-\frac{(\ln x - \mu)^2}{2\sigma^2}\right), \quad x > 0$$

この関数形は、正規分布確率密度関数における変数変換(y = ln x)とヤコビアン(dx/dy = exp(y) = x)を用いて導出されます。この確率密度関数を積分することで得られる分布関数 F(x) は、標準正規分布の分布関数 Φ などを用いて表現できます。

標準対数正規分布

正規分布における標準正規分布と同様に、対数正規分布にも標準形が存在します。パラメータ μ = 0、σ² = 1 の場合の対数正規分布 Λ(0, 1) を、特に標準対数正規分布と呼びます。これは、確率変数 X の対数 ln(X) が標準正規分布 N(0, 1) に従う場合に相当します。

正規分布との関係

対数正規分布正規分布の間の関係は、名称の由来でもあり、この分布を理解する上で最も重要です。確率変数 Y が正規分布 N(μ, σ²) に従うならば、その指数関数 $X = e^Y$ (または exp(Y)) で得られる確率変数 X は対数正規分布 Λ(μ, σ²) に従います。逆に、確率変数 X が対数正規分布 Λ(μ, σ²) に従うならば、その自然対数 $Y = \ln X$ は正規分布 N(μ, σ²) に従います。この相互変換の関係性から、対数正規分布に関連する多くの計算や性質は、正規分布に関する既存の知識を利用して導き出すことができます。

主要な性質

対数正規分布はいくつかの重要な性質を持っています。

平均と分散: 対数正規分布 Λ(μ, σ²) に従う確率変数 X の期待値平均)と分散は、正規分布のパラメータ μ と σ² を用いて与えられます。平均 $E(X) = e^{\mu + \sigma^2/2}$、分散 $V(X) = e^{2\mu + \sigma^2}(e^{\sigma^2}-1)$ となります。これらの式からも分かるように、対数正規分布平均や分散は正規分布の場合と比べて複雑な形をしており、特に分散は σ² が大きくなると急激に増加する傾向があります。
再生性: 互いに独立な2つの確率変数 X₁ と X₂ がそれぞれ対数正規分布 Λ(μ₁, σ₁²) と Λ(μ₂, σ₂²) に従う場合、それらの積 X₁X₂ もまた対数正規分布に従います。この積の分布は Λ(μ₁ + μ₂, σ₁² + σ₂²) となります。これは、ln(X₁) が N(μ₁, σ₁²)、ln(X₂) が N(μ₂, σ₂²) に従い、独立な正規分布に従う変数の和 ln(X₁) + ln(X₂) = ln(X₁X₂) が正規分布 N(μ₁ + μ₂, σ₁² + σ₂²) に従うという、正規分布再生性の直接的な結果です。
* 中心極限定理の類似: 独立同分布に従う確率変数 X₁, ..., Xn が全て正の値を取り、かつその対数 ln(Xᵢ) の平均 E[ln(Xᵢ)] = μ および分散 V[ln(Xᵢ)] = σ² が有限であるという条件を満たすとき、これらの確率変数の「積」である $P_n = X_1 X_2 \dots X_n$ の分布は、サンプルサイズ n を大きくするにつれて漸近的に対数正規分布 Λ(nμ, nσ²) に近づきます。これは、正規分布における「和」に関する中心極限定理が、対数正規分布では「積」に対して成り立つという重要な類似を示しており、経済学や物理学など、乗法的な過程を経て生成されるデータが対数正規分布に従うことが多い理由を説明しています。

関連分布

一般的な対数正規分布を拡張した「n次対数正規分布」という概念も存在します。これはエスペンシェイドらによって提案されたもので、その確率密度関数は通常の対数正規分布(n=-1の場合に相当)を特殊な場合として含みます。

特に、n=0 の場合の「0次対数正規分布 (ZOLD: Zero-th Order Lognormal Distribution)」は、その最頻値がパラメータ μ に等しく、別のパラメータ σ に依存しないという性質を持つため、直感的にも理解しやすい分布形として知られています。このため、特定の物理現象のモデリングなどで利用されることがあります。

応用

対数正規分布は、自然科学、社会科学、工学など、様々な分野で観測されるデータの分布を記述するために広く用いられています。例えば、個人の所得分布(特に高所得層)、都市の人口規模、物理的な粒子のサイズ分布(粉体工学)、森林における木の直径、生物の成長速度、病気の潜伏期間、さらには金融市場における資産価格の変動やオプション価格のモデル化(ブラック-ショールズモデルなど)にも応用されています。これらの現象の多くは、時間経過とともに値が乗法的に変化したり、物理的に負の値を取り得ないといった特性を持つため、対数正規分布が自然なモデルとして適合します。

まとめ

対数正規分布は、正の値を取り、その対数が正規分布に従うというユニークな性質を持つ確率分布です。積に関する中心極限定理の類似や再生性といった性質を持ち、乗法的な過程や正の値に限定される様々な現象のモデル化において重要な役割を果たしています。正規分布と表裏一体の関係にあり、多くの分野で実データの分布を理解し、分析するための基盤となっています。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。