極値分布(きょくちぶんぷ)
極値分布とは、
確率論および
統計学の分野で用いられる連続
確率分布の一つです。この分布は、多数の観測データからなる標本において、最も大きい値(最大値)や最も小さい値(最小値)といった「極端な値(極値)」がどのような確率で出現するか、あるいはこれらの極値が長期的にどのようなパターンを示すかを記述するために用いられます。特に、大量のデータの中から取り出した最大値や最小値といった極値が、データの個数が非常に多くなったときに漸近的に従うことで知られています。
極値分布は、自然現象や社会現象における極端な事象を分析する上で重要なツールとなります。例えば、河川の年間最大水位の予測、ある地点における最大瞬間風速の発生確率の推定、あるいは金融市場における極端な価格変動リスクの評価など、リスク管理や設計において不可欠な役割を果たしています。
一般化極値分布(GEV)
極値分布にはいくつかの類型がありますが、これらを統一的に扱える
一般化極値分布(Generalized Extreme Value distribution, GEV)が広く用いられています。GEVは、データの最大値が漸近的に従う分布として定義され、その
累積分布関数は特定の数式によって表されます。この分布は、位置パラメータ (μ)、尺度パラメータ (θ > 0)、および形状パラメータ (γ) という3つのパラメータによってその形状が定まります。これらのパラメータの値を調整することで、様々なタイプの極値分布を表現することが可能です。
GEVは一般的に「極大値分布」を記述するために用いられます。一方、標本における最小値が漸近的に従う分布は「極小値分布」と呼ばれます。極小値分布は、極大値分布において確率変数Xを-Xに変換することで得られます。具体的には、極大値分布の
累積分布関数を F(x)、
確率密度関数を f(x) とした場合、対応する極小値分布の
累積分布関数は 1 - F(-x)、
確率密度関数は f(-x) となります。以下では特に断りのない限り、極大値分布であるGEVについて説明します。
一般化極値分布の3つの型
GEVは、その形状パラメータγの値によって、以下の3つの異なる型に分類されます。これらの型は、もとのデータ分布の裾野(すその)の振る舞いに関連しています。
1.
タイプI(ガンベル型)
形状パラメータγが0である場合に対応します。この型は、極値分布に関する初期の研究者であるドイツの数学者エミール・ユリウス・ガンベルにちなんで「ガンベル分布」とも呼ばれます。また、その
累積分布関数の特定の形から「二重指数分布」と呼ばれることもありますが、
確率分布の
ラプラス分布とは異なるものです。
2.
タイプII(フレシェ型)
形状パラメータγが正の値(γ > 0)である場合に対応します。この型の分布に従う確率変数に対してある特定の対数変換を行うと、タイプIのガンベル分布に従う分布形に変換される性質を持ちます。
3.
タイプIII(ワイブル型)
形状パラメータγが負の値(γ < 0)である場合に対応します。この型の分布に従う確率変数に対しても、ある特定の対数変換を行うとタイプIのガンベル分布に従う分布形に変換される性質があります。また、このタイプIII分布において確率変数Xを-Xに置き換えた分布は、信頼性工学などで広く用いられる
ワイブル分布と関連が深いです。信頼性工学では、部品などが故障するまでの時間は、その部品が機能し続ける最小の時間を表すと考えられ、極小値分布の理論が応用される場面があります。
これらの3つの型は、GEVのパラメータγの値を調整することで表現される、極値分布の主要な形状です。データの性質に応じて適切な型を選択し、極値現象の確率を評価することが、様々な分野でのリスク分析や意思決定において重要となります。