チェビシェフの不等式
チェビシェフの不等式(英: Chebyshev's inequality)は、確率論における重要な不等式で、パフヌティ・チェビシェフによって提唱されました。この不等式は、任意の確率分布において、分布の平均と標準偏差に関連した特性を示しています。
不等式の内容
この不等式は、任意の確率分布や標本がその平均の周囲でどのように分布しているかを示すものであり、特に分散が有限である場合に有効です。具体的には、平均から標準偏差の$n$倍以上離れた値の割合が、全体の$1/n^2$以下であることを示しています。たとえば、標準偏差の2倍以上離れた値は全体の1/4以下となります。この性質は、データがどのように偏在するかを把握する上で非常に役立ちます。
歴史的背景
この不等式は、もともと1853年にIrénée-Jules Bienayméによって証明されましたが、その後1867年にチェビシェフによってより一般的な形で再証明されました。さらに、彼の弟子である
アンドレイ・マルコフも1884年に異なる証明を行っています。これにより、チェビシェフの不等式は確率論と測度論において重要な地位を占めることとなりました。
測度論的表現
測度論を用いることで、この不等式はより一般的な形で記述できます。以下の式は、測度空間$(X, Σ, μ)$において拡張実数値可測関数$f$が与えられたときの不等式です。
$$
μ({x ∈ X : |f(x)| ≥ t}) ≤ rac{1}{t^2} ∫_X f^2 dμ
$$
ここで$g(t)$を適当に選ぶことで、一層一般的な表現が得られます。
確率論的表現
確率変数$X$に対して、一意に期待値$ ext{E}(X) = μ$および有限の分散$ ext{Var}(X) = σ^2$が存在する場合、チェビシェフの不等式は次のように表現されます。
$$
Pr(|X - μ| ≥ kσ) ≤ rac{1}{k^2}
$$
この式から、標準偏差の倍数だけ平均から外れた変数の取りうる確率の上限を示すことができます。特に、$k > 1$のときに成り立ちます。
実例を通じた理解
実例として、大量の文書があり、その平均の文字数が1000、標準偏差が200であると仮定すると、チェビシェフの不等式を利用して、一定の確率で文書の長さが一定の範囲に入ることがわかります。
- - 717文字から1282文字の文書は少なくとも50%含まれます。
- - 600文字から1400文字の文書は少なくとも75%を占めます。
- - 400文字から1600文字の文書は少なくとも88%に相当します。
このように、チェビシェフの不等式はデータの分布を分析するための強力なツールであり、
大数の法則とも関連しています。
証明の手法
この不等式の証明には、測度論的なアプローチと確率論的アプローチの2つがあります。測度論的なアプローチでは、特定の測度空間において不等式を適用し、確率論的なアプローチでは、マルコフの不等式を介して示されることが多いです。これらの証明により、チェビシェフの不等式は様々な応用を持ち、データの解析や理論的な研究において不可欠な存在とされています。