分散
共分散行列(variance-covariance matrix)は、
統計学と
確率論において、複数の
確率変数の間の関係性を示す
行列です。この
行列は特に、
確率変数の分散や
共分散を格納する上で非常に便利です。分散という概念は、単一の
確率変数のばらつきを表っており、
共分散は二つの
確率変数間のばらつきの関係を示します。
定義
分散
共分散行列は、次のような列
ベクトル:
$$
X = \begin{bmatrix} X_1 \\\ X_2 \\\ \vdots \\\ X_n \end{bmatrix}
$$
の要素間の
共分散を表す
行列
$$
\Sigma = \begin{bmatrix} \mathrm{E} [(X_1 - \mu_1)(X_1 - \mu_1)] & \mathrm{E} [(X_1 - \mu_1)(X_2 - \mu_2)] & \cdots \\\ \mathrm{E} [(X_2 - \mu_2)(X_1 - \mu_1)] & \mathrm{E} [(X_2 - \mu_2)(X_2 - \mu_2)] & \cdots \\\ \vdots & \vdots & \ddots \end{bmatrix}
$$
ここで、$
\mu_i = \mathrm{E}(X_i)$ は、各要素の
期待値を示しています。この
行列の各要素は、
確率変数がどの程度一緒に変動するかという情報を提供し、特に
統計分析や信号処理で重宝されています。
分散の一般化
分散
共分散行列は、スカラー値における分散を多次元に拡張したものとも捉えられます。この
行列の対角成分はそれぞれの
確率変数の分散を、非対角成分はそれぞれの
確率変数間の
共分散を表しています。特に、分散
共分散行列が半正定値
行列であることは、その性質上重要です。
名称と分類
分散
共分散行列の名称には、「分散
行列」とも呼ばれる形式もあります。これは、この
行列が多次元の分散の自然な拡張とみなされるからです。さらに、
共分散行列という呼び方は、
行列の中身が
確率変数間の
共分散であることに由来します。
性質
分散
共分散行列は以下のような性質を持ちます:
- - 半正定値行列であり、すべての固有値が非負である。
- - 加法的な特性を持ち、複数のベクトルの分散と共分散を組み合わせた形で表現できる。
- - もし確率変数が独立であれば、その共分散はゼロとなる。
統計解析における重要性
この
行列は、特に
主成分分析(PCA)やカルーネン・レーベ変換(KL-transform)などのデータ解析手法で特に重要な役割を果たします。これらの手法では、データの次元を削減するための最適な方向を見つけ出す際に、この
行列が利用されます。
まとめ
分散
共分散行列は、
確率変数の多次元分析において基本的かつ重要なツールであり、データの分析やモデルの構築において欠かせない要素となっています。
確率論の基礎を理解する上でも、深い知識が必要な分野です。今後も、この
行列を利用した様々な解析手法は進化し続けるでしょう。