ピアソンの積率相関係数

ピアソンの積率相関係数



ピアソンの積率相関係数(PCC)は、2つのデータセットまたは確率変数間の線形的な関係性を定量化するための重要な統計指標です。この指標は、数学者カール・ピアソンによって開発され、現在では広く用いられています。

定義と性質



ピアソンの積率相関係数は無次元の値であり、-1から1の範囲を取ります。値が1に近い場合、二つの変数は強い正の相関関係にあり、-1に近い場合は強い負の相関関係があることを示します。相関係数が0の場合、二つの変数の間には線形関係がない、つまり無相関であることを表します。例えば、先進国の失業率と実質経済成長率には強い負の相関が見られ、この時の相関係数は-1に近い値になります。

母集団相関係数



母集団相関係数は、二つの確率変数 X と Y の間の相関を定義するもので、共分散と標準偏差を使って計算されます。具体的には、次の式で表されます。

$$
ρ = \frac{cov[X, Y]}{σ_X σ_Y}
$$

ここで、$cov[X, Y]$ は二つの変数の共分散、$σ_X$ と $σ_Y$ はそれぞれの標準偏差を意味します。さらに期待値 E[…] を使用して、もう一つの形で表現することもできます。

標本相関係数



標本相関係数は、観測データに基づいて母集団の相関を推定するために使用されます。標本共分散や標準偏差を用いて、次の式で計算されます。

$$
r = \frac{s_{xy}}{s_x s_y}
$$

ここで、$s_{xy}$ は標本共分散、$s_x$ と $s_y$ は各変数の標本標準偏差です。この推定は、特にデータが2次元正規分布に従う場合、母集団相関係数の最尤推定量となります。ただし、外れ値に非常に敏感であるため、注意が必要です。

例と計算



例えば、確率変数 X と Y の同時分布を考えると、各変数の期待値や分散を基に相関係数を計算することができます。仮に、X の期待値が 2/3、Y の期待値が 0 であれば、相関係数 $ρ_{X,Y}$ の計算は以下のようになります。

$$
ρ_{X,Y} = \frac{E[(X-μ_X)(Y-μ_Y)]}{σ_X σ_Y}
$$

これにより、求められた値が相関の強度を示し、データの関係性を理解する上での重要な手がかりとなります。

誤解や誤用



相関関係と因果関係は異なるものであり、相関が存在するからといって、一方が他方の原因であるとは限りません。また、外れ値が分布に与える影響を考慮することも重要です。

関連項目



  • - 統計
  • - 回帰分析
  • - 自己相関

ピアソンの積率相関係数は、データ分析において非常に重要な概念であり、変数同士の関係を理解し、意思決定に役立てる大きな手助けとなります。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。