スピアマンの順位相関係数
スピアマンの順位相関係数(Spearman's rank correlation coefficient)は、
統計学における重要な指標であり、特に順位データに基づいて変数間の相関を評価するために使用されます。この指標は、イギリスの心理学者チャールズ・スピアマンによって提唱され、通常はρ(ロ)またはrSで表記されます。スピアマンの順位相関係数は、ピアソンの積率相関係数と異なり、ノンパラメトリックな特性を持っています。
ノンパラメトリックな指標
スピアマンの順位相関係数は、データの分布に特定の仮定を置く必要がありません。代わりに、2つの変数の間にある関係が任意の単調関数によってどの程度表現できるかを評価します。これは、変数間の関係が線形である必要はなく、数値データではなくても結果を得ることができることを意味しています。このため、特に順位データや非線形的な関係がある場合に有用です。
計算方法
この指標の計算は比較的シンプルです。まず、各観察対象の生のスコアを順位に変換し、その後、2つの変数の各ペアにおける順位の差Dを求めます。スピアマンの順位相関係数ρは次の式で表されます:
$$
ρ = 1 - rac{6∑D^{2}}{N^{3}-N}
$$
ここで、Dは対応するXとYの順位の差、Nは値のペアの数を示します。
同順位の処理
同順位が存在する場合、さらなる計算が必要です。X、Yでの同順位の個数をそれぞれnx、ny、同順位の順位をti、tj(i=1,2,...,nx;j=1,2,...,ny)とすると、別の式が適用されます。具体的な計算方法は以下の通りです:
$$
ρ = rac{T_{x}+T_{y}-∑D^{2}}{2 ext{√}(T_{x}T_{y})}
$$
ここで、$T_{x}$・$T_{y}$の計算式は以下のようになります:
$$
T_{x} = rac{N^{3}-N - ∑(t_{i}^{3}-t_{i})}{12}
$$
$$
T_{y} = rac{N^{3}-N - ∑(t_{j}^{3}-t_{j})}{12}
$$
もし同順位の数が少ない場合には、これらを無視して最初の式を使用しても、大きな影響はありません。
検定方法
スピアマンの順位相関係数ρが真の母集団と
有意に異なるかどうかを判断するための検定方法はいくつかあります。標本数が約20以上の際は、観察値のt検定値が次の式で計算されます:
$$
t = rac{ρ}{ ext{√}((1-ρ^{2})/(n-2))}
$$
ここで、nはサンプルサイズです。帰無仮説(2つの変数に相関がない)を前提とし、これに基づいてテストを行います。他にも、フィッシャーのz変換を用いた方法や、パーミュテーションテストによる検定も利用されます。また、スピアマンの順位相関係数の数表を用いることで、計算を簡便に行うことができ、応用範囲は限られますが便利です。
まとめ
スピアマンの順位相関係数は、特に順位データに基づく相関分析において非常に役立つ指標です。この指標は、仮定される分布に依存せず、同順位を考慮できるため、幅広い場面での利用が期待されます。