平均への回帰とは
平均への回帰とは、ある試験で極端な成績(特に良かった、または悪かった)を出した集団を対象に、別の試験を行った場合、その集団の平均成績が全体の平均値に近づくという
統計学的な現象です。これは
回帰分析の語源となりましたが、
回帰分析とは異なる概念です。
具体例
例1:試験の成績
生徒が中間試験と期末試験を受けた場合、中間試験で特に高得点だった生徒群は、期末試験でも高い得点を取る傾向にありますが、中間試験の時ほど平均点から離れていないことが多いです。これは、中間試験で働いた「幸運」が、期末試験では働かなかったためと考えられます。同様に、中間試験で低得点だった生徒群は、期末試験で平均点に近づく傾向があります。
例2:親の学業成績と子供の学業成績
学業成績が特に優秀な両親から生まれた子供は、親の成績と比較して、学業成績が平均に近くなる可能性が高いです。これは、子供の学力は親の
遺伝的な能力だけでなく、様々な環境要因にも影響を受けるためです。
歴史
平均への回帰は、元々生物データの研究から発見された現象です。
フランシス・ゴルトンは
1877年に、種子の重さに関する研究を発表し、子の世代の種子の重さは親世代と同じく
正規分布に従うものの、子の平均直径は親の平均直径と比較して、全体の平均直径に近づく傾向があることを示しました。ゴルトンは当初、この現象を「復帰係数」と呼びましたが、後にデータの扱いによる結果であることを発見し、「回帰係数」と改名しました。
ゴルトンはまた、様々な分野の天才を調べ、彼らの子供は親よりも平均的な能力を持つことが多いことを発見しました。さらに、父親と息子の身長を比較し、高身長の父親を持つ息子は、父親よりも平均的な身長になる傾向があることを示しました。
普遍性
平均への回帰は普遍的な統計現象であり、生物や
遺伝に関係なく発生します。また、時間経過を逆にしても発生します。例えば、高身長の人々の「父親」の身長は、息子たちの身長よりも平均に近い傾向があります。
数学的説明
確率変数XとYがともに標準
正規分布に従い、
相関係数がrであるとします。このとき、Xの値が決まっている場合のYの期待値はrXとなります。|r|<1である場合、Yの期待値はXの観察値よりも0に近い値となります。これは、2変数の相関が小さくなるほど、平均への回帰が顕著になることを示しています。
回帰に関する誤解
平均への回帰を理解せずに、データの収集と解釈を行うと、誤った結論を導き出すことがあります。例えば、ある薬の有効性を評価するために、成績が最下位の生徒に薬を投与し、再度テストを行った結果、平均成績が向上したとします。しかし、これは薬の効果とは関係なく、平均への回帰によって成績が向上した可能性があります。このような誤りを「回帰の誤謬」と呼びます。
まとめ
平均への回帰は、
統計学における重要な概念であり、様々な現象を理解する上で役立ちます。平均への回帰を理解することで、データの解釈における誤りを防ぎ、より正確な判断を下すことができるようになります。
関連項目
大数の法則
回帰分析
重回帰分析
ロジスティック回帰
優生学
育種家の方程式
* アルカンシエルの呪い