偏り(バイアス)とは
偏り(かたより、
英語:bias)は、
統計学において
標本や
推定量における不均一さを示す言葉です。この概念は、主に二つの文脈で使われます。ひとつは、
母集団から
標本がどのように選ばれているか、もうひとつは、
推定量が実際の値とどれほど乖離しているかという点です。
標本に偏りが存在するとき、
母集団の特定の要素が選ばれやすい状態を指します。たとえば、特定の社会層から得られたデータは、その層の特性が色濃く反映されてしまい、全体の傾向を正確には反映しません。このため、偏った
標本をもとにした推定結果はしばしば誤導を引き起こします。
歴史的な例として、
1936年のアメリカの大統領選挙予測があります。当時、ある雑誌が実施した調査では、電話や自動車を所有している人々を対象にした結果、富裕層に偏った
標本が取られてしまいました。そのため、彼らの評価はF.D.ルーズベルト候補の敗北を示しましたが、実際にはルーズベルトが勝利しました。このように、偏った
標本は結果を誤らせる要因となります。
この偏りは、一般的に
統計学の
ノイズよりも有害とされます。
ノイズは
標本を大きくすることで軽減が可能ですが、偏りは単に
標本を増やしただけでは解消されません。正確な結果を得るためには、適切な
標本抽出方法が重要となります。
推定量の偏りは、推定している母数とは異なる
平均値を持つ
統計量を指し、これに対して適切な値を持つものを不偏
推定量と言います。
推定量の偏りは、
統計量の
期待値と実際の値との間に乖離があることから生じます。この偏りは、必ずしも
統計分析において悪影響を与えるわけではなく、状況によっては有用である場合もあります。
たとえば、
平均値や分散を推定する際の
標本平均や
標本分散は一般に偏りを含みます。具体的には、
標本分散の
期待値は母分散よりも小さくなりがちですが、特定の条件下では評価が優れていることもあります。
偏りを理解するための重要性
偏りという概念は、
統計分析において重要です。正しい結論を得るためには、適切に
標本を選び、適切な
推定量を使用することが欠かせません。
標本の選び方や
推定量の選定は、研究の目的やデータの性質に基づいて慎重に行う必要があります。
関連項目としては、
偏りと分散、正確度と精度などが挙げられ、これらは
統計的推定の質を向上させるための重要な指標となります。適切な手法と理解をもって、より信頼性の高い
統計解析を実現することが求められます。