偏り(バイアス)とは
偏り(かたより、
英語:bias)は、
統計学において
標本や推定量における不均一さを示す言葉です。この概念は、主に二つの文脈で使われます。ひとつは、母集団から
標本がどのように選ばれているか、もうひとつは、推定量が実際の値とどれほど乖離しているかという点です。
標本に偏りが存在するとき、母集団の特定の要素が選ばれやすい状態を指します。たとえば、特定の社会層から得られたデータは、その層の特性が色濃く反映されてしまい、全体の傾向を正確には反映しません。このため、偏った
標本をもとにした推定結果はしばしば誤導を引き起こします。
歴史的な例として、
1936年のアメリカの大統領選挙予測があります。当時、ある雑誌が実施した調査では、電話や自動車を所有している人々を対象にした結果、富裕層に偏った
標本が取られてしまいました。そのため、彼らの評価はF.D.ルーズベルト候補の敗北を示しましたが、実際にはルーズベルトが勝利しました。このように、偏った
標本は結果を誤らせる要因となります。
この偏りは、一般的に
統計学の
ノイズよりも有害とされます。
ノイズは
標本を大きくすることで軽減が可能ですが、偏りは単に
標本を増やしただけでは解消されません。正確な結果を得るためには、適切な
標本抽出方法が重要となります。
推定量の偏り
推定量の偏りは、推定している母数とは異なる
平均値を持つ
統計量を指し、これに対して適切な値を持つものを不偏推定量と言います。推定量の偏りは、
統計量の
期待値と実際の値との間に乖離があることから生じます。この偏りは、必ずしも
統計分析において悪影響を与えるわけではなく、状況によっては有用である場合もあります。
たとえば、
平均値や分散を推定する際の
標本平均や
標本分散は一般に偏りを含みます。具体的には、
標本分散の
期待値は母分散よりも小さくなりがちですが、特定の条件下では評価が優れていることもあります。
偏りを理解するための重要性
偏りという概念は、
統計分析において重要です。正しい結論を得るためには、適切に
標本を選び、適切な推定量を使用することが欠かせません。
標本の選び方や推定量の選定は、研究の目的やデータの性質に基づいて慎重に行う必要があります。
関連項目としては、偏りと分散、正確度と精度などが挙げられ、これらは
統計的推定の質を向上させるための重要な指標となります。適切な手法と理解をもって、より信頼性の高い
統計解析を実現することが求められます。