分散分析(ANOVA)
分散分析(ぶんさんぶんせき、英: analysis of variance、略称: ANOVA)は、観測データの変動を誤差や要因、さらにその交互作用によるものに分けて、各要因の効果を評価するための
統計的手法です。この方法は、特に異なる条件下で得られたデータの比較に利用されます。
基本的な概要
分散分析は、2つ以上のグループ間の母集団の分散が等しいかどうかを判断するために用いることができます。この分析手法は、
1920年代から
1930年代にかけて
統計学者のロナルド・フィッシャーによって確立され、彼の名前が付けられた「フィッシャーの分散分析」や「フィッシャーのANOVA法」とも呼ばれています。
分析の基本的な流れは、まずデータの分散の平方和を計算し、誤差と要因による変動を分解します。その後、各変動の
平均平方を算出し、要因の効果をF値により評価します。
F検定を用いて、帰無仮説(すべてのグループの母集団が等しいという仮説)が正しいかどうかを検討し、
有意水準を設定して結果を解釈します。
交互作用の検定と多重比較
分析の一環として交互作用を調べるためには、単純主効果の検定や交互作用対比が有効です。また、3つ以上の水準を持つ要因が
有意な結果を示した場合、どのグループ間に差があるかを知るために多重比較を行う必要があります。このように、分散分析は他の手法と組み合わせて利用されることが多く、目的に応じて適切に用いることが大切です。
分散分析の種類
分散分析にはいくつかの異なるモデルがあります。これらは、データの性質や要因計画の型、検証したい仮説に基づいて使い分けられます。代表的なものとして、一元配置分散分析、回帰分散分析、
共分散分析などがあります。近年では、分散分析は
一般線形モデルや構造方程式モデリングの一部としても扱われるようになり、さらなる発展が期待されています。
分析の応用
分散分析は、実験データの分析やモデル開発に広く使われています。特に、因果関係を探求するための手段として重要です。例えば、医療分野で異なる治療法の効果を比較したり、製品テストにおいて改良の有無を検証する際に役立ちます。また、相関関係を評価する手法と比べ、数値ではない変数も扱えるため、より幅広いデータ解析が可能です。
用語の理解
分散分析に関連する用語は、主に実験計画法から由来しています。ここでは、効果を検証するために要因を変え、その反応を測定することが求められます。分析結果の妥当性を確保するためには、無作為化やブロッキングの手法が必要で、結果の公平性を確保するための盲検化も重要です。
分析の例
例えば、ドッグショーに出品される犬を対象とした分析では、犬の体重をその特徴に基づいて予測することが考えられます。各犬種や特性でグループ分けを行うことで、体重の変動をより効果的に説明することができます。犬種による体重差を分散分析を通じて検証することで、直感的な違いを論理的に説明することが可能です。
使用可能なソフトウェア
分散分析は、SASやSPSSなどの主要な
統計パッケージで実行可能です。
R言語にも専用の関数があり、特化したソフトウェアも数多くあります。例えば、田中敏教授が作成した"js-STAR"や、桐木建始教授の"ANOVA4 on the Web"などは、ウェブ上で操作でき便利です。また、Excel用の分散分析アドインなども存在し、さまざまな環境で幅広く活用されています。