広く使える情報量規準(WAIC)と広く使えるベイズ情報量規準(WBIC)
広く使える情報量規準(WAIC)および広く使える
ベイズ情報量規準(WBIC)は、特定の
統計モデルに関連する情報量基準の拡張版です。これらの基準は、モデル選択や予測精度の評価において重要な役割を果たします。HAICは赤池情報量基準(AIC)の一般化版として、
2009年に渡辺澄夫によって発表されました。これに対しWBICは、ベイズ情報量基準(BIC)の一般化版として、
2013年に同じく渡辺によって発表されました。
WAICの基本概念
WAICは、特異的
統計モデルに基づく数学的な基準であり、データの中からモデルの優劣を客観的に評価するための方法を提供します。その中心的な考え方は、モデルが与える予測の精度を、未来のデータに対してどれほど良いかを測ることにあります。
WAICの計算には、複雑な数学的手法が用いられますが、特に重要なのは、真の分布に関する情報を持たずに数値を計算できるという点です。これにより、モデルの比較がより柔軟になります。WAICを使用することで、あるモデルから得られる予測がどの程度安定しているかを事前に知ることが可能となり、実際のデータに基づいた選択ができるようになります。
WBICの導入
WBICは、特にサンプルサイズが大きくなる時に真価を発揮します。サンプルサイズnの研究において、逆温度を1/log nとする事後分布に基づいて計算される
平均対数
尤度関数を利用します。このアプローチにより、より多様なデータセットに対しても適切な評価が可能となります。
モデル選択の利点
どちらの基準も、EQUとDEFの分析結果を同時に持つことを避けるという大きな利点があります。これは、二つの群の標準
偏差が似通っている場合、事後の標準
偏差が小さくなるため、EQUの方が適しているといった状況から生じます。一方で、群の標準
偏差に大きな差がある場合はDEFが適切になることが多いです。このように、WAICを用いることで、将来的に予測されるデータxを事前に評価し、どちらのモデルがより信頼なおかつ安定しているのかを判断できます。
予測力の概念
特にWAICを用いる際は、伝えられた数値xが小さくなるほど予測力が向上することが示されています。これにより、研究者は予測精度の高いモデルを選別しやすくなるのです。WAICやWBICは、
統計学の発展に伴い、今後も重要な役割を果たしていくことでしょう。
参考文献
これらの基準は、データ分析やモデル選択の際に、研究者が信頼性の高い情報を取得するための強力なツールです。