混合モデルについて
混合モデル(こんごうモデル、英: mixed model)とは、二つの異なる効果—固定効果(fixed effect)と変量効果(random effect)—を同時に扱う
統計学的手法です。このアプローチは、特に医学や生物学、社会科学などの幅広い分野で利用され、特に縦断的データや反復測定デザインを伴う研究においてその真価を発揮します。混合モデルは、欠測データの処理に優れており、従来の分析手法と比較して多くの場合、より望ましい結果を提供します。
歴史と発展
混合モデルの起源は1918年に遡ります。その年、
統計学者
ロナルド・フィッシャーが関連する特性を分析するための変量効果モデルを導入しました。1950年代には、チャールズ・ヘンダーソンが最良線形不偏
推定量(BLUE)および最良線形不偏予測量(BLUP)を固定効果と変量効果それぞれに適用したことが、混合モデルのさらなる発展に寄与しました。このモデルは、
最尤推定法や
ベイズ推定に基づく計算手法として広く使用できることから、現在では臨床試験や動物実験、工業
統計など、さまざまな応用が見られます。
定義と構成
混合モデルは、次のような
行列式で表されます:
$$
\mathbf{y} = X\beta + Z u + \epsilon
$$
ここで、\mathbf{y}は既知の測定値のベクトルであり、その期待値は\(E(\mathbf{y}) = X\beta\)と表されます。\betaは固定効果の未知のベクトルで、uは変量効果の未知ベクトルであり、期待値はゼロです。\epsilonは測定
誤差のベクトルで、こちらも期待値はゼロです。\(X\)および\(Z\)はそれぞれデザイン
行列であり、測定値に関する情報を含んでいます。
推定手法
混合モデルにおける\mathbf{y}とuの結合密度関数は次のように表されます:
$$
f(\mathbf{y}, \mathbf{u}) = f(\mathbf{y}|\mathbf{u})f(\mathbf{u})
$$
ここで、\(u\)と\(\epsilon\)はそれぞれ
正規分布に従うと仮定され、これに基づいて最尤法を利用してモデルを推定します。その結果得られるのがヘンダーソンの“mixed model equations (MME)”です。この方程式は、\(\beta\)とuの最良線形不偏
推定量(BLUE)および最良線形不偏予測量(BLUP)を提供します。ここで重要なのは、条件付き分散が
単位行列のスカラー倍を超える場合が多く、分散と重みを同時に推定しなければならない点です。
混合モデルの推定には、EMアルゴリズムが用いられることがあります。この手法を用いることで、未観測のパラメータを扱うことができ、現在では
R言語やSASなどの
統計ソフトウェアで広く実施されています。
まとめ
混合モデルは、固定効果と変量効果を組み合わせることで、複雑なデータ構造を効果的に分析することができる強力なツールです。さまざまな分野での応用があり、今後もその重要性は増すと考えられます。