最尤推定について
最尤推定(さいゆうすいてい、英: maximum likelihood estimation、略してMLE)は、観測データをもとにある
確率分布が持つ母数を推定するための
統計的方法です。この手法は、データから得られる
情報を利用して、どの母数の値が最もデータを説明するかを探し出します。最尤推定の理論は、
1912年から
1922年にかけてロナルド・フィッシャーによって開発されました。
基本的な理論
最尤推定の中心的な課題は、母数θが未知の
確率分布fと、それに従う母集団から取得した標本X1, X2,…, Xnを使って、その母数θをどのように最適に推定するかです。この際、次のような確率Pを求めることに焦点を当てます。
データが得られる確率を最大化するθを見つけるために、まずはθを仮定し、その条件下で標本が得られる確率を計算します。この手法では、得られた確率が大きくなる母数θが「より尤もらしい」と判断されます。例えば、コインの裏が出る確率を考えた場合、表が続いた場合はその確率が高いθの方がより現実的であると推定されます。
尤度関数L(θ)を定義し、これを最大化するθの値を最尤
推定量(MLE)と呼びます。最尤
推定量は、その特徴により唯一でない場合もあれば、存在しない場合もあります。
この最尤
推定量を導出する際には、
尤度方程式と呼ばれる式を利用します。この式の解として得られたθが最尤推定の結果となります。
尤度の解釈
尤度P(X | θ)は、「データXが与えられたとき、そのデータがθの下でどれほど可能性があるか」を示します。これは、
ベイズ推定における
事後確率P(θ | X)とは異なる点を理解する必要があります。
他の推定手法との関連
最尤推定は、最大
事後確率推定(MAP推定)の特殊なケースとも考えられます。場合によっては、事前分布を無視して最尤推定を行うことで、
統計学的な推測を行うことができます。ビッグデータや機械学習の分野においても、最尤推定は特に
ニューラルネットワーク(生成モデル)の学習において重要な役割を果たしています。
応用例
生物学においては、分子系統解析に最尤推定が取り入れられています。これにより、塩基やアミノ酸の置換に基づいた確率モデルを使用して、得られたデータから最も尤もらしい系統樹を構築することが可能です。この手法は、最大節約法や距離行列法よりも精度の高い解析が期待できる一方で、所要計算時間が長くなることがあります。
理論的な妥当性
最尤推定は、研究者が観測データを基に母集団を推定するための方法論を提供しますが、真の母集団分布との乖離を検証することは困難です。そのため、最尤推定の結果が真実をどの程度正確に反映しているのかを確認するためのさらなる研究が続けられています。
まとめ
最尤推定は、データに基づく
統計的推論手法として様々な分野で応用されています。その際、仮定されるモデルの妥当性や観測データの性質によって結果が変化するため、注意が必要です。