ベイズ法による系統樹推定
ベイズ法は、
生物の系統進化を示す系統樹を推定するための手法の一つで、特に
生物学における系統解析において広く利用されています。この方法は
ベイズの定理に基づき、与えられたデータから
事後確率分布を推定し、その分布に基づいて最適な系統樹を選定します。代表的なソフトウェアとしてMrBayesが存在します。
理論
基本的理論
ベイズ法は、最尤法の概念を拡張した形で構築されています。最尤法では、先に定義した進化モデルに基づき、与えられた遺伝子配列の尤度を最大化する系統樹が選択されます。一方、ベイズ法における目的関数は、樹形や枝長、進化モデルの
事後確率です。最適樹の選択は、この
事後確率の
最頻値を採用します。特に事前分布として一様分布を用いる場合、最尤法とベイズ法はほぼ同じ結果を示すことになりますが、ベイズ法はより多様な系統樹の情報を提供します。
ベイズ法の強みは、遺伝子の水平伝播などにより系統樹が一意には決まらない場合や、複数の系統仮説が存在する場合にも効果を発揮します。これにより、単一の最適樹だけでなく、複数の樹形や合意樹も提供されるのが大きな特徴です。
アルゴリズム
系統樹の事前
確率分布を定義し、与えられた配列データに対する
事後確率分布を求めるには、
ベイズの定理に従って計算が行われます。具体的には、系統樹の枝長や進化モデルのパラメータも含めた
確率分布を推定するために、
マルコフ連鎖モンテカルロ法(MCMC)が利用されます。
MCMCの手順は以下の通りです:
1. 初期系統樹を構築し、その尤度を計算する。
2. 新たな系統樹を生成し、比較する。
3. 尤度が高い方を選択し、記録する。
4. この過程を繰り返すことで系統樹は定常状態に達し、
事後確率が計算されます。
最終的に、
事後確率が最大となる系統樹または高い確率の複数の系統樹を選んで、合意樹が形成されます。こうした手法により、全体的に分布する系統樹から有意義な統計情報を得ることができます。
MrBayes
ベイズ法は1996年にYangによって系統解析に導入され、2001年にはMrBayesが登場しました。このソフトウェアは、ベイズ法を用いた系統解析の中でも特に人気があり、広く使用されています。MrBayesは、
事後確率分布が局所的な最適解に陥るのを防ぐために、改良された
マルコフ連鎖法であるMetropolis Coupled MCMC(MCMCMC)を採用しています。これにより、系統樹の探索の効率が向上し、全体の収束が促進されます。
特徴
ベイズ法の最大の利点は、複雑な進化モデルを仮定しても、比較的少ない計算時間で結果が得られる点です。ただし、他の手法と比較すると計算に時間がかかる場合もあります。また、
事後確率の過大評価に関する懸念もあります。
出典
関連項目として、他の系統樹推定法やベイズ法の理論的背景についての情報があります。興味がある方は、これらの情報も合わせて参照してみると良いでしょう。