合祖理論(Coalescent Theory)
合祖理論は、集団
遺伝学において、現在生きている生物集団の
遺伝情報からその集団がたどってきた歴史や
進化的な動態を統計的に推測するための重要な理論モデルおよび解析手法です。この理論の核心は、現在の多様な遺伝子コピーが、時間を遡るにつれて次第に共通の祖先へと収束していく過程を記述し、解析することにあります。
集団内の様々な個体が持つ特定の遺伝子のコピー(
対立遺伝子)に注目すると、それらはすべて最終的には単一の祖先的なコピーから由来しています。合祖理論は、この「
最も近い共通祖先(Most Recent Common Ancestor; MRCA)」に達するまでの系譜を、時間的に逆向きにたどる確率過程として捉えます。個々の
対立遺伝子間の遺伝的な関係性は、系統樹に似た形式である「
遺伝子系図(gene genealogy)」として表現されます。理論名にもなっている「coalescent」(合祖)とは、時間を遡る方向で見て、
遺伝子系図上の二つ以上の系統が共通の祖先系統で合流(coalesce)する現象そのもの、あるいは
遺伝子系図全体を指す場合もあります。
合祖理論の中心的な課題は、様々な集団
遺伝学的な条件下における、このcoalescent過程の統計的な性質を深く理解することにあります。解析はしばしば、時間的に逆行する
遺伝的浮動のモデルに基づいたシミュレーションによって行われます。最も基本的なモデルでは、
遺伝的組換え、自然選択、
遺伝子流動、そして集団内の構造(サブポピュレーションなど)が存在しないという理想的な状況を仮定します。しかし、より高度なモデルでは、これらの要素を現実的に考慮に入れ、
遺伝的組換えや自然選択の影響、複雑な集団サイズの変動や移動といった集団の
進化・動態をシミュレーションを通じて分析することが可能です。
理論背景:Coalescenceまでの時間
合祖理論を用いて知りたいことの一つに、現在の集団に見られる遺伝子の分布や多様性が、どのような歴史を経て形成されたのか、という点があります。これを考える上で、特定の遺伝子コピーがMRCAに至るまでにどれくらいの時間(世代数)がかかるかを推定することは重要です。
例えば、ある集団から任意に抽出された2つの遺伝子コピーが、ちょうど1世代前に共通の祖先から由来した、すなわち1世代前にcoalescenceした確率を考えてみましょう。一定の集団サイズNを持つ二倍体生物の理想的な集団(例:ライト=フィッシャーモデル)を仮定すると、各世代には2N個の遺伝子コピーが存在します。この場合、2つのコピーが1世代前に同じコピーから由来する確率は1/(2N)となります。逆に、1世代前にcoalescenceしない確率は1 - 1/(2N)です。現在から遡ってt世代目に初めてcoalescenceが起こる確率は、それまでのt-1世代では合流せず、t世代目で合流するという確率の積として与えられます。これは数学的には幾何分布に従うことが示されます。
集団サイズNが十分に大きい場合、この幾何分布は指数分布によってよく近似されます。この指数分布の重要な性質として、
期待値と
標準偏差が等しいという点があり、この場合の
期待値は2N世代となります。したがって、集団サイズNの理想的な集団において、任意に選ばれた2つの遺伝子コピーが共通祖先へと合流するまでにかかる時間の平均は、おおよそ2N世代であると推定されます。ただし、指数分布の性質上、この合流時間には大きなばらつきがある点に留意が必要です。
歴史
合祖理論は、中立
進化に関する古典的な集団
遺伝学の概念を発展させ、Wright-Fisherモデルのような離散世代モデルを連続的な時間軸で近似する形で誕生しました。その数学的な基礎は、1980年代初頭にイギリスの数学者であるジョン・キングマン(John Kingman)によって確立されました。その後、ピーター・ドネリー(Peter Donnelly)、ロバート・グリフィス(Robert Griffiths)、リチャード・ハドソン(Richard R Hudson)、サイモン・タバレ(Simon Tavaré)といった多くの研究者たちによって、集団サイズの変動や、
遺伝的組換え、自然選択など、より複雑な集団
遺伝学的な要素を理論モデルに組み込む形で発展が続けられ、分子集団
遺伝学における解析の標準的な枠組みの一つとして広く用いられるようになりました。