Tajima's D検定についての概要
Tajima's D検定は、
田嶋文生によって開発された統計的手法で、DNA配列がランダムに進化したかどうかを評価するものです。この検定は、特に
集団遺伝学において、ランダムな進化(中立進化)と非ランダムな進化(選択による進化)を区別するために用いられます。非ランダムな進化には、方向性選択や平衡選択、集団の拡大や縮小、
ヒッチハイク効果、
遺伝子移入などの要素が含まれます。
基本的な概念
この検定の背後にある基本的な考え方は、
適応度や生存力に影響しない中立的な
突然変異の効果と、自然選択による非中立的な
突然変異の効果を比較することです。中立的
突然変異は、
遺伝的浮動によりその頻度が変化し、生物集団が次世代へ移行する過程で割合がランダムに変わります。この変動は、集団のサイズに強く依存しています。
理想的な中立集団を想定した場合、遺伝子頻度が平衡状態に達することが期待されます。ここでは、多型サイト(S)や、サンプル間のヌクレオチドの違いの数(pairwise differences)という統計的指標が重要になります。特に、pairwise differencesの平均値は、πという記号で示されます。Tajima's D検定では、これらの数値を使用して、中立モデルに適合しているか否かを判断します。
Tajima's D検定の方法
Tajima's Dは、
標本DNA配列における多型サイトの数と、ランダムに抽出した
標本間での平均的な
突然変異数を比較します。これらの統計量は、
集団遺伝学におけるパラメータであるθのモーメント推定量として期待され、両者が等しいという仮定が成り立つ場合、中立モデルに適合することになります。検定の結果として得られるD値が、期待される範囲を超える場合、
帰無仮説は棄却され、サンプルが中立的に進化していないとされます。
科学的な解釈
Tajimaのモデルによると、集団内における中立的な
突然変異と
遺伝的浮動は、平衡状態において特定の数式に従います。二倍体の場合、E[π]とθは4Nμで表され、一倍体の場合は2Nμとなります。ここで、Nは有効集団サイズ、μは
突然変異率を示します。これらの値が等しくなくなる要因には、自然選択や集団の変化、遺伝子流動などがあります。
また、Tajima's Dの数値は、二つの
期待値の差から算出され、
標準偏差で割ることで最終的なD値が得られます。Dの値が
ベータ分布に従うことがシミュレーションでも示されており、得られたDが
信頼区間外に位置する場合、
帰無仮説が棄却されます。
数学的な側面
Tajima's Dは具体的な式に基づいて計算されます。
D = \frac{d}{\sqrt{{\hat{V}}(d)}}
この式におけるdは、二つの推定値の差を示し、{\hat{k}}とS/a1はそれぞれ集合から得られる推定値を表しています。最終的にTajimaが設定したパラメータMは、4Nμとして定義され、
集団遺伝学を深く理解するための重要な要素となります。
参考資料とツール
Tajima's D検定を行うためのツールとしてはDNAsp、Variscan、Arlequinなどがあり、各種プラットフォームから利用可能です。オンラインでの計算も可能で、
集団遺伝学の研究に広く用いられています。