Tajima's Dとは？意味をやさしく解説 - サードペディア百科事典

Tajima's D検定についての概要

Tajima's D検定は、田嶋文生によって開発された統計的手法で、DNA配列がランダムに進化したかどうかを評価するものです。この検定は、特に集団遺伝学において、ランダムな進化（中立進化）と非ランダムな進化（選択による進化）を区別するために用いられます。非ランダムな進化には、方向性選択や平衡選択、集団の拡大や縮小、ヒッチハイク効果、遺伝子移入などの要素が含まれます。

基本的な概念

この検定の背後にある基本的な考え方は、適応度や生存力に影響しない中立的な突然変異の効果と、自然選択による非中立的な突然変異の効果を比較することです。中立的突然変異は、遺伝的浮動によりその頻度が変化し、生物集団が次世代へ移行する過程で割合がランダムに変わります。この変動は、集団のサイズに強く依存しています。

理想的な中立集団を想定した場合、遺伝子頻度が平衡状態に達することが期待されます。ここでは、多型サイト（S）や、サンプル間のヌクレオチドの違いの数（pairwise differences）という統計的指標が重要になります。特に、pairwise differencesの平均値は、πという記号で示されます。Tajima's D検定では、これらの数値を使用して、中立モデルに適合しているか否かを判断します。

Tajima's D検定の方法

Tajima's Dは、標本DNA配列における多型サイトの数と、ランダムに抽出した標本間での平均的な突然変異数を比較します。これらの統計量は、集団遺伝学におけるパラメータであるθのモーメント推定量として期待され、両者が等しいという仮定が成り立つ場合、中立モデルに適合することになります。検定の結果として得られるD値が、期待される範囲を超える場合、帰無仮説は棄却され、サンプルが中立的に進化していないとされます。

科学的な解釈

Tajimaのモデルによると、集団内における中立的な突然変異と遺伝的浮動は、平衡状態において特定の数式に従います。二倍体の場合、E[π]とθは4Nμで表され、一倍体の場合は2Nμとなります。ここで、Nは有効集団サイズ、μは突然変異率を示します。これらの値が等しくなくなる要因には、自然選択や集団の変化、遺伝子流動などがあります。

また、Tajima's Dの数値は、二つの期待値の差から算出され、標準偏差で割ることで最終的なD値が得られます。Dの値がベータ分布に従うことがシミュレーションでも示されており、得られたDが信頼区間外に位置する場合、帰無仮説が棄却されます。

数学的な側面

Tajima's Dは具体的な式に基づいて計算されます。

D = \frac{d}{\sqrt{{\hat{V}}(d)}}

この式におけるdは、二つの推定値の差を示し、{\hat{k}}とS/a1はそれぞれ集合から得られる推定値を表しています。最終的にTajimaが設定したパラメータMは、4Nμとして定義され、集団遺伝学を深く理解するための重要な要素となります。

参考資料とツール

Tajima's D検定を行うためのツールとしてはDNAsp、Variscan、Arlequinなどがあり、各種プラットフォームから利用可能です。オンラインでの計算も可能で、集団遺伝学の研究に広く用いられています。

もう一度検索