近隣結合法 (Neighbor joining method)
概要と位置づけ
近隣結合法(Neighbor joining method)は、生物や遺伝子などの進化的な関係を視覚的に表現する「系統樹」を作製するための、ボトムアップ式のクラスタリング手法の一つです。これは「
距離行列法」と呼ばれる系統樹推定法の範疇に含まれます。
距離行列法では、対象となる生物間の遺伝情報などから計算された「進化距離」を数値化した表(
距離行列)を用いて系統樹を構築します。その基本的な考え方として、「総枝長」(系統樹全体の枝の長さの合計)が最も短くなる樹形が、最も実際に近い系統関係を示す(最適である)とする「最小進化原理」がしばしば仮定されます。
他の
距離行列法には、
非加重結合法(UPGMA)、
最小二乗法、最小進化法などがありますが、近隣結合法はこれらの手法と比較していくつかの特徴を持ちます。例えば、
最小二乗法や最小進化法が原理上、考えられる全ての系統樹の総枝長を計算して最適な樹形を探し出す可能性があるのに対し、近隣結合法は系統樹を作成していく各段階で、総枝長を最小にするような最も近い関係にある生物の組(ペア)を見つけて結合していくという逐次的なアプローチを取ります。このため、計算の効率が非常に良いという利点があります。
また、
非加重結合法(UPGMA)が進化速度が系統樹の全ての枝で一定であるという前提に立つのに対し、近隣結合法はこの仮定を置きません。これは、生物によっては進化のスピードが異なったり、特定の遺伝子が異なる速度で進化したりする現実世界の多様な状況に対応できることを意味します。進化距離と系統樹上での経路の長さが等しい、すなわち「加法性」が満たされる条件下であれば、進化速度が枝ごとに変化していても正確な系統樹を構築することが可能です。
アルゴリズムの進め方
近隣結合法の系統樹構築プロセスは、以下のステップで進められます。
1.
距離行列の計算: まず、解析対象となる全ての生物(または分子配列など)のあらゆるペアについて、進化距離を計算し、
距離行列を作成します。
2.
初期樹形の仮定: 全ての生物が中心の一点から放射状に伸びた枝を持つ「星状樹」を最初の系統樹として仮定します。
3.
近隣ペアの探索: 現在の系統樹の状態において、特定の2つの生物(葉または既に結合されたグループ)を結合することで、全体の総枝長が最も短くなるペアを探し出します。このペアが「近隣」として特定されます。この計算には、対象となる全てのペアの距離だけでなく、それぞれの生物から他の全ての生物への距離の合計なども考慮した特別な式が用いられます。
4.
ペアの結合: 特定された近隣ペアを新しい分岐点(節)の下に結合し、これを一つの新しいまとまりとして扱います。
5.
距離行列の更新: 新しくできたまとまりと、残りの生物やまとまりとの間の距離を再計算し、
距離行列を更新します。
6.
繰り返しのプロセス: 3〜5のステップを、全ての生物が最終的に一つの系統樹に結合されるまで繰り返します。
このプロセスを経て、最終的に根を持たない「無根系統樹」が得られます。根の位置を知りたい場合は、別の情報(例えば、他の生物を比較対象として加えるなど)が必要となります。
特徴と評価
近隣結合法は、日本の
斎藤成也博士と
根井正利博士によって1987年に発表されました。
非加重結合法のアルゴリズムを改良した手法であり、その開発以降、分子系統解析の分野で広く利用されてきました。2021年現在でも、最大節約法、最尤法、
ベイズ法といった他の主要な手法と並んで、標準的な解析手法の一つとして認識されています。
その最も顕著な特徴は、前述の通り「高速性」です。比較的多数の生物を含むデータセットであっても、短時間で計算結果を得ることができます。これは、膨大な計算量を要する他の手法と比較した場合の大きな利点です。
また、「適用範囲の広さ」も特長として挙げられます。進化速度が一定であるという限定的な仮定を置かないため、進化速度が多様な生物群にも適用しやすく、現実的な系統関係の推定に適しているとされています。特に、進化距離が比較的近く、加法性が満たされると期待されるような種レベルの系統樹作成において有効と考えられています。
さらに、元となる
距離行列が信頼できるものであるならば、比較的正確な系統樹の形を構成できる可能性が高いことも利点です。
一方で、いくつかの限界も指摘されています。まず、
距離行列法に共通する問題として、元の配列情報などから距離を計算する際に、情報の一部が失われてしまう可能性があります。異なる元の情報を持つ生物のペアでも、計算された距離が同じになってしまうといったケースが考えられます。また、そもそも正確で信頼できる進化距離の
距離行列を推定することが、必ずしも容易ではないという課題もあります。
関連手法
非加重結合法(UPGMA)
最大節約法(MP法)
最尤法(ML法)
ベイズ法(BI法)