比較
ゲノミクス(Comparative genomics)は、異なる
生物種の間で
ゲノムの全体構造を比較分析することで、それぞれの
進化的な繋がりや、生命が歩んできた
進化の道筋を明らかにする学問分野です。
生物の
ゲノムには、長い
進化の歴史の中で自然選択がどのように働き、あるいは働かなかったかの痕跡が刻み込まれています。比較
ゲノミクスは、この痕跡を読み解き、
進化の具体的なメカニズムを探求します。
近年の大規模な
ゲノム解読プロジェクトの成功によって可能となった、比較的新しい研究領域であり、
生物の
進化史に関する多くの重要な情報をもたらすものとして期待されています。
従来の進化研究との違い
これまでの
進化研究、特に
分子系統学では、特定の限られた
遺伝子の配列比較を通じて種の系統関係を推定することが主流でした。この方法によって、かなり確実性の高い系統樹を描くことが可能になりました。しかし、このような限られた
遺伝子の変化は、一般的には
進化の原因そのものというより、
進化の結果として生じた側面が強いと考えられます。
進化と
遺伝子がどのように関連しているのか、そして
進化の具体的な様相を詳細に明らかにするためには、単一または少数の
遺伝子だけではなく、
ゲノム全体、すなわち全ての
遺伝子と
遺伝子以外の機能領域をも含めた広範な比較を行う比較
ゲノミクスのアプローチが必要となります。
研究の基盤と手法
膨大な
ゲノム情報を扱うため、比較
ゲノミクスには高性能な
コンピュータと高度な計算手法が不可欠です。これらの技術は
バイオインフォマティクスと呼ばれ、比較
ゲノミクスの強固な基盤となっています。
バイオインフォマティクスは、
ゲノム配列の中から
遺伝子や機能的に重要な非コード領域(ノンコーディング領域)を見つけ出すための解析手法を開発・提供しています。一方で、比較
ゲノミクスによる実際のデータ解析が進むことで、
バイオインフォマティクスにおける新しい解析手法やアルゴリズムの開発がさらに促進されるという相互補完的な関係にあります。
比較
ゲノム解析の中心的な手法の一つは、異なる
生物種間で
遺伝子やその調節領域の「相同性」(共通の祖先由来である可能性)を調べ、そこに過去にかかった選択圧を推定することです。例えば、生命維持に不可欠な機能を持つ
遺伝子や領域は、強い「保存選択」がかかり、種が分かれても配列がよく似た状態(高い配列類似性)に保たれる傾向があります。逆に、新しい機能の獲得などによって急速な変化が有利となる場合には、「多様化選択」がかかり配列類似性が低くなることがあります。また、機能的に重要でない領域や、選択圧がほとんどかからない領域は、「中立
進化」によって配列が比較的速やかに変化し、種間での類似性が低くなる傾向があります。このように配列の類似性の度合いから、各
ゲノム領域がどのような選択を受けて
進化してきたかを推測することが可能です。
相同性を持つ
遺伝子は、一般的に共通の祖先から受け継がれたものと考えられています。相同性のある
遺伝子は、その由来によって主に二つのタイプに分類されます。
- - パラログ(Paralog): ある生物種のゲノム内で、遺伝子重複などのイベントを経て生じた、類似した配列を持つ複数の遺伝子を指します。これらは共通の祖先遺伝子から派生し、多くの場合、機能的に重複しているか、あるいはそれぞれが異なる特定の機能を持つように分化しています。
- - オーソログ(Ortholog): 種が分かれる以前の共通祖先が持っていた一つの遺伝子が、種分化を経てそれぞれの種に受け継がれたものを指します。異なる種間に存在し、共通祖先からの垂直的な継承によって生じたと考えられ、基本的に異なる種間で同じ、あるいは類似した機能を持つことが多いです。
複数の
生物種間でオーソログとパラログの関係を詳細に解析することで、ある
遺伝子が重複してパラログを生じたのがいつ頃の
進化段階なのか、そしてその後に種分化がどのように起きたのか、といった
遺伝子の歴史と種の歴史の時間的な前後関係や相互作用を推定することができます。
ただし、
進化の過程で一部の
遺伝子が失われたり、機能が大きく変化したりすることもあるため、オーソログとパラログの厳密な区別は時に困難を伴い、解析には注意が必要です。このような誤りを避け、より確実な
進化的な関係やメカニズムを推定するためには、なるべく多くの異なる
生物種の
ゲノム情報を比較することが有効です。比較
ゲノミクスは、多様な
生物種の
ゲノム情報を活用することで、生命
進化の壮大な物語を
ゲノムレベルで読み解くための強力な手法となっています。