国際HapMap計画
国際HapMap計画(International HapMap Project)は、
ヒトゲノムに見られる遺伝的変異の共通パターンを網羅した「
ハプロタイプマップ」を構築することを主目的として立ち上げられた大規模な国際共同プロジェクトです。このマップは、人間の遺伝的多様性を理解し、病気の原因遺伝子や薬への反応性の違いに関わる遺伝的要因を探る研究にとって、非常に重要な基盤情報を提供します。
このプロジェクトで得られたデータは、世界中のどの研究者でも自由に利用できるよう、インターネットを通じて無償で公開されています。カナダ、中国、日本、ナイジェリア、イギリス、アメリカ合衆国といった多国籍の学術研究機関、非営利の医学研究機関、そして企業が協力してプロジェクトは進められました。
正式なプロジェクト開始は2002年10月下旬に開かれた会合であり、当初は3年間の計画としてスタートしました。プロジェクトは大きく三段階に分けて実施され、フェーズ1で取得された全てのデータは2005年10月に公開。続いてフェーズ2のデータセットに基づく解析結果が2007年10月に発表され、最終段階であるフェーズ3のデータセットは2009年春に公開されました。
背景
比較的珍しい単一
遺伝子疾患とは異なり、広く見られる一般的な疾患(例えば、糖尿病、がん、心臓病、脳卒中、うつ病、喘息など)や、個人ごとの薬剤への反応性の違いは、複数の遺伝子と環境要因が複雑に絡み合って生じると考えられています。これらの疾患に関連する遺伝的要因を特定するためには、理論的には、疾患を持つ人と持たない人の全ゲノム配列を詳細に比較すれば原因特定の手がかりが得られます。しかし、すべての人のゲノムを完全に読み解くには現在でも莫大な費用がかかるため、現実的な方法ではありませんでした。国際HapMap計画は、この課題に対し、より効率的なアプローチを提案しました。
血縁関係のない人々のDNA配列は約99.5%が同じですが、わずかに異なる箇所があります。この違いを「
SNP(
一塩基多型)」と呼びます。特定のSNPにおいて異なる塩基配列を持つDNA鎖のバリアントを「
アリル」と呼びます。HapMap計画は、特に集団中での出現頻度が1%以上の「コモンSNP」に焦点を当てました。
ヒトは通常、各染色体を2本ずつ持っています(性染色体を除く)。特定のSNP位置における2本の染色体のアリルの組み合わせを「
ジェノタイプ(遺伝子型)」と言います。ジェノタイプを決定するプロセスは「ジェノタイピング」と呼ばれます。HapMap計画では、選ばれた269人のサンプルについて、既に知られている数百万のSNPを対象にジェノタイピングを行い、その結果を公開しました。
一本の染色体上で近くに位置するSNPのアリルは、しばしば一緒に遺伝する傾向があります。これは「
連鎖不平衡」と呼ばれ、進化の過程で生じた変異が、その周囲のDNA領域とともに世代を超えて受け継がれるためです。したがって、あるSNPのアリルが分かれば、その近くにある別のSNPのアリルもある程度予測できます。しかし、SNP間の距離が離れると、世代交代の過程で起こる「
組換え」によってDNA配列が混ぜ合わされ、この関連性は弱まります。
一本の染色体上にある、このように連鎖して遺伝する連続したアリル配列のまとまりを「
ハプロタイプ」と呼びます。HapMap計画は、この
ハプロタイプのパターンと多様性を詳細に調べ上げました。
対象サンプル
ハプロタイプのパターン自体は異なる集団間でも見られますが、その出現頻度には集団間で大きな違いがあります。国際HapMap計画では、初期段階で主に以下の4つの集団からのサンプルが使用されました。
ナイジェリア、
イバダンに住む
ヨルバ人(両親と子の
トリオ30組)
アメリカ、ユタ州の北ヨーロッパ・西ヨーロッパ系住民(
トリオ30組)
日本の東京在住の血縁関係のない個人44人
中国の北京在住の漢民族由来の血縁関係のない個人45人
これらの集団から得られた
ハプロタイプ情報は他の集団の研究にも有用ですが、様々な集団の多様性をさらに捉えるため、フェーズIIIでは対象を大幅に拡大し、合計11の異なる祖先を持つ集団グループからサンプルが集められました。
戦略と成果
プロジェクトのフェーズ1では、
ヒトゲノム全体にわたって約5,000塩基対ごとに配置されたコモンSNP、合計100万個以上を目標にジェノタイピングが実施されました。この作業は世界10ヶ所のジェノタイピングセンターで分担され、5種類の手法が用いられました。データ品質を保証するため、重複サンプルの分析や異なるセンター間での定期的チェックが厳格に行われました。
当初、分析対象とするのに十分な数のSNPが見つからないゲノム領域があったり、コモンSNPの基準を満たさないものが多かったりしたため、計画を進めるためには追加のSNPを特定しジェノタイピングする必要が生じました。これに対応するため、コンソーシアムは数百万ものSNPを追加し、大規模なリシーケンシングに多大な資金を投入しました。
プロジェクト開始時、公共データベース(dbSNP)に登録されていたSNPは約280万個でしたが、HapMap計画による貢献で、2003年9月にはさらに280万個が追加され、フェーズIIが完了した2006年8月には合計1000万個を超えるSNP情報が集積されました。この時点で、これらのSNPのうち25~35%が、解析に有用な集団頻度(MAF≧0.05)を持つコモンSNPでした。
プロジェクト開始時に利用可能なSNPが限られていた状況から比較すると、HapMap計画は、
ゲノムワイド関連解析(GWAS)、連鎖不平衡の分析、組換えパターンの研究、自然選択の影響の検出など、様々な遺伝学的解析に利用できるSNP情報を大幅に増加させました。これにより、ヒトの遺伝的多様性と疾患メカニズムの理解が大きく前進しました。
この国際的な取り組みを通じて構築された
ハプロタイプマップは、現在も多くの遺伝子研究の基礎として活用されています。