定義と構造
5-メチル
シトシン(略号:5mC, m5C)は、デオキシリボ核酸(DNA)を構成する基本的な
塩基の一つ、
シトシン(C)に
メチル基が付加された化学構造を持つ修飾
塩基です。この
メチル基は、
シトシン環の炭素原子のうち、図の6時方向の
窒素原子から反時計回りに数えて5番目の炭素に結合しています。この5位の炭素に
メチル基が存在することが、
シトシンと5-メチル
シトシンを区別する重要な特徴です。
生命現象における役割
この修飾
塩基は、
遺伝子の転写調節をはじめとする細胞内の多様な生命機能に関与しています。
シトシンの
メチル化そのものがDNAの転写プロセスを直接変化させるわけではありませんが、特に真核生物においては、これが
遺伝子発現のパターンに大きな影響を与えることが多くの研究で明らかになっています。このようなDNA
塩基の化学修飾による
遺伝子機能の変化を研究する学問分野は「エピジェネティクス」と呼ばれており、5-メチル
シトシンはその中心的な要素の一つです。
DNA中に5-メチル
シトシンが生成されるのは、主にDNAメチルトランスフェラーゼという酵素によるエピジェネティックな化学修飾を経てからです。この
メチル化された
シトシンは、
ヌクレオシド(糖と
塩基の結合体)の状態である5-メチルシチジンとしてDNA鎖に取り込まれています。
発見の経緯
5-メチル
シトシンの存在が初めて示唆されたのは、1898年に
結核菌から
細菌性
毒素を単離しようとした研究においてでした。この時に発見された新たな核酸は「ツベルクリン酸」と名付けられ、既知のDNA
塩基(
チミン、
グアニン、
シトシン)とは異なる、
メチル化された
塩基を含む
ヌクレオチドを持つことが示されました。その後、1925年にはツベルクリン酸の硫酸
加水分解物から少量の
メチル化シトシンが生成されたとの報告がありましたが、これはピクリン酸結晶の光学特性のみに基づくものであり、他の研究者によって再現されなかったため、当時は懐疑的に受け止められました。しかし、1948年になって、仔牛の
胸腺由来DNAから、ペーパークロマトグラフィーという分析手法を用いて、従来の
シトシンや
ウラシルとは異なる
メチル化シトシンが単離され、その存在が決定的なものとなりました。それから約70年後には、RNA分子中にも広く存在することが確認されましたが、RNAにおける正確な機能については、まだ研究が進められています。
生物種による存在と機能の多様性
5-メチル
シトシンのゲノム上の分布や機能は、生物種によって大きく異なります。
細菌では、ゲノム上の様々な位置に存在し、自身のDNAを
メチル化感受性制限酵素による分解から保護するマーカーとしての役割を果たすことが多いです。植物においては、5-メチル
シトシンはCpG配列に加え、CpHpGやCpHpH(Hはアデニン、
シトシン、
チミンのいずれか)といった特定の配列パターンに局在しています。真菌や動物では、主にCpGジ
ヌクレオチドと呼ばれる配列、すなわち
シトシンの直後に
グアニンが続く配列中に存在します。多くの真核生物ではCpGサイトの
メチル化率は比較的低いですが、
脊椎動物ではCpG配列中の
シトシンの70%から80%が高い
メチル化率を示します。哺乳類においては、ゲノム全体の
塩基のおよそ1%が5-メチル
シトシンであると推定されています。
変異誘発との関連と研究手法への応用
シトシンは自発的な化学反応である
脱アミノ化を受けると
ウラシル(U)に変化し、これは
DNA修復機構によって通常速やかに除去されます。しかし、5-メチル
シトシンが
脱アミノ化されると、遺伝情報としては
チミン(T)と同じ構造の
塩基を生じます。このCからTへの
塩基の変換は、DNA複製時にミスを取り込みやすく、
塩基置換型の
突然変異を引き起こす原因となり得ます。また、APOBECファミリーと呼ばれる酵素群によって引き起こされる
シトシンや5-メチル
シトシンの
脱アミノ化は、細胞内の特定のプロセスや生物の進化にも関与している可能性が示唆されています。
化学的な性質としては、
亜硝酸のような化学物質によって5-メチル
シトシンからアミノ基を取り除く(
脱アミノ化する)と
チミンが生成されます。同じ条件下で
シトシンが
脱アミノ化されると
ウラシルになります。この性質を利用した重亜硫酸処理では、
シトシンは
脱アミノ化されて
ウラシルへと変換されますが、5-メチル
シトシンは
メチル基の存在により安定であり、
脱アミノ化されません。この化学的な違いは、ゲノムDNA中のどの
シトシンが
メチル化されているかを高精度に解析するための重要な技術である「重亜硫酸塩シークエンス」に応用されています。
DNAメチル化の制御:DNMTによる付加と脱メチル化機構
真核生物において、5-メチル
シトシンはDNAメチルトランスフェラーゼ(DNMT)と呼ばれる酵素ファミリーの働きにより、ゲノムDNA上の特定の
シトシンに
メチル基が付加されることで生成されます。ヒトゲノムにおいては、DNMT1、DNMT2、DNMT3A、DNMT3B、DNMT3Lの5種類のDNMTが同定されています。DNMT1は、DNA複製の際に親鎖の
メチル化パターンを娘鎖に引き継ぐ「維持
メチル化」を主に行います。一方、DNMT3AとDNMT3Bは、それまで
メチル化されていなかった
シトシンを新たに
メチル化する「新規
メチル化(de novo
メチル化)」を主に担当します。DNMTは互いに相互作用することで、その
メチル化能力を高めることが知られています。例えば、DNMT3LはDNMT3Aと複合体を形成し、DNAとの結合を強化して
メチル化反応を促進します。これらのDNMTの発現量や活性に異常が生じると、ゲノム全体の
メチル化パターンが乱れ、様々な機能障害を引き起こす可能性があります。
一度
メチル化された
シトシン(5-メチル
シトシン)は、複数のメカニズムを通じて元の
シトシンの状態に戻されることがあります。一つは「受動的な脱
メチル化」で、DNMTによる
メチル化の維持がうまくいかない場合などに、細胞分裂によるDNA複製を通じて徐々に
メチル化された
シトシンが希釈されていくプロセスです。もう一つは「能動的な脱
メチル化」で、これは enzymatic な酸化プロセスによって段階的に行われます。5-メチル
シトシンはTETファミリーと呼ばれる酵素群によって、まず5-ヒドロキシメチル
シトシン(5hmC)に酸化され、さらに5-ホルミル
シトシン(5fC)、最終的には5-カルボキシル
シトシン(5caC)へと変換されます。5fCと5caCは、
チミンDNAグリコシラーゼ(TDG)などの酵素によってDNA鎖から切り出され、
塩基除去修復(BER)経路によって元の
シトシンへと修復されます。TET酵素は、5-メチル
シトシンを他の酸化中間体よりも優先的に基質として認識することが分かっています。
ヒトにおける重要性:癌と老化との関連
ヒトの細胞、特に癌細胞においては、ゲノムDNAの
メチル化パターンが異常な状態を示すことがよくあります。これは、ゲノム全体での
メチル化レベルの低下(低
メチル化)や、特定の領域での過剰な
メチル化として観察されます。例えば、癌細胞では、通常は
遺伝子の働きを抑える腫瘍抑制
遺伝子のプロモーター領域にあるCpGアイランドが異常に
メチル化され、これらの
遺伝子が不活性化される例が知られています。また、
サテライトDNAやAlu配列、LINEなどのゲノム中の反復配列は、癌細胞でしばしば低
メチル化しており、これは本来発現しないはずの
遺伝子の異常な発現を引き起こす可能性があります。癌細胞におけるDNMTの発現レベルの上昇は、異常な
メチル化レベルと関連していることが報告されています。
5-メチル
シトシンの
メチル化レベルは、生物の老化プロセスとも深く関連しています。「エピジェネティックエイジ」という概念は、個人のDNA
メチル化パターンが実際の暦年齢とどの程度一致するかを示す指標です。「クロックCpG」と呼ばれる特定のCpGサイトにおける
メチル化レベルと、年齢との関係を統計的に解析するアルゴリズムを用いることで、個人の「エピジェネティックな年齢」を予測することが可能になっています。特に若い時期(0〜20歳頃)は、発達や成長に伴ってDNA
メチル化パターンが比較的速く変化しますが、高齢になるとその変化速度は緩やかになります。
エピジェネティックな年齢を推定するためのアルゴリズムは複数開発されています。代表的なものとして、複数の組織由来サンプルで有効なHorvathの時計(353のCpGサイトを使用)、成人血液サンプルに特化したHannumの時計(71のCpGサイトを使用)、そして死亡率予測において高い精度を示すとされるLevineの時計(DNAm PhenoAge、513のCpGサイトを使用)などがあります。中には、ELOVL2
遺伝子上のたった一つのCpGサイトの
メチル化状態だけで年齢を推定する試みも報告されています。このような年齢推定は、5-メチル
シトシンなどの
メチル化マーカーに基づいて、将来的な年齢関連疾患のリスクを予測したり、個人の寿命との関連を探る研究に応用されています。
参考文献
* Griffiths, Anthony J. F. (1999). An Introduction to genetic analysis. San Francisco: W.H. Freeman. Chapter 15: Gene Mutation.
ISBN 0-7167-3520-2 (available online at the United States National Center for Biotechnology Information)