相補的DNA(cDNA)
相補的DNA(complementary DNA、略称cDNA)は、
伝令RNA(mRNA)を鋳型として、逆
転写酵素の働きによって合成される二本鎖のDNA分子です。「相補的」という名称は、mRNAの塩基配列に対して相補的な配列を持つことに由来します。
遺伝子解析や
タンパク質の研究において非常に重要な役割を果たしています。
真核生物の遺伝子情報とcDNA
ヒトを含む真核生物では、
遺伝子は
ゲノムDNA上にコードされていますが、
タンパク質として機能するための情報だけでなく、
イントロンと呼ばれる非翻訳領域が含まれています。
ゲノムDNAから
転写されたばかりのRNA(mRNA前駆体)は、スプライシングという過程を経て
イントロンが除去され、エキソンと呼ばれる翻訳される領域だけが繋がった成熟mRNAとなります。
cDNAは、このスプライシングが完了した成熟mRNAを元に合成されるため、
イントロンを含まない
遺伝子の塩基配列情報を持っています。これは、
遺伝子を大腸菌などの他の生物で発現させて
タンパク質を生産したり、
遺伝子の配列情報を効率的に解析したりする上で大きな利点となります。また、mRNAにはスプライシング以外にRNAエディティングという化学修飾が起こる場合があり、
ゲノムDNAの配列と対応するcDNAの配列を比較することで、RNAエディティングが起きている位置(エディティングサイト)を特定することも可能です。
cDNAの合成方法
cDNAを合成する際には、細胞から抽出した全RNA、あるいはmRNAのみを分離したpolyA-RNAを鋳型として用います。逆
転写酵素が反応を開始するためには、鋳型RNAにプライマーと呼ばれる短い
核酸鎖が結合(アニール)する必要があります。プライマーの種類によって、cDNA合成の開始位置や得られる配列に違いがあります。
オリゴdTプライマー: mRNAの3'末端にあるポリA構造に特異的に結合し、mRNAの3'側から選択的にcDNAを合成します。
遺伝子特異的プライマー: 既知のcDNA配列に特異的なプライマーを用いることで、特定の
遺伝子のcDNAのみを合成できます。
ランダムプライマー: 5〜8塩基程度の短い様々な配列のプライマーの混合物で、mRNA上の様々な箇所から非選択的にcDNA合成を開始させます。
逆
転写酵素としては、AMV(トリmyeloblastosisウイルス)由来や、MoMuLV(モロニーマウス白血病ウイルス)由来のものがよく使用されます。かつてはAMV由来
酵素が熱安定性で優れていましたが、現在ではMoMuLV由来
酵素の改良が進み、熱安定性の高い変異型
酵素が広く利用されています。PCRに用いられる一部の熱耐性型DNAポリメラーゼも逆
転写活性を持つものがあり、利用されることがあります。
cDNA合成においては、mRNAが高次構造をとると
酵素の伸長が阻害されることや、二本鎖合成時に5'末端にヘアピン構造を利用すると完全な5'末端配列が得られにくいといった技術的な課題があります。これらの問題は、鋳型RNAの熱変性や、より高温で反応可能な
酵素の使用、あるいはピロリン酸ホスファターゼを利用した特殊な合成法などによって克服されています。
理化学研究所の完全長cDNA解析プロジェクトなどで作製された高品質なcDNAライブラリーは、これらの改良された合成法を用いています。
cDNAの解析と応用
合成されたcDNAは、様々な手法で解析・利用されます。
cDNAライブラリー: cDNAをλファージや
プラスミドといったベクターに組み込み(
クローニング)、これを大量に保持する細胞集団を作ることで、特定の細胞や組織で発現している様々な
遺伝子のcDNAをまとめたライブラリーが構築されます。特定の
遺伝子のcDNAを探す際には、このライブラリーをスクリーニングします。
RT-PCR (Reverse Transcription PCR): mRNAから逆
転写反応でcDNAを合成した後、特定の
遺伝子配列をPCR法で増幅する手法です。標的
遺伝子の発現量を検出したり、配列情報を解析したりするのに用いられます。
RACE法 (Rapid Amplification of cDNA end): RT-PCRの応用で、既知の配列情報だけを用いて、cDNAの未知の5'側または3'側末端の配列を効率的に増幅・決定する手法です。
サブトラクション法: 比較したい2つの細胞や組織の間で、発現量が異なる
遺伝子のcDNAを選別して増幅し、解析する手法です。
関連技術・プロジェクト
cDNAは、多くの分子
生物学技術や大規模プロジェクトの基盤となっています。
EST (Expressed Sequence Tag): cDNAライブラリーからランダムに選ばれたクローンの5'または3'末端から得られる短い配列情報(数百塩基)です。
遺伝子転写産物の「目印」として
データベース化され、未知
遺伝子の探索や配列決定の手がかり、あるいは
DNAマイクロアレイのプローブ設計などに活用されています。
SAGE (Serial Analysis of Gene Expression): cDNAの一部から短いタグ配列を切り出し、これらを連結してまとめてシーケンスすることで、多数の
遺伝子の発現量を同時に測定する手法です。SuperSAGE、CAGEなど改良法も開発されています。
FANTOM: 理化学研究所などが主導する国際的な研究コンソーシアムで、マウスの完全長cDNAクローンに対し、その機能(アノテーション)を詳細に注釈付けすることを目的として始まりました。トランスクリプトーム解析から生命システムの理解へと研究を発展させています。
これらの技術やプロジェクトを通じて、cDNAは生命活動を担う
遺伝子の実体や働きを理解するための不可欠なツールとして、現代の
生物学研究を支えています。