コーディング領域とは、ゲノム上に存在する
遺伝子の一部で、生命活動を支える
タンパク質の設計情報が記録されている特定の配列区間を指します。
生物の遺伝情報はデオキシリボ核酸(DNA)に収められています。このDNAの情報は、まずメッセンジャーRNA(mRNA)と呼ばれる分子に「転写」されます。続いて、このmRNAの情報に基づいて
タンパク質が「翻訳」されることで、多様な機能を持つ
タンパク質が細胞内で作り出されます。
コーディング領域は、この一連の情報伝達プロセスにおいて、
タンパク質のアミノ酸配列を決定するための暗号(コドン)が連続して並んでいる核心部分にあたります。転写されたばかりの未成熟なRNAは、様々な加工を経て成熟mRNAとなります。成熟mRNAは、
タンパク質へと翻訳されるコーディング領域の他に、分子の両端に翻訳されない領域を持っています。これらはそれぞれ、5'末端側に位置する5'非翻訳領域(5' UTR: five prime untranslated region)と、3'末端側に位置する3'非翻訳領域(3' UTR: three prime untranslated region)と呼ばれます。これらの非翻訳領域は、mRNAの安定性や翻訳効率、局在などに関わる重要な役割を果たしますが、それ自体が
タンパク質のアミノ酸配列情報を持つわけではありません。
これに対して、コーディング領域は、成熟mRNAにおいて5' UTRと3' UTRの間に挟まれた位置に厳密に定められています。この領域は、
タンパク質合成を開始するように指定する特定の配列である
開始コドン(多くの場合はAUG)から始まり、合成を終了するように指定する終止コドン(UAA, UAG, またはUGAのいずれか)で終わります。この
開始コドンと終止コドンによって明確に区切られた区間こそが、実際にリボソーム上で読み取られ、特定のアミノ酸配列を持つポリペプチド鎖、すなわち
タンパク質へと翻訳される領域なのです。
コーディング領域という言葉は、一般的には
タンパク質合成の直接的な鋳型となるmRNA上の配列を指して用いられますが、そのmRNAがDNAから転写されるものであることから、DNA上の対応する配列区間もまた、広義にはコーディング領域と呼ばれることがあります。DNA上のコーディング領域は、その後のmRNAを経て
タンパク質の構造と機能に直結するため、変異が起きた際に
タンパク質に直接的な影響を及ぼしやすい、
遺伝子の中で最も機能的に重要な部分の一つと考えられています。
ゲノムの中には、
タンパク質に翻訳されない機能性RNA分子(
ノンコーディングRNA)をコードする
遺伝子領域も多数存在します。これらの領域は、
タンパク質合成の鋳型とはならないため、コーディング領域を持ちません。一方で、
タンパク質合成のために遺伝情報を伝達する
伝令RNA(mRNA)をコードする
遺伝子領域は、必ず
タンパク質に翻訳されるべきコーディング領域を含んでいます。
コーディング領域の正確な特定と機能解析は、ゲノム科学、分子
生物学、遺伝医学など、生命科学の多くの分野における基礎研究および応用研究の中心課題の一つです。どのような
タンパク質がどこで、どれだけ作られるのかを理解することは、生命の複雑な仕組みを解き明かし、疾患のメカニズムを理解し、新たな治療法や診断法を開発する上で不可欠なステップとなります。
参考文献
Gerstein MB, Bruce C, Rozowsky JS, Zheng D, Du J, Korbel JO, Emanuelsson O, Zhang ZD, Weissman S, Snyder M. "What is a gene, post-ENCODE? History and updated definition." Genome Res. 2007 Jun;17(6):669-81. [1]
Robins H, Krasnitz M, Levine AJ. "The computational detection of functional nucleotide sequence motifs in the coding regions of organisms." Exp Biol Med (Maywood). 2008 Jun;233(6):665-73. [2]
Dinger ME, Pang KC, Mercer TR, Mattick JS. "Differentiating protein-coding and noncoding RNA: challenges and ambiguities." PLoS Comput Biol. 2008 Nov;4(11):e1000176. [3]
関連項目
オープンリーディングフレーム
伝令RNA
ノンコーディングRNA