コドン(Codon)
定義と遺伝暗号
コドンとは、生物が遺伝情報に基づいて
タンパク質を作り出す際に、個々のアミノ酸を指定するための三つの連続した
核酸塩基の配列を指します。特に、DNAから転写されたメッセンジャーRNA(mRNA)上の配列を指すのが一般的です。この三塩基の並び(トリプレット)が一つ特定のアミノ酸に対応するというルールは、「遺伝暗号」あるいは「遺伝コード」と呼ばれ、生命活動の根幹をなす情報変換の仕組みです。
なぜ三塩基なのか
タンパク質を構成する主要なアミノ酸は約20種類あります。一方、DNAやRNAを構成する塩基は
アデニン(A)、
グアニン(G)、
シトシン(C)、
チミン(T、RNAでは
ウラシル: U)の4種類です。もしアミノ酸を1つの塩基で指定すると4種類しか区別できず、2つの塩基の組み合わせでも4×4=16種類にしかならないため、20種類全てを網羅できません。しかし、3つの塩基の組み合わせなら4×4×4=64種類が可能となり、全てのアミノ酸を十分に区別できます。この64通りの組み合わせのうち、ほとんどが特定のアミノ酸を指定し、残りは
タンパク質合成の終了を示す「終止コドン」として機能します。
遺伝コードの普遍性と例外
生物の遺伝コードは、ほとんどの生物で共通しているため、「基準遺伝コード」や「標準遺伝コード」とも呼ばれます。しかし、これは普遍的なものではなく、一部の生物や細胞小器官(例えば
ヒトのミトコンドリア)では、わずかに異なるコードを使用していることが知られています。これらの変形コードも存在するものの、基本的な3塩基単位でアミノ酸を指定するという構造は共通しています。
遺伝コードの縮重とエラー耐性
遺伝コードの重要な性質の一つに「縮重」があります。これは、多くのアミノ酸が複数の異なるコドンによって指定される性質です。例えば、あるアミノ酸は2種類のコドンで、別のアミノ酸は6種類のコドンでコードされるといった具合です。しかし、一つのコドンが複数の異なるアミノ酸を同時に指定することはありません(非多義性)。この縮重により、DNAやRNAの
塩基配列に突然変異(点突然変異など)が生じても、アミノ酸の種類が変わらなかったり(サイレント変異)、類似のアミノ酸に置換されたりする可能性が高まります。これにより、遺伝情報は比較的安定に保たれ、生命機能への致命的な影響が軽減されるという生物学的な利点があります。
生物種によるコドン利用の偏り
同じアミノ酸を指定する複数のコドン(同義コドン)がある場合、生物種によって、あるいは同じ生物種内でも
遺伝子によって、どのコドンが多く使われるか(コドン出現頻度)に傾向が見られます。この偏りは、
遺伝子の発現量や対応するtRNAの存在量と関連があるとされ、組換え
タンパク質の発現効率などに影響を与えることがあります。
遺伝コードの解読
DNAの二重らせん構造が解明された後、遺伝情報がどのように
タンパク質に変換されるのかという謎の解明が進みました。
ジョージ・ガモフが三塩基説を提唱し、クリックとブレナーらの実験がこれを裏付けました。そして1961年、
マーシャル・ニーレンバーグとハインリッヒ・マッタイが無細胞系を用いて初めて特定のコドン(UUU)がフェニル
アラニンを指定することを発見しました。その後、ニーレンバーグやハー・ゴビンド・コラナらによって、多くのコドンとアミノ酸の対応関係が次々と明らかにされ、遺伝コード表が完成しました。これらの功績に対して、1968年にはコラナ、ニーレンバーグ、そしてtRNAの構造を解明した
ロバート・W・ホリーにノーベル生理学・医学賞が授与されました。
遺伝情報の流れとコドンの役割
生物の遺伝情報は通常DNAに保存されています。
タンパク質を作る際には、まずDNAの特定の領域(
遺伝子)が写し取られ、mRNAが作られます(転写)。次に、mRNAの
塩基配列が
リボソーム上で読み取られ、対応するアミノ酸が運ばれてきてつながり、
タンパク質が合成されます(翻訳)。この翻訳の際、mRNA上のコドンが、特定のアミノ酸を持つトランスファーRNA(tRNA)と結合することで、正しい順序でアミノ酸がポリ
ペプチド鎖に組み込まれていきます。
読み枠と開始・終止コドン
mRNAの
塩基配列は、どこから読み始めるかによって、異なるアミノ酸配列を生み出す可能性があります。コドンは3塩基単位で読み進められるため、読み始めの位置には3通りの「読み枠」が存在します。
タンパク質の合成は、通常、特定の「
開始コドン」(最も一般的なのはAUG)から始まり、特定の「終止コドン」(UAA, UAG, UGAのいずれか)に達すると終了します。
開始コドンは
メチオニンを指定することが多く、多くの
タンパク質の最初のアミノ酸は
メチオニンです。終止コドンに対応するアミノ酸はなく、
リボソームから合成中の
タンパク質鎖を解放するシグナルとして働きます。もし塩基の挿入や欠失によって読み枠がずれると、「フレームシフト変異」となり、全く異なるアミノ酸配列や早期の終止コドンを生じさせ、機能的な
タンパク質が作られなくなることが多いです。
遺伝コードの起源に関する理論
地球上の生命が共有する遺伝コードはよく似ていますが、なぜ現在のコードが選ばれたのかについては諸説あります。一つの考え方は、初期の地球環境において、特定のアミノ酸が対応する
塩基配列に化学的な親和性を持っていたため、それが遺伝コードの基盤になったというものです。別の考え方は、より単純な初期の遺伝コードが、新しいアミノ酸が利用可能になるにつれて徐々に拡張されていったというものです。また、遺伝コードの縮重が持つエラー耐性など、コードの割り当て方が突然変異の影響を最小限にするように自然選択によって最適化されたという説もあります。現在も、この生命の基本原理の起源について活発な研究が進められています。