GC含量とは
GC含量(ジーシーがんりょう、GC-content)は、DNAやRNAといった核酸分子を構成する塩基のうち、
グアニン(G)と
シトシン(C)が占める割合を示す指標です。特定の遺伝子やDNA断片、あるいは生物の持つ全遺伝情報である
ゲノム全体に対して用いられ、通常パーセンテージ(%)で表現されます。
核酸の
二重らせん構造において、塩基は特定の相手と対を形成します。
アデニン(A)は
チミン(T)(RNAの場合は
ウラシル、U)と対になり、
グアニン(G)は
シトシン(C)と対になります。ATペア(またはAUペア)は2本の
水素結合で、GCペアは3本の
水素結合で結ばれます。
安定性との関連
GC含量は核酸分子の安定性、特に熱に対する安定性と関連が深いです。一般に、GC含量が高いDNAは、熱による
二重らせん構造の融解温度(融点)が高くなる傾向にあります。この熱安定性の主な要因は、
水素結合数よりも、
塩基対が積み重なる際に働く「スタッキング相互作用」にあることがわかっています。GC
塩基対は、その構造からATペアよりも強力なスタッキング相互作用を持ちます。
生物現象と応用
GC含量は様々な生物現象や分子生物学的な手法に関係します。かつて、高いGC含量が生物の高温環境適応に必須とされましたが、これは否定されました。しかし、
原核生物では最適な生育温度と構造RNA(rRNA, tRNAなど)のGC含量との間に相関が見られます。また、高いGC含量を持つ一部の
細菌では
自己融解しやすい例も観察されています。
分子生物学の手法である
ポリメラーゼ連鎖反応(PCR)では、
プライマーのGC含量は、アニーリング温度を予測するために重要です。GC含量が高い
プライマーほど、より高いアニーリング温度が必要とされます。
測定方法
GC含量を決定する最も正確な方法は、DNAやRNAの塩基配列を決定し、以下の計算式で算出することです。
$$ \%GC = \frac{G+C}{A+T+G+C} \times 100 $$
AT
塩基対とGC
塩基対の比を示すAT/GC比 $(\text{A+T})/(\text{G+C})$ も関連指標として用いられます。
配列情報がない場合でも、実験的に測定できます。DNAの融点を
分光測色法で測定する方法は、GC含量が高いほど融点が高くなる性質を利用します。また、ATまたはGC特異的な蛍光色素を用いた
フローサイトメトリーも利用されます。
ゲノム中のGC含量
生物の
ゲノムにおいて、GC含量は全体で均一ではなく、領域によって異なります。高等生物では、GC含量の高い領域がモザイク状に存在し、アイソコアと呼ばれます。これらの高GC領域は遺伝子が豊富に存在する傾向があり、タンパク質コード領域は
ゲノム全体と比較してGC含量が高いことが一般的です。
ゲノムのGC含量は生物種によって大きく異なります。これは、進化的な選択、
突然変異の偏り、
DNA修復時の偏り(GC-biased gene conversionなど)といった要因が関与していると考えられます。ヒト
ゲノムの平均GC含量は約41%ですが、
マラリア原虫のように極端に低い種(約20%)や、
放線菌のように非常に高い種(約72%)も存在します。
ゲノムのGC含量は、特に
原核生物の分類において重要な指標として利用されてきました。
細菌の高次分類にGC比を用いることが勧告された歴史があり、例えば
放線菌は「高GC含量グラム陽性菌」として特徴づけられます。このように、GC含量は生物の分類や進化を理解する上でも利用される情報です。