長鎖散在反復配列(LINE)
長鎖散在反復配列(Long Interspersed Nuclear Element, LINE)は、真核生物のゲノム中に豊富に存在する「動く遺伝子」である
レトロトランスポゾンの一種です。特に
ヒトゲノムにおいては、その全体のおよそ21.1%を占める広範な領域にわたって見られます。LINEは、ゲノム上を移動し、自身のコピーを増やして新たな場所に挿入する能力を持つ非LTR型
レトロトランスポゾンに分類されます。
構造と増殖メカニズム
標準的なLINEの長さは約7000
塩基対です。これらの配列はメッセンジャーRNA(mRNA)に転写された後、特定の
タンパク質へと翻訳されます。主要な
タンパク質はORF2と呼ばれ、これは
逆転写酵素(RT)と
エンドヌクレアーゼ(EN)という重要な機能を併せ持ちます。多くのLINEはさらにORF1という別の
タンパク質もコードしており、これはRNA結合などに関わると考えられています。
LINEがゲノム中で自己増殖するメカニズムは、「標的プライム逆転写(TPRT)」と呼ばれます。これはカイコにおけるR2要素で最初に詳細が明らかになりました。まず、LINEのRNAがORF1およびORF2
タンパク質と結合してリボ核
タンパク質(RNP)複合体を形成します。このRNP複合体は核内に運ばれ、ORF2の
エンドヌクレアーゼ活性によってゲノムDNAの特定の部位(
哺乳類ではTTAAAAなどのモチーフ)を切断します。切断されたDNAの3’末端をプライマーとして、ORF2の
逆転写酵素がLINE RNAを鋳型にDNAコピーを合成します。その後、このDNAコピーがゲノムに組み込まれることで、新しいLINEの挿入が完了します。新たな挿入配列の多くは、完全な長さを持たずに5'側が
平均的に短縮されており(ヒトでは
平均900bp)、しばしば元の向きとは逆向きに組み込まれることもあります。新しい挿入は、短い標的部位重複(TSD)を伴うのが特徴です。
分類とゲノムにおける分布
LINEは、鍵となる
逆転写酵素の構造的特徴や系統関係に基づき、L1、RTE、R2、I、Jockeyといった主要な5つのグループに分類され、さらに多数の下位分類が存在します。
ヒトゲノム: ヒトゲノムに多量に存在するLINEは主にLINE1(L1要素)です。完全長の活動的なL1要素は約4000個存在し、短縮された不活性なものを含めると10万個以上に及びます。しかし、多くのLINE配列は累積した変異により転写・翻訳能力を失い不活性化しています。過去に活動的だったL2やL3要素は、現在では痕跡的に残るのみで、これらはCR1クレードのJockeyに分類されます。
その他の生物: 植物ゲノムでは、これまでにL1とRTEに分類されるLINEが報告されています。
菌類ではTad、L1、CREなどの要素が同定されており、Tad類似要素は特に真菌に固有です。一般に、脊椎動物ではLINEの頻度が高く、特に
哺乳類でゲノムの約20%を占めますが、
植物や
菌類、昆虫ではLTR
レトロトランスポゾンと比較してLINEの頻度は低い傾向があります。
DNA配列の比較を通じて、LINEのゲノムへの挿入時期を推定することが可能です。
活性の調節と疾患関連
宿主細胞は、エピジェネティックなサイレンシング(例:DNAメチル化)やRNA干渉などの機構を用いて、LINEのレトロトランスポジョン活動を抑制しています。例えば、L1配列由来の低分子RNAによるRNA干渉や、ヒトAPOBEC3C(A3C)
タンパク質による
逆転写酵素活性の阻害などが知られています。
植物ゲノムでは、LINEに対するエピジェネティック修飾が近傍遺伝子の発現や表現型に影響を与える例も報告されています。アブラヤシの収量減少を引き起こす変異は、特定のLINEタイプに対するメチル化に起因することが分かっています。
しかし、この制御機構が破綻したり、活動的なLINEがゲノムに挿入されたりすることで、様々な健康問題が生じることがあります。LINEの挿入が遺伝子の機能を破壊することで引き起こされる疾患として、歴史的な例である血友病Aを含む、約100近くの疾患がレトロエレメント挿入に関連しているとされています。また、特定のがん細胞におけるLINEの低メチル化は、染色体不安定性や遺伝子発現の変化を介して、癌の発生や進行に関与する可能性が示唆されています。例えば、
膀胱癌における癌遺伝子MET内の特定のL1の低メチル化が報告されています。統合失調症患者の脳におけるL1コピー数の増加も報告されており、神経疾患におけるLINEの役割も研究が進んでいます。
発見史
LINE由来配列は、1980年にJ. Adamsらによって約6.4kb長の配列として初めて記載されました。
LINEに関する研究は、ゲノム進化、遺伝的多様性、そして多様な疾患のメカニズムを理解する上で、ますます重要になっています。