天然変性
タンパク質(IDP)は、従来の
タンパク質観とは一線を画す存在です。多くの
タンパク質は特定の立体構造を持つと考えられてきましたが、IDPは溶液中で決まった、あるいは整った三次元構造を安定して保ちません。これは、完全に構造を持たない状態から、部分的に特定の形をとる状態まで多様なアンサンブル(構造の集まり)として存在することを意味します。この範疇には、無秩序なコイル状や、球状だが柔軟性が高いモルテングロビュール、複数の機能ドメインを柔軟なリンカーで繋いだものなどが含まれます。IDPは、球状
タンパク質、線維状
タンパク質、膜
タンパク質と並ぶ、
タンパク質の主要なカテゴリーの一つです。
IDPの発見は、
タンパク質の機能は固定された立体構造に依存するという、長らく信じられてきた
構造生物学の伝統的なパラダイムに対し、大きな問いを投げかけました。2000年代以降、
構造生物学の様々な分野からの研究が進み、
タンパク質の動的な性質が機能に深く関わっていることが示唆されるようになりました。IDPは安定した構造を取らないにも関わらず、生命活動において非常に多くの、そして機能的に重要な役割を担う
タンパク質の集団を形成しています。興味深いことに、IDPの中には、他の分子と結合する際に初めて特定の安定した構造を取るものもあります。総じて、IDPは構造を持つ
タンパク質とは異なり、機能、構造、アミノ酸配列、相互作用、進化、調節機構など、多くの面で独特な傾向を示します。
歴史的背景
1930年代から1950年代にかけて、
X線結晶構造解析により最初の
タンパク質構造が解明されました。これらの初期の構造データは、
タンパク質の生物機能に固定構造が必須であるという見方を強め、アミノ酸配列が構造と機能を決定するという
分子生物学の
セントラルドグマを補強しました。しかし、1950年代には既に、Karushが「立体配置の適応性」という概念を提唱し、
タンパク質が複数の同等なエネルギー状態の構造を取り、結合相手によってその一つが選ばれる可能性を示唆しました。1960年代の
レヴィンタールのパラドックスは、長いポリペプチド鎖が生物学的な時間スケール内でランダムな探索のみで特定の構造に到達するのは難しいことを指摘しました。一方、比較的小さな
タンパク質やドメインはin vitroで比較的迅速かつ効率的に元の構造に戻ることが観察され、1973年の
アンフィンセンのドグマによって、これらの「秩序だった」
タンパク質の
天然状態は、そのアミノ酸配列によって一意に決まり、生理的条件下で安定であるとされました。
しかし、その後数十年で、X線解析データで大きな
タンパク質の多くの領域が解析できないことが明らかになりました。これは、これらの領域が結晶中で多様な位置を取り、電子密度マップで平均化されて見えなくなるためと考えられ、「ディスオーダー」していることを示唆しました。核磁気共鳴(NMR)分光法による解析でも、柔軟なリンカー領域や末端部分が確認されました。現在では、
タンパク質は完全に固定された構造ではなく、ある領域はより固定されているものの、全体として多様な構造のアンサンブルとして存在するという考え方が広く受け入れられています。IDPは、局所的な構造傾向を持つ
タンパク質や柔軟な多ドメイン
タンパク質を含む、この柔軟性のスペクトルの極端な例です。
タンパク質内の高度に動的なディスオーダー領域は、アロステリック調節や
酵素反応など、重要な機能現象と関連付けられています。
2000年代になると、
バイオインフォマティクスによる予測が、構造データベースよりも、
遺伝子配列情報に基づいた
プロテオーム中でIDPが多く存在することを示しました。例えば、ある予測では、30残基以上の長いディスオーダー領域が真核生物
タンパク質の約33%に存在すると推定されました。さらに2010年代には、α-シヌクレインやタウといった疾患関連
タンパク質にIDPが多く見られることが明らかになり、疾患との関連性が注目されるようになりました。
生物学的役割
IDPは、その構造的な柔軟性ゆえに、多様な生物機能に関与しています。多くのIDPでは、他の分子への結合親和性が
翻訳後修飾によって細やかに調節されています。IDPの柔軟性は、異なる構造を要求する修飾
酵素や結合相手へのアクセスを容易にすると考えられています。特に細胞シグナリング、
遺伝子の転写、クロマチン構造の再編成などに関わる
タンパク質にIDPが多く見られます。また、進化的に新しく生まれた
遺伝子に由来する
タンパク質も、ディスオーダーな性質を持つ傾向があります。
特定の機能構造と相互作用
柔軟なリンカー
ディスオーダー領域は、
タンパク質内の異なる機能ドメイン間を繋ぐ柔軟なリンカーやループとしてしばしば見られます。これらのリンカーは長さが大きく異なり、一般的に極性を持つか電荷を持たないアミノ酸が多いという特徴があります。柔軟なリンカーがあることで、連結されたドメインは比較的自由に動き回り、様々な結合パートナーに効率的にアクセスできます。また、リンカーを介して、結合相手が遠く離れたドメインの大きな構造変化を引き起こすアロステリック効果を媒介することもあります。
リニアモチーフ(Linear motif)
リニアモチーフは、IDP内の短くディスオーダーした領域で、他の
タンパク質やRNA、DNA、
糖などの生体分子との特異的な相互作用を仲介します。これらのモチーフは、細胞の形、
タンパク質の細胞内での位置、調節
タンパク質の分解速度など、細胞機能の調節に深く関与しています。多くの場合、
リン酸化などの
翻訳後修飾がリニアモチーフと結合相手との親和性を劇的に変化させることがあります。リニアモチーフは進化が速く、比較的構造的な制約が少ないため検出が難しい一方で、生物学的に広範な役割を持ち、多くの
ウイルスが宿主細胞を操作するためにリニアモチーフを模倣・利用している事実が、その研究の重要性を示しています。秩序立った
タンパク質とは異なり、IDPは明確な
活性部位を持ちませんが、IDPのリニアモチーフには、標的分子認識のための短い一過性の
二次構造エレメント(PreSMosと呼ばれる)が存在することが知られています。これらの構造は、結合に伴って安定した
二次構造へと変化することもあり、PreSMosがIDPの機能的な中心であると考えられています。
多くのIDPは、標的分子に結合する際に、より安定した構造状態へと変化します(このような領域はMolecular Recognition Features, MoRFs とも呼ばれます)。この共役した
フォールディングと結合は、ごく少数のアミノ酸が関わる局所的なものである場合もあれば、
タンパク質全体のドメインが関わる大規模なものである場合もあります。この現象により、秩序だった
タンパク質では非常に大きな
タンパク質でしか実現できないような、広い表面積での相互作用が可能になります。また、特定のディスオーダー領域は、小分子や核酸、イオンなどとの結合を契機に秩序だった構造へと切り替わる「分子スイッチ」としても機能する可能性があります。IDPが結合し機能を発揮できる能力は、
タンパク質の機能に必ずしも安定な構造が必須ではないことを示しています。特にヘンドラ
ウイルスや
C型肝炎ウイルスなどの多くの
RNAウイルスは、IDPや短いリニアモチーフを多用し、多数の宿主
タンパク質との相互作用を促進・操作することで、限られた
ゲノム情報で多様な機能を実現しています。
結合状態でのディスオーダー(Fuzzy complex)
興味深いことに、IDPは他の
タンパク質に特異的に結合した後も、完全に固定されずにコンフォメーションの多様性を維持することがあります。このような結合状態での構造的な多様性は、静的なものもあれば動的なものもあります。これをファジーコンプレックス(fuzzy complex)と呼び、この構造的多様性が機能に必須である場合が多いです。ファジーコンプレックスの構造アンサンブルは、
翻訳後修飾や他の
タンパク質との相互作用によって調節されます。例えば、DNA結合
タンパク質のDNAへの結合特異性は、しばしばファジー領域の長さに依存し、
選択的スプライシングによって変化することがあります。
構造的側面
IDPは、細胞内の環境に応じて多様な構造を取りうるため、その機能は特定の固定構造ではなく、取りうる構造全体のアンサンブルと強く関連しています。ただし、
天然状態で完全に構造を持たない
タンパク質は少なく、多くの場合、秩序だった
タンパク質の中に天然変性領域(IDR)として存在します。IDPという用語は、これらのIDRを含む
タンパク質全体を指すこともあります。
タンパク質におけるディスオーダーの存在とその特徴は、そのアミノ酸配列によって決まります。一般的に、IDPはかさ高い疎水性アミノ酸が少なく、極性を持つか電荷を帯びたアミノ酸が多い傾向があり、総じて疎水性が低いと表現されます。これらの性質は水との相互作用を促進し、同じ電荷を持つ残基間の反発は構造化を妨げます。このような配列は、安定な球状
タンパク質に必要な疎水性コアを形成できません。ディスオーダー配列中の疎水性クラスターは、共役した
フォールディングと結合が起こる領域の手がかりとなることもあります。多くのIDPには、規則的な
二次構造を全く持たない「柔軟なループ」と呼ばれる領域が存在します。構造的なループが固定された形と特定の角度を取るのに対し、IDPの柔軟な領域は多様な角度を取りうります。低複雑度領域(特定の種類のアミノ酸が偏って存在する配列)もディスオーダーの強い指標ですが、すべてのIDPに低複雑度領域があるわけではありません。
研究手法
IDPのディスオーダー領域を細胞内で大規模に検証する方法として、ビオチン「ペインティング」などがあります。精製されたIDPは、様々な実験手法で性質を調べることができます。ディスオーダー領域に関する主要な情報はNMR分光法から得られますが、
X線結晶構造解析で電子密度が見えない領域もディスオーダーを示唆します。
フォールディングした
タンパク質は密度が高く(部分比容が小さい)、回転半径も小さいですが、
フォールディングしていないIDPはこれと逆の性質を持ちます。そのため、サイズ排除クロマトグラフィー、分析超遠心、X線小角散乱(SAXS)など、分子量、密度、流体力学的抵抗に感受性のある手法が有効です。また、IDPは規則的な
二次構造を持たないため、円偏光二色性(特に200nm付近の極小)や
赤外分光法でも特徴的なスペクトルを示します。主鎖のペプチド結合が溶媒に露出しているため、
プロテアーゼによって容易に分解される性質も利用されます。速い水素-重水素交換や、NMRで観測されるアミドプロトンの化学シフト分散が小さいこともディスオーダーの特徴です。近年では、FASTppのような、精製せずに細胞内での
フォールディング状態を調べられる新しい手法も開発されています。
IDPの構造やダイナミクスを研究するための手法は多岐にわたります。バルク(集団)での研究には、SAXS(形状アンサンブル)、NMR(原子レベルのアンサンブル)、
蛍光(相互作用、構造変化)、X線解析・クライオ電子顕微鏡(可動性領域)、光散乱(サイズ、凝集)、円偏光二色性・NMR化学シフト(
二次構造)が用いられます。1分子レベルでの研究には、spFRET(コンフォメーション柔軟性、変化速度)、
光ピンセット(高分解能情報)、ナノポア(全体形状分布)、磁気ピンセット(長時間構造変化)、高速
原子間力顕微鏡(時空間的柔軟性)などがあります。
予測とデータベース
IDPのディスオーダー状態は、実験データに基づき
アノテーションされるほか、専用の計算機ソフトウェアによって予測されます。ディスオーダー予測アルゴリズムは、アミノ酸配列組成や既知の実験データに基づいて、高い精度でディスオーダー傾向を予測できます。ディスオーダーに関する情報を提供するデータベースも整備されており、DisProtは実験的に決定されたディスオーダー領域の情報を、MobiDBは実験データと予測データを組み合わせて提供しています。IDPを予測するためには、まずアミノ酸組成の偏りから、ディスオーダーを促進するアミノ酸と抑制するアミノ酸を区別することが基本となります。低複雑度領域も有力な指標です。
実験的なIDPの解析はコストと時間がかかり、またその多様性から多くの手法が必要です。これを補うため、計算機による予測手法が不可欠です。配列情報を用いた手法(IUPRED, Disopredなど)が主流ですが、手法によってディスオーダーの定義や予測アプローチが異なります。複数の予測を組み合わせるメタ予測も行われています。予測精度の評価はCASPのような実験を通して行われています。
疾患との関連
IDPは多数の疾患に関与していることが示唆されています。誤って
フォールディングされたIDPが凝集しやすいため、これが原因で
タンパク質がランダムに結合し、多くの神経変性疾患(シヌクレイノパチーなど)や、がん、
心血管疾患といった様々な病気を引き起こす可能性があります。細胞内で大量に合成される
タンパク質の中には、必然的に誤った
フォールディングをするものも含まれます。IDPであるα-シヌクレインは、その構造的な柔軟性と
翻訳後修飾を受けやすい性質から、特に誤った
フォールディングや凝集を起こしやすいと考えられており、遺伝的ストレスや
酸化ストレスなどもこれに影響を与えます。p53や
BRCA1のような重要ながん抑制
タンパク質の多くも、大きな天然変性領域を持ち、これが多くの分子との相互作用を仲介することで、その機能を発揮しています。細胞本来の防御機構を模倣し、有害な基質の結合部位を阻害するような薬物開発が、IDPを標的とした疾患治療の可能性として研究されています。
コンピュータシミュレーション
IDPは構造的な均一性が低いため、実験的に得られるデータは、多様な構造状態のアンサンブルを平均化したものです。このアンサンブルをより詳細に理解するためには、コンピュータシミュレーションによる精密な表現が不可欠です。全原子分子動力学シミュレーションが用いられますが、IDPを正確に記述する力場(アミノ酸間の相互作用を計算するモデル)の限界があります。しかし、IDPのNMRデータを用いてパラメータを最適化した力場など、IDP研究に特化した開発も進んでいます。実験データによる制約を加えたシミュレーションも行われています。IDPの高い構造的不均一性のため、網羅的なサンプリングには膨大な計算時間が必要ですが、加速化MDや
レプリカ交換法などの高度な手法が、より効率的なコンフォメーション空間の探索に利用されています。また、
ゲノムの
GC含量分析など、他の計算手法もIDP機能の理解に貢献しています。