分子ドッキング
分子ドッキングは、計算化学、特に分子モデリングの分野において、二つの分子が互いに結合し安定な複合体を形成する際に取りうる、最適な立体的な位置関係や配向を予測するための重要な手法です。この最適な結合状態に関する知見は、例えばスコアリング関数を用いることで、二つの分子間の結合の強さや親和性を評価することに繋がります。
生物学的に関連性の高い分子、例えば
タンパク質、
ペプチド、
核酸、糖質、
脂質などが相互作用することは、生体内での
シグナル伝達において中心的な役割を担っています。さらに、相互作用する分子ペアがどのような相対的な配向で結合するかは、生成されるシグナルの種類(例:
アゴニストかアンタゴニストか)やその強度に影響を与える可能性があります。このため、分子ドッキングは、こうした生体分子間の相互作用によって引き起こされるシグナルの種類と強さの両方を予測する上で非常に有用なツールとなります。
分子ドッキングは、特に構造に基づいた医薬品設計(SBDD)において最も頻繁に用いられる手法の一つです。これは、薬の候補となる低分子
リガンドが、その標的となる
タンパク質の特定の
結合部位へどのように結合するか、そのコンフォメーション(立体構造)を予測できるためです。分子の結合挙動を特性評価することは、基本的な生化学的プロセスを解明するだけでなく、新しい薬剤を合理的に設計する上でも極めて重要な役割を果たします。
分子ドッキングは、「錠前」(
タンパク質)を開ける「鍵」(
リガンド)が、錠前の表面上のどこにある鍵穴に、どのような向きで挿入され、どのように回されるべきか、といった正しい相対的な向きを見つけ出すという「鍵と錠前説」の問題として捉えることができます。より正確には、これは最適化問題として定義され、特定の
タンパク質に結合する
リガンドの最も適合する配向を記述することを目指します。しかしながら、
タンパク質と
リガンドの両方が柔軟性を持つため、「鍵と錠前」よりも「手袋の中の手」という例えの方が実情に近いです。ドッキングの過程では、
リガンドと
タンパク質が互いの立体配座を調整しながら全体として最も適合する状態(「ベストフィット」)を達成します。このような配座の調整を伴う結合は「
誘導適合」と呼ばれます。分子ドッキング研究は、この分子認識プロセスを計算機上でシミュレーションすることに焦点を当てており、
タンパク質と
リガンド双方の最適な立体構造と相対的な配向を実現し、系全体の
自由エネルギーを最小化することを目指します。
分子ドッキングには、大きく分けて二つの主要なアプローチがあります。一つは、
タンパク質と
リガンドを互いに補い合う表面として記述し、幾何学的なマッチングを行う手法です。もう一つは、実際のドッキングプロセスを時間的にシミュレーションし、
リガンドと
タンパク質間の相互作用エネルギーを計算する手法です。
幾何学的マッチングや形状相補性に基づくアプローチは、
タンパク質と
リガンドをドッキング可能な特徴の集合として捉えます。これには、分子表面やそれを記述する補完的な記述子を用いる方法などがあります。例えば、受容体の分子表面をその溶媒に接触可能な面積で記述し、
リガンド表面をそれと相補的な(一致する)記述で表現します。この二つの表面間の相補性が、ターゲット分子と
リガンド分子をドッキングさせる適切な姿勢を見つける手がかりとなります。その他にも、
タンパク質の
疎水性特徴を主鎖原子のターンで記述したり、フーリエ形状記述子を用いる方法などがあります。形状相補性に基づく手法は一般的に高速で頑健であり、
リガンドの柔軟性を扱う工夫も進化していますが、通常は
リガンドや
タンパク質のダイナミックな動きや配座変化を正確にモデル化することは得意としません。しかし、数千個の
リガンド候補を数秒でスクリーニングし、結合可能性を迅速に把握できる利点があり、
タンパク質-
タンパク質相互作用の研究にも応用可能です。また、
リガンドの幾何学的特徴を利用するため、ファーマコフォアベースの手法とも相性が良いです。
一方、ドッキングプロセスのシミュレーションはより複雑です。このアプローチでは、
タンパク質と
リガンドが初期状態で一定の距離だけ離れており、
リガンドが自身のコンフォメーション空間内で様々な「移動」(並進、
回転、ねじれ角の
回転など)を行いながら
タンパク質の
結合部位を探し求める過程を模倣します。これらの移動一つ一つが系の総エネルギー変化を引き起こすと考えられ、移動の度に系のエネルギーが計算されます。ドッキングシミュレーションの大きな利点は、
リガンドの柔軟性を自然に取り込むことができる点です。形状相補性技術が比較的抽象的なモデル化を行うのに対し、シミュレーションはより現実に近い挙動をモデル化できます。しかし、シミュレーションは計算コストが高く、広大なエネルギー地形を
探索する必要があるという課題があります。近年の計算機能力の向上や、グリッドベース技術、最適化手法の進歩により、ドッキングシミュレーションはより実用的になっています。
分子ドッキング計算を実行するための準備として、まず結合のターゲットとなる
タンパク質の立体構造が必要です。この構造は、
X線結晶構造解析、NMR分光法、クライオ電子顕微鏡法といった実験的手法で決定されることが多いですが、相同性モデリングによって予測される場合もあります。この
タンパク質構造データと、潜在的な
リガンド候補のデータベースが、ドッキングプログラムへの入力となります。ドッキングの成功は、主に「
探索アルゴリズム」と「スコアリング関数」という二つの要素に依存します。
探索アルゴリズムは、
リガンドと
タンパク質が取りうる全ての可能な配向とコンフォメーションからなる広大な
探索空間を効率的に
探索する役割を担います。現実的な計算資源では、この空間を網羅的に
探索することは不可能であるため、さまざまな工夫が凝らされています。多くのドッキングプログラムは、
リガンドの柔軟性(ねじれ角の
回転などによるコンフォメーションの変化)を考慮しており、一部の手法では柔軟な
タンパク質受容体をモデル化しようとしています。
リガンドと受容体のペアにおける各特定の立体的な配置を「ポーズ」と呼びます。
リガンドや受容体の多様な立体配座を
探索するために、
回転可能な結合に関する系統的または確率的な
探索、分子動力学シミュレーション、さらには
遺伝的アルゴリズムなどが利用されています。
リガンドの柔軟性については、受容体の存在下でリアルタイムにコンフォメーションを生成したり、分子を小さなフラグメントに分割して結合後に連結する方法などがあります。エネルギー的に妥当なコンフォメーションを選択するために、力場エネルギー評価や知識ベースの手法が用いられます。
ペプチドのような柔軟性が高く比較的大きな分子のドッキングにおける柔軟性のモデル化は特に難しい課題ですが、効率的な手法が開発されています。
タンパク質受容体の柔軟性の取り扱いも、考慮すべき自由度が多いために計算量が多く、難しい問題です。しかし、これを無視すると結合ポーズの予測精度が低下する可能性があるため、複数の実験構造を用いる方法や、
結合部位周辺のアミノ酸側鎖の
回転異性体を
探索する方法などで柔軟性を模倣する試みがなされています。
スコアリング関数は、
探索アルゴリズムによって生成された多数のポーズを評価し、それぞれのポーズがどの程度安定した結合相互作用を示しているか(結合の可能性)を数値化するための機能です。この数値に基づいて、異なる
リガンド候補の結合親和性を相対的にランク付けすることができます。多くのスコアリング関数は、物理学に基づいた分子力学的な力場を用いて、
結合部位におけるポーズのエネルギーを推定します。結合
自由エネルギーは、溶媒効果、分子のコンフォメーション変化、分子間相互作用、
回転や並進、振動の変化など、様々な寄与の合計として表現されることが一般的です。エネルギーの値が低い(負の)ポーズは、系が安定しており、結合相互作用が存在する可能性が高いと判断されます。別の方法として、
タンパク質-
リガンド複合体のデータベースから統計的に導かれた知識ベースのポテンシャルを用いて、ポーズの適合性を評価する手法もあります。高親和性
リガンドと
タンパク質の複合体に関する実験データ(特にX線
結晶構造)は比較的豊富ですが、低親和性
リガンドのデータは少ない傾向にあります。このデータの偏りにより、スコアリング関数は高親和性
リガンドの正しいポーズを予測しやすい一方で、実際には結合しない分子に対してももっともらしい結合コンフォメーションを与えてしまうことがあり、これが多くの偽陽性(in silicoでは結合すると予測されるが、in vitroでは結合しない)を生む原因となります。偽陽性の数を減らすためには、より計算量の多いものの精度の高いエネルギー計算手法(例:一般化ボルン法、ポアソン-ボルtzmann法)を用いて、上位候補のエネルギーを再計算するなどの方法が取られます。
ドッキング計算の有効性を判断するためには、ドッキングプロトコルの評価が重要です。これは、サンプリング(
探索)とスコアリングの性能が互いに影響し合うためです。ドッキング評価は、いくつかの方法で行われます。ドッキング精度計算は、予測された
リガンドのポーズが実験的に観測された正しいポーズとどれだけ一致するかを定量的に評価します。濃縮係数は、ドッキングスクリーニングによって、多数の結合しない分子(デコイ)の中から、既知の結合分子をどれだけ効率的に選び出せるかを評価する指標です。ROC曲線の下の面積(AUC)などがこの評価に用いられます。また、公開されているベンチマークデータセット(Astex Diverse SetやDUDなど、特定の種類の分子や相互作用に特化したものがある)を用いて、異なるドッキングプログラムの性能を標準的に評価することも広く行われています。これらの評価を通じて、特定のターゲットに対するドッキング手法の予測能力や適合性が判断されます。
分子ドッキングは、医薬品設計において最も広く応用されています。ほとんどの薬物は小さな有機分子であり、ドッキングは以下のような場面で活用されます。
ヒット同定(バーチャルスクリーニング): 大規模な化合物データベースをコンピュータ上で高速にスクリーニングし、目的の
タンパク質ターゲットに結合する可能性のある分子(ヒット候補)を効率的に見つけ出します。
リード最適化: ヒット候補(リード化合物)が
タンパク質に結合する正確な位置や向き(結合モードやポーズと呼ばれる)を予測します。この情報に基づき、より強力で選択性の高いアナログ化合物を合理的に設計することができます。
*
バイオレメディエーション: 特定の汚染物質が、環境中の
酵素によって分解される可能性があるかどうかを予測するためにも
タンパク質-
リガンドドッキングが利用されることがあります。
これらの応用を通じて、分子ドッキングは生命科学研究や産業において不可欠なツールとなっています。