TANPAKU
TANPAKU(たんぱく)は、
東京理科大学の研究室が中心となり、
インターネットに接続された多数のコンピュータの処理能力を結集する
分散コンピューティングの手法を用いて、
タンパク質の立体構造を予測し、その機能を探ることを目的とした研究
プロジェクトでした。
生物の体内で多様な働きを担う
タンパク質は、約20種類のアミノ酸が鎖状に連なり、それぞれが固有の立体構造を形成することでその機能を発揮します。このアミノ酸の並び方や数によって、
タンパク質の種類や最終的な立体構造が決定されます。
タンパク質の働きを深く理解するためには、この複雑な立体構造を詳細に解明することが極めて重要となります。
TANPAKU
プロジェクトは、この
タンパク質の立体構造予測や解析を行うために、ブラウン動力学法という計算手法を採用しました。計算の実行には、世界中の
インターネットユーザーが自身のコンピュータの余剰処理能力を提供できる
分散コンピューティング基盤であるBOINC(
Berkeley Open Infrastructure for Network Computing)が利用されました。当時、BOINC上で活動する
プロジェクトの中で、日本の大学機関が中心となっているのはTANPAKUが唯一でした。
計算能力
分散コンピューティングの最大の利点は、低コストで高性能な計算能力を獲得できる点にあります。TANPAKUもこの仕組みを活用することで、高度な解析に必要な処理能力を得ていました。
2008年7月31日時点での平均計算能力は約7.7テラフロップス(T
FLOPS)に達しており、これは当時の日本の代表的な
スーパーコンピュータであった「
地球シミュレータ」(旧システム、40.96 T
FLOPS)の約5分の1に相当する性能を常時維持できていたことになります。一方で、同様の生化学分野を扱う大規模な
分散コンピューティングプロジェクトと比較すると、その計算能力は数倍からそれ以上の差がありました。
BOINC全体の処理能力は、当時約1.2ペタフロップス(P
FLOPS、1200 T
FLOPS)に達しており、TANPAKU
プロジェクトはそのうち約0.6%の計算リソースを利用していました。
参加者
プロジェクトへの参加台数は、登録ベースで約4万台、実際に計算を行っていた実働ベースで約1万台程度でした。
東京理科大学が当初目標としていた国内外からの100万台という参加者数には大きく及びませんでした。
興味深い点として、TANPAKUは日本の大学が運営する唯一のBOINC
プロジェクトであったため、参加者の出身国別割合では日本からの参加者が最も多く、アメリカからの参加者が多数を占める他の多くの国際
プロジェクトとは異なる特徴を持っていました。
活動の休止
TANPAKU
プロジェクトは、
2008年8月18日に発生したハードディスクの故障による
サーバー障害が原因で、計算タスクの配信が停止し、事実上の活動休止状態となりました。当初は復旧に向けて準備が進められていたものの、
プロジェクトの中心を担っていた研究者たちが大学を離れるなど、運営体制に変化が生じたこともあり、
サーバーの復旧や
プロジェクトの再開が困難となりました。このため、
2009年2月には公式サイトを通じて、正式に
プロジェクトの休止が発表され、TANPAKUはその歴史に幕を閉じました。