Blue Gene

Blue Gene(ブルージーン)



Blue Geneは、IBMが推進した一連のスーパーコンピュータ開発プロジェクトの総称です。1999年にその計画が発表され、これまでにBlue Gene/L、Blue Gene/P、Blue Gene/Qといった世代を経て進化してきました。IBMは、1997年にチェスの世界チャンピオンを破った自社のコンピュータ「Deep Blue」の後継機として、Blue Geneを位置づけています。

このプロジェクトでは、主にPowerPC系列のプロセッサを多数活用したHPC(ハイパフォーマンスコンピューティング)クラスタシステムを構築することを目指しました。その高い計算能力は、TOP500やGreen500、HPCCアワードなど、国際的なスーパーコンピュータの性能評価ランキングで常に上位を占める実績に繋がっています。

プロジェクトの概要と目標



プロジェクトの初期段階で開発されたBlue Gene/Lは、約1億ドルの費用を投じ、ローレンス・リバモア国立研究所との共同開発によって生まれました。ピーク性能で360テラFLOPS(1秒間に360兆回の浮動小数点演算)の達成を目標とし、これは当時の日本の主力スパコンであった「地球シミュレータ」の実効性能の10倍以上にあたる速度でした。その後も性能向上は続き、2010年頃には1ペタFLOPS(1000兆回/秒)級のBlue Gene/P、そして2010年から2012年にかけては10ペタFLOPS級のBlue Gene/Qの開発が進められました。

革新的な設計思想



Blue Geneプロジェクトが従来のスーパーコンピュータと一線を画したのは、その設計思想にありました。当時の主流が、高性能なプロセッサを数十個から数千個搭載する構成だったのに対し、Blue Geneでは、個々の性能はそれほど高くないプロセッサを、最大で数十万個といった規模で連携させて並列処理を行うアプローチを採用しました。これにより、同時に実行できるプログラム数を飛躍的に増やし、全体の計算能力を高めることを目指しました。

さらに、並列アプリケーション特有の要求(メッセージパッシングや同期など)を効率的に処理するため、独自の高速ネットワーク機構が開発・搭載されました。このネットワークは、計算ノード間の通信を低遅延・高帯域で行うための重要な要素です。

システム全体の導入や運用コストにも配慮がなされました。消費電力の低いプロセッサを選定し、周辺回路を一つのチップに統合するなどした結果、設置面積や消費電力、冷却に必要な空調設備の規模を抑えることに成功し、コスト効率の高いシステムを実現しました。

システム構成の基本



Blue Geneは、最小構成単位である「ラック」を複数接続することで、ユーザーが必要とする規模の計算能力を提供できるスケーラブルなシステムです。各ラックには、計算処理の最小単位となる「計算ノード」が多数搭載されており、これらのノードが専用のネットワークによって相互に接続されています。また、ファイルシステムへのアクセスなどを担当する「I/Oノード」もラック内に配置され、計算ノードと連携して動作します。

各世代の展開と歴史



Blue Gene/L


初代のBlue Gene/Lは、その開発目標を大きく上回る性能を達成し、世界のスーパーコンピュータ史に名を刻みました。2004年11月のTop500リストでは、実効性能70.72テラFLOPSを記録し、それまで世界最速だった地球シミュレータを抜き去りました。当時はまだ開発途上にありましたが、その後の改良でCPUコア数を増やし、2005年には136.80テラFLOPS、2005年後半には280テラFLOPSを達成。最終的には2007年11月に21万個を超えるコアで478テラFLOPSを記録し、当初の目標である360テラFLOPSを大きく超える性能を示しました。

Blue Gene/Lの計算ノードは、シンプルさを追求した設計が特徴です。部品数を抑え、はんだ付け不良などのハードウェア故障リスクを低減しつつ、高密度な実装を可能にしました。各ノードはPowerPC 440ベースのプロセッサを2つ搭載し、これらが複数の専用ネットワーク(三次元トーラス、集団通信、グローバルバリアなど)で相互に接続されます。特にネットワーク機能は秀逸で、ノード間の高速な一対一通信、効率的な集約処理、そしてハードウェア支援による超高速な同期機構を備えており、大規模並列処理において優れた性能を発揮しました。省電力プロセッサの採用と高密度実装により、電力効率も非常に高く、地球シミュレータと比較して37倍もの電力性能を誇りました。

日本国内でも、産業技術総合研究所、ニイウス株式会社、高エネルギー加速器研究機構(KEK)などに導入され、科学技術計算などに活用されました。2009年には、Blue Geneプロジェクト全体が米国家技術賞を受賞しています。

Blue Gene/P


Blue Gene/Pは、Blue Gene/Lの成功を受け継ぎ、ペタFLOPS級の性能を目指して開発されました。2007年に発表され、目標として1ペタFLOPSでの継続稼働、最大3ペタFLOPSへの拡張性を持ちました。前世代同様、多数のプロセッサを特別なネットワークで繋ぐことで、高いエネルギー効率を実現しています。各チップには4つのプロセッサコアが搭載され、1ペタFLOPS構成では約30万個のプロセッサが、最大構成では90万個近いプロセッサが用いられました。最初のシステムは、ドイツのユーリッヒ研究センターに設置されたJUGENEです。

Blue Gene/Q


シリーズの最新世代であるBlue Gene/Qは、さらなる性能向上と電力効率の追求を推し進めました。当初20ペタFLOPSの達成が目標とされ、後に実現されました。電力効率はBlue Gene/LやPから大幅に向上し、優れたワットあたりの性能を達成しています。プロセッサにはPowerPC A2ベースのPower BQCが採用され、16コアと統合されたメモリ・I/Oコントローラを搭載しています。アメリカのセコイアやMira、ヨーロッパのFermi、JuQUEENなど、世界中の主要な計算センターに導入されました。

システムソフトウェアとプログラミング



Blue Geneシリーズは、そのユニークなハードウェア構成に合わせて、独自のシステムソフトウェア環境を備えています。計算ノード上では、機能を限定することでオーバーヘッドを最小限に抑えた独自のOSカーネルであるCompute Node Kernel (CNK)が動作します。CNKはPOSIXライクなインターフェースを提供しますが、マルチプロセスやページングはサポートせず、ファイルI/Oなどの処理はLinuxベースのOSが動作するI/Oノードに依頼します。システム全体の管理や監視は、サービスノード上のCore Management and Control System (CMCS)が行います。

プログラム開発においては、計算ノードが独立したプロセスとして動作し、ネットワークを通じてデータを交換するメッセージパッシングモデルが基本となります。広く普及している並列プログラミングインターフェースであるMessage Passing Interface (MPI)をサポートしているため、既存の多くのスパコン向けアプリケーションは比較的容易に移植が可能です。ただし、Blue Geneの特徴を最大限に活かすには、通信の頻度や範囲を局所的に抑えるようなアルゴリズムや、計算時間に対する通信時間の比率が低いアプリケーションが特に有利とくに有利となります。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。