Frontier(フロンティア)
フロンティア(Frontier)、またはOLCF-5と呼ばれるこのシステムは、アメリカ合衆国テネシー州にある
オークリッジ国立研究所(Oak Ridge National Laboratory)のオークリッジ・リーダーシップ・コンピューティング・ファシリティ(OLCF)に設置された、極めて強力な
スーパーコンピュータです。
ヒューレット・パッカード・エンタープライズ(HPE)とクレイト(Cray)によって開発され、2022年に稼働を開始しました。
このフロンティアが特筆される最大の点は、
世界で初めてエクサスケール(Exascale)の計算性能を達成したスーパーコンピュータであることです。エクサスケールとは、1秒間に100京回(10の18乗)以上の計算を行う能力を指します。目標とする計算性能は1.5エクサ
FLOPS以上と設定されており、2022年5月には世界の
スーパーコンピュータ性能ランキングである
TOP500において、実効性能として1.102エクサ
FLOPSを記録し、それまで1位だった日本の
スーパーコンピュータ「富岳」を抜いて世界最速の座を獲得しました。
フロンティアは、その膨大な計算能力を実現するために、先進的なハードウェア構成を採用しています。システムの中核をなすのは、HPE Cray EX235aというアクセラレータブレードです。このブレードには、高性能コンピューティング(HPC)および人工知能(AI)用途に最適化されたAMD製の
EPYC™ CPUと、同じくAMD製のRadeon™ Instinct™ GPUが組み合わされています。特に、1つのCPUに対して4台のGPUが密接に結合されている点が特徴です。CPUとGPU間の通信には、AMD独自の高速インターコネクト技術である「AMD Infinity Fabric™」が用いられており、CPU側からGPUメモリへコヒーレント(データの一貫性が保たれた状態)にアクセスすることが可能となっています。これにより、効率的なデータ共有と計算処理が実現されます。
システム全体のノード間を接続するネットワークには、「Slingshot™」と呼ばれる高速かつインテリジェントなインターコネクトが採用されています。複数のSlingshot™ NIC(ネットワークインターフェースカード)を通じて、ノード間は100 GB/sもの広帯域幅で接続されます。Slingshot™のネットワークは、ドラゴンフライネットワーク(Dragonfly network)トポロジーを基盤としており、アダプティブルーティング、輻輳管理、サービス品質(QoS)といった高度な機能を備えています。これにより、複雑な計算タスクにおいても効率的で安定した通信が保証されます。
ストレージシステムに関しても、フロンティアは高い性能と容量を備えています。先行するOLCF-4の
スーパーコンピュータ「Summit」と比較して、入出力(I/O)サブシステムのパフォーマンスと容量は2倍から4倍に向上しています。また、Summitと同様に、計算ノードの近くに配置されたノードローカルストレージを持つ構造となっています。
この大規模なシステムは、物理的な規模も巨大です。19インチラックキャビネットを100台以上連結して構成されており、設置スペースを広く占有します。また、最大消費電力は約30メガワット(MW)に達すると予想されています。
開発費用は6億ドルという巨額に及びますが、フロンティアは汎用目的グラフィックス処理ユニット(
GPGPU)を積極的に活用することで、従来のCPUベースのシステムと比較してコストパフォーマンスの向上を目指しています。GPUは並列計算に非常に優れており、特定の種類の計算において高い電力効率と性能を発揮します。
フロンティアは、世界におけるエクサスケール時代を切り拓いた最初のシステムとして、科学研究、特に気候変動モデリング、物質科学、核物理学などの分野におけるブレークスルーに貢献することが期待されています。
関連事項:
Summit (スーパーコンピュータ) -
オークリッジ国立研究所の先行システム (OLCF-4)
Aurora (スーパーコンピュータ) - アルゴンヌ国立研究所で開発中のエクサスケールシステム
*
El Capitan (スーパーコンピュータ) - ローレンス・リバモア国立研究所で開発中のエクサスケールシステム
(本記事の情報は、アメリカ合衆国
オークリッジ国立研究所の公式情報などを参考に作成しています。)