Aurora (スーパーコンピュータ)

Aurora (スーパーコンピュータ)



Aurora(オーロラ)は、アメリカ合衆国のアルゴンヌ国立研究所に設置されている高性能スーパーコンピュータです。2023年6月22日にその構築が完了しました。アメリカ国内では二番目となる「エクサスケール」、すなわち毎秒100京回以上の計算が可能な演算能力を持つシステムとして位置づけられています。

このプロジェクトは、アメリカ合衆国エネルギー省(DOE)が主導し、Intel社が主要プロセッサを、Hewlett Packard Enterprise社(HPE)がシステム全体の設計・構築を担当しました。開発には総額5億ドル(2021年3月時点の換算で約544億円)の費用が見込まれています。当初、Auroraは毎秒200京回(2exaFLOPS)の計算能力を発揮することを目指して設計されました。2024年5月時点の性能評価では、毎秒101京2000兆回(1.012exaFLOPS)の演算能力を達成し、世界のスーパーコンピュータ性能ランキングであるTOP500リストにおいて第2位にランクインしています。

開発の経緯



Auroraの開発計画は2015年に初めて公にされました。当初の目標は2018年の完成で、毎秒18京回(180petaFLOPS)程度の演算速度を想定しており、当時の最速レベルのスーパーコンピュータであるSummitと肩を並べる性能を目指していました。この初期段階では、Cray社がIntel製プロセッサを使用してシステムを構築する予定でした。

しかし、2017年には計画が変更され、Intel社は完成時期を2021年に延期すると同時に、目標性能を毎秒100京回(1exaFLOPS)へと大幅に引き上げることを発表しました。その後、2020年10月には、エネルギー省からさらに6ヶ月の完成延期が発表され、これによりAuroraはアメリカで最初のエクサスケールコンピュータではなくなることが確定しました。

開発の遅延を経つつも、Auroraはその性能を着実に向上させてきました。スーパーコンピュータの計算速度を競うTOP500ランキングでは、2023年下期と2024年上期に連続して世界第2位を獲得しています。特に、2023年下期に記録した毎秒58京5340兆回という性能に対し、2024年上期には毎秒101京2000兆回へと大幅に向上させ、オークリッジ国立研究所のFrontierに次ぐ、世界で二番目のエクサスケール性能を実現したマシンとなりました。

システム構成とアーキテクチャ



Auroraは、合計10,624台の計算ノードから構成されています。各ノードは、第4世代Intel Xeon Scalable Processors(開発コード名「Sapphire Rapids」)を2基と、高性能グラフィックスプロセッサ(GPU)であるIntel Xe GPU(開発コード名「Ponte Vecchio」)を6基搭載しています。これらのプロセッサは、統合されたメモリアーキテクチャによって接続されており、1つのノードあたり最大130テラフロップス(毎秒130兆回)の演算能力を発揮します。

システム全体としては、約20.4ペタバイト(PB)の統合メモリと、230PBのストレージ容量を備えています。システムの設置には166基のラックが使用され、各ラックには64枚のブレードが収容されています。これらのラックは8列に並べられ、設置面積はプロバスケットボールコート2面分に相当する広さです。消費電力は最大60メガワット以下に抑えられています。

主要コンポーネントであるGPUの「Ponte Vecchio」は、2.5Dパッケージングや3Dスタッキング、FinFET構造といった先進的な製造技術を採用しています。CPUの「Sapphire Rapids」は、新たなマイクロアーキテクチャに基づき、10nmプロセスで製造されています。特に、AI処理の効率を高めるため、int8やBfloat16といったディープラーニングに最適化されたデータタイプをサポートしています。また、キャッシュ容量の増加、DDR5 DRAM、PCIe 5.0といった最新のインターフェイス技術が採用され、データ転送速度が向上しています。

プロセッサ内部やプロセッサ間のスケーラビリティを確保するため、モジュラー化されたSystem on Chip (SoC) 設計、高速なダイ接続ファブリック、UPIの帯域幅と転送速度の改良、そしてEmbedded Silicon Bridge (EMIB) 技術が活用されています。「Sapphire Rapids」は、マイクロサービス型のソフトウェア開発トレンドに合わせて、マイクロサービスの実行オーバーヘッドを低減する設計がなされています。また、実行時間のばらつきを抑える低ジッタアーキテクチャや、キャッシュの排他制御、メモリレイテンシの安定化、プロセッサ間割り込みの仮想化といった工夫により、大規模システムとしての性能安定性が高められています。

科学研究と応用分野



Auroraは、多岐にわたる科学技術分野での高度なシミュレーションやデータ解析に活用される計画です。具体的には、低炭素エネルギー技術、新しい化合物や材料の探索・設計、がん研究、宇宙論素粒子物理学、脳神経科学、航空機設計、核融合エネルギー研究、気候変動科学(高精度な天気予報を含む)、分子生物学といった分野でのシミュレーション研究が中心となります。さらに、次世代の電池や太陽電池などの効率的なエネルギーデバイスに貢献する新素材の開発も期待されています。

その膨大な計算能力と先進的なアーキテクチャを活かし、Auroraは大規模なデータ分析、機械学習アルゴリズムの実行、そして科学研究に特化した大規模言語モデルのトレーニングや実行にも対応します。これらの機能を通じて、これまでの計算能力では困難だった複雑な問題の解決や、新たな科学的発見を加速させることが目指されており、その利用は広範な科学コミュニティに開かれる予定です。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。