A64FXは、日本のテクノロジー企業である
富士通が設計・開発した64ビットARM
アーキテクチャベースの高性能
マイクロプロセッサです。このプロセッサは、同社が長年にわたりスーパーコンピュータ向けに開発・提供してきた
SPARC64シリーズ、特に
SPARC64 VIIIfxの後継となる位置づけであり、科学技術計算などの高性能計算(HPC)用途に特化して設計されました。
設計とアーキテクチャ
富士通は、ARM社と協力してA64FXを開発しました。このプロセッサの最大の特徴の一つは、ARMv8.2-A命令セット
アーキテクチャを採用し、特に512ビットという広いベクトル幅を持つScalable Vector Extension (SVE)
SIMD命令セットを世界で初めて実装したプロセッサである点です。SVEは、様々なデータ長に対応できるスケーラブルな設計が特徴であり、HPCアプリケーションにおけるベクトル演算の効率を大幅に向上させます。プロトタイプを用いたシステムは、2019年11月時点のTop500リストにおいて、既に世界の主要なコンピュータシステムとしてランクインしていました。
ハードウェア構成
A64FXプロセッサは、高性能を実現するために最先端のハードウェア技術を結集しています。主記憶としては、高速・広帯域なHBM2(
High Bandwidth Memory 2)メモリを統合しています。具体的には、8GB容量のHBM2スタックを4つ搭載し、合計32GBのメインメモリ容量と、トータルで毎秒1TBという広大なメモリ帯域幅を実現しています。各HBM2スタック単体でも毎秒256GBの帯域幅を持っています。この広帯域メモリは、ビッグデータ解析やシミュレーションなど、大量のデータアクセスが要求されるアプリケーションにおいて極めて重要です。外部アクセラレータ(
GPGPUや
FPGAなど)との接続のために、
PCI Express Gen 3インターフェースを16レーン搭載しています。チップ全体のトランジスタ数は、報告によれば約87億個に及びます。HBM2のメモリコントローラなどの設計にはBroadcom社が協力しており、CPUチップとHBM2メモリの物理的な統合には、TSMC社の高度なパッケージング技術であるCoWoS(Chip-on-Wafer-on-Substrate)が用いられています。
コア構成
単一のA64FXチップは、HPCシステムにおいて一つの計算ノードとして機能します。プロセッサ内部には合計48個の計算コアが搭載されており、これらはメモリ接続の効率を考慮して、それぞれ12個のコアからなる4つのCore Memory Group(CMG)に分割されて構成されています。特にフラッグシップシステムであるスーパーコンピュータ「富岳」に搭載されているA64FXには、これに加えて4個の「アシスタントコア」が組み込まれています。ただし、
富士通はより小規模なシステム向けに、アシスタントコアを搭載しない構成や、2個のみ搭載する構成のバリエーションも製造・提供しています。
主な採用システム
A64FXプロセッサは、日本の国家的なスーパーコンピュータプロジェクトである「富岳」の中核プロセッサとして開発されました。「富岳」は、2020年6月以降、継続して
TOP500リストの主要項目で世界第1位を獲得するなど、世界最高レベルの性能を長期間にわたり維持しました。
富士通は、「富岳」で培われた技術を基に、A64FXプロセッサを搭載した商用計算サーバ製品として、PRIMEHPC FX700やFX1000シリーズを展開しており、研究機関や企業向けにHPC環境を提供しています。報道では、PRIMEHPC FX700の2ノード構成システムが約415万円(約39,000米ドル相当)で提供された例が挙げられています。国内だけでなく、海外でもA64FXは採用されています。米国HPE社の一部門であるCray社は、A64FXを使用したApollo 80システムを開発・販売しています。また、英国では
ブリストル大学を中心に、A64FXを基盤としたIsambard 2スーパーコンピュータが構築されました。これは、以前のモデルであるIsambardが別のARM
アーキテクチャプロセッサ(Marvell ThunderX2)を使用していたことからの性能向上を目指したアップグレードプロジェクトです。
意義
A64FXの成功は、高性能計算分野においてARM
アーキテクチャがx86など従来の主要
アーキテクチャと十分に競合しうる、あるいは凌駕しうる性能を発揮できることを世界に証明しました。これにより、HPC分野におけるプロセッサ選択肢の多様化が進み、今後の技術発展に貢献することが期待されています。