Graph500は、グラフ処理、すなわちネットワーク構造のデータ解析性能を測ることに重点を置いた、
高性能計算機(スパコン)の
ベンチマークおよびランキングです。従来のスパコン性能評価には、大規模な線形方程式を解く能力を測るHPLやHPCGなどが広く用いられてきましたが、近年、ビッグデータ処理の需要が増大するにつれて、これらの既存
ベンチマークでは捉えきれない、データ間の複雑な関連性を分析する能力の重要性が高まってきました。
このような背景から、グラフ構造の探査性能を評価するための新たな基準としてGraph500が誕生しました。Graph500の主要な性能指標はTEPS(Traversed Edges Per Second)と呼ばれ、これは1秒間に処理できるグラフのエッジ(辺)の数を示します。さらに、消費電力あたりの性能を評価するGreen Graph500もあり、こちらはTEPSを消費電力(ワット)で割った値(TEPS/W)でランキング付けされます。
Graph500およびGreen Graph500の最新ランキングは、通常、毎年6月頃にドイツで開催されるISC(International Supercomputing Conference)と、11月頃に米国で開催されるSC(Supercomputing Conference)という二つの国際的な会議で発表されます。
Graph500の
ベンチマークは、以下の三つの主要な処理要素(カーネル)から構成されています。
グラフの構築
幅優先探索(BFS)
* 単一始点最短経路(SSSP)
このうち、実際に性能ランキングに用いられるのは
幅優先探索と単一始点最短経路のカーネル性能であり、それぞれ個別に評価されます。単一始点最短経路は、2017年11月のランキングから評価対象に加えられました。性能測定では、ランダムに選ばれた64個の頂点を始点としてこれらのカーネルを実行し、その結果の調和平均が最終的な性能値として採用されます。なお、以前は64試行の中央値が使われていましたが、2019年6月からは調和平均に変更されています。
特に
幅優先探索のランキングは、日本のシステムが上位を占めることが多く、注目を集めてきました。「京」や「富岳」といったシステムは、独自のアルゴリズム最適化などにより高い性能を発揮しています。例えば、「富岳」はノード数を減らしつつも性能を大幅に向上させたり、過去最大のグラフ規模で挑戦したりといった記録があります。また、新しいシステムが上位に登場する動向や、
理化学研究所が開発したアルゴリズムが他のシステム(例: Frontier, Aurora)にも採用される事例も見られます。歴史的には、2014年6月には日本チームがアルゴリズム改良により同一ハードウェアで大幅な高速化を達成したことなどが特筆されます。システムの引退(例: 「京」, セコイア, Mira)によるランキングからの除外も過去にはありました。