FLOPS(Floating-point Operations Per Second)とは
FLOPSは、
コンピュータの
性能を示す重要な
指標で、浮動小数点演算の1秒間に実行できる回数を表します。これは、
コンピュータがどれだけ効率的に数値計算を行えるかを評価するための基準となります。FLOPSの命名は、「Floating-point Operations Per Second」の略で、浮動小数点数に特化した演算
性能を強調しています。
理論値と実測値
FLOPSの値は、通常理論値で表示されますが、実際のプログラムの
性能を測るためには
ベンチマークソフトによる実測値も重要です。理論値は最適な条件で計算されたものであるため、実際にはこれを下回るのが一般的です。特に、並列方式のスーパー
コンピュータ(スパコン)では、複数の計算ノードを使用するため、実際の計算能力を理論値に近づけるための高度な運用が求められます。このため、スパコンではLINPACK
ベンチマークによる実測値が用いられることが多いです。
時代の変遷と性能向上
2016年頃、一般的な家庭用PCの
CPUはGFLOPS(
ギガフロップス)、世界最高のスパコンはPFLOPS(
ペタフロップス)の単位を持っています。
ムーアの法則に従って、
コンピュータの
性能は急速に向上しています。特に
2018年に一定の条件下でスパコン
性能がEFLOPS(
エクサフロップス)に達すると予測されています。この間、家庭用PCとスパコンの
性能差は約1万倍の比率で進行してきました。
2024年の時点では、最も優れたスパコンであるFrontierが1.102EFLOPSの
性能を誇り、
分散コンピューティングプロジェクトの
Folding@homeが一時的に2.4EFLOPSを超えたことも注目されます。
主要ハードウェアの浮動小数点数演算能力
PC(Intel)
具体的な数値を見てみると、IntelのCore 2 Duoは1クロックあたり4フロップスの計算が可能で、Sandy BridgeではAVXを利用して8フロップスに向上しています。FMA(融合積和命令)により、16FLOPSまで
性能が引き上げられています。一方で、Atomや他のプロセッサも
性能に差がありますが、最大で3FLOPSとなっています。
CPUとGPUの比較
サーバ向けの処理能力もIntelが進化を遂げています。AMDのBulldozerコアも同様に高い
性能を示しています。
ARMアーキテクチャのプロセッサは、特にCortex-A15から倍精度の演算を扱えるようになり、
性能が大きく変化してきたことが分かります。
ゲーム機やグラフィックスカードの性能
ゲーム機も演算能力において特有の
指標があります。
ドリームキャストから最新の
PlayStation 5|PlayStation_5まで、能力は大きく向上しています。また、NVIDIAやAMDのグラフィックスカードも、さまざまな単精度の演算能力で実績を上げています。たとえば、GeForce GTX 280は622GFLOPSの
性能を持つ一方、AMDは倍精度の演算においてはより低い値を示すことがあります。
結論
FLOPSは
コンピュータの計算能力を理解する
指標として非常に重要です。理論的な限界と実際の
性能のギャップを理解することで、ハードウェア選定や
性能評価に役立てることができます。今後も
コンピュータ性能の進化は続き、FLOPSの値はさらなる向上を見込むことができるでしょう。