NetBurstマイクロ
アーキテクチャは、
インテルが
2000年に発表した
マイクロプロセッサの
アーキテクチャです。
Pentium 4プロセッサとして製品化され、従来のP6
アーキテクチャから大幅な変更が加えられました。命令解釈を行う
フロントエンドと命令処理を行うバックエンドを分離することで、CPUの機能拡張や高
クロック化を目指しましたが、最終的には高消費電力と高発熱が問題となり、
Coreマイクロアーキテクチャに置き換えられました。
概要
2000年、
インテルはPentium Pro以来の
P6マイクロアーキテクチャを刷新し、NetBurstマイクロ
アーキテクチャを導入しました。NetBurstという名称は、
Pentium 4で実装されたSSE2命令などを通して、ストリーミングビデオなどのインターネット利用シーンでのパフォーマンス向上をアピールする意図があったと見られています。
NetBurstマイクロ
アーキテクチャは、従来のプロセッサとは異なる特徴を多く備えていました。特に、極端に小さいL1キャッシュ、比較的大きなL2キャッシュ、帯域の広いFSBなどが挙げられます。L1キャッシュはデータと命令を分離して格納し、命令はデコードされてμOPs(マイクロオペレーション)に変換された状態で格納されます。この命令を格納するL1キャッシュはトレース・キャッシュと呼ばれます。
デコーダは、NetBurstマイクロ
アーキテクチャの柔軟性と拡張性の中心であり、マイクロコードによって機能の変更や拡張が可能です。これにより、比較的短い開発期間でHTT(
ハイパースレッディング・テクノロジー)、SSE3、Intel 64、Intel VTなどが追加されました。デコーダは1度に1つのx86命令をμOPsに変換できますが、
P6マイクロアーキテクチャが同時に3命令を変換できたのと比較すると劣ります。しかし、命令実行時にトレース・キャッシュに目的の命令があれば、デコード処理を省略できるため、実行時間の短縮が可能です。
Pentium 4は、命令実行パイプライン段数が
Pentium IIIやAMDの
Athlonに比べて大幅に増加しました。
Pentium IIIが10段であったのに対し、
Pentium 4では20段(Prescottでは31段)に達し、命令解釈ステージを含めるとさらに段数が増えます。パイプライン段数の増加は動作
クロックの向上に貢献しますが、分岐予測の失敗時にはパイプラインがストールし、CPUの動作密度が低下するというデメリットも伴います。そのため、NetBurstマイクロ
アーキテクチャは、
クロックあたりの処理性能が従来の
アーキテクチャと比較して劣る傾向にありました。
しかし、当時、条件分岐を多用するプログラムの性能向上よりも、SSE2などの新しい命令を活用するアプリケーションが主流になると予測され、NetBurstマイクロ
アーキテクチャは開発されました。また、ALUのうち2つは
クロック周波数の2倍で動作するなど、演算能力の強化も図られました。
ハイパースレッディング・テクノロジー(HTT)もこの
アーキテクチャの柔軟性を活用して実装され、CPU全体の演算能力向上に貢献しました。
NetBurst
アーキテクチャを採用した
Pentium 4は、動作
クロック周波数の増加により、高性能な印象を与えましたが、実際には「高
クロック=高性能」とは言い切れず、発熱や消費電力の増大が問題となりました。また、従来のP6
アーキテクチャ向けにコンパイルされたアプリケーションをNetBurst
アーキテクチャで実行した場合、同一
クロックのP6プロセッサよりも実効性能が劣ることもありました。しかし、NetBurst
アーキテクチャ向けにコンパイルされたアプリケーションでは、P6
アーキテクチャよりも高速に処理ができました(特にSSE命令を多用する場合)。
発熱と消費電力の深刻な問題
NetBurstマイクロ
アーキテクチャは、パイプライン段数を増やして動作
クロックを向上させることで性能を高めるという設計思想でした。これは、半導体プロセスの微細化が進めば動作周波数が向上し、消費電力が下がると言うスケーリング則が成り立つことを前提としていました。
しかし、微細化が進むにつれて、
リーク電流という問題が顕著になりました。
リーク電流はあらゆる半導体で発生し、回路の動作に悪影響を与えます。特に、
ナノメートル単位で設計される
マイクロプロセッサでは、
リーク電流が動作による消費電力と大差ないレベルまで増加してしまいました。130nmプロセスでは電圧低減の効果が勝っていましたが、90nmプロセスでは
リーク電流が急増し、動作
クロックを高める
Pentium 4では、発熱や消費電力が問題となりました。同様の問題はAMDの
Athlon 64でも発生しましたが、
Athlon 64はSOI技術を採用することで、影響を抑えることができました。
Pentium 4でも漏れ電流抑制技術が採用されましたが、
インテルは高コストなSOIを避け、歪みシリコン技術に留まりました。
開発の終焉
最終的に、10GHzに到達する予定だった動作
クロックの向上による性能向上は断念せざるを得ず、4GHzの製品は予告だけで終わりました。モバイル用途では、
Pentium 4よりも
Pentium Mの方が高位の製品として販売されるようになりました。
Pentium 4の動作
クロックは2004年
11月に発表された3.8GHzが最高となり、次世代製品「Tejas」の開発も中止されました。その後、CPUの性能向上は
クロック数の向上から、処理効率の改善や
マルチコア化へと移行しました。
インテルは
CoreマイクロアーキテクチャであるCoreシリーズの開発にシフトし、NetBurstマイクロ
アーキテクチャの開発は2007年に事実上終了しました。この動きに対し、AMDもデュアルコア版
Athlon 64 (
Athlon 64 X2) を前倒しで市場に投入しました。
特徴
- - 極端に小さいL1キャッシュ
- - 比較的大きなL2キャッシュ
- - 帯域の広いFSB
- - 分岐予測の失敗時のペナルティが大きい
バリエーション
Willamette 世代
デスクトップ向け
- 対応ソケット: Socket 478
- 対応ソケット: Socket 423
サーバー向け
- 対応ソケット: Socket 603
Northwood 世代
デスクトップ向け
- 対応ソケット: LGA775
- 対応ソケット: Socket 478
- 対応ソケット: Socket 478
サーバー向け
- 対応ソケット: Socket 603
- 対応ソケット: Socket 604
- 対応ソケット: Socket 604
- 対応ソケット: Socket 603
モバイル向け
Prescott 世代
デスクトップ向け
- 対応ソケット: LGA775
- 対応ソケット: LGA775
- 対応ソケット: Socket 478
サーバー向け
- 対応ソケット: Socket 604
- 対応ソケット: Socket 604
- 対応ソケット: Socket 604
- 対応ソケット: Socket 604
- 対応ソケット: Socket 604
モバイル向け
CedarMill 世代
デスクトップ向け
- 対応ソケット: LGA775
- 対応ソケット: LGA775
サーバー向け
- 対応ソケット: Socket 604
- 対応ソケット: LGA771
脚注
関連項目