NetBurstマイクロアーキテクチャ

NetBurstマイクロアーキテクチャ



NetBurstマイクロアーキテクチャは、インテル2000年に発表したマイクロプロセッサアーキテクチャです。Pentium 4プロセッサとして製品化され、従来のP6アーキテクチャから大幅な変更が加えられました。命令解釈を行うフロントエンドと命令処理を行うバックエンドを分離することで、CPUの機能拡張や高クロック化を目指しましたが、最終的には高消費電力と高発熱が問題となり、Coreマイクロアーキテクチャに置き換えられました。

概要



2000年インテルはPentium Pro以来のP6マイクロアーキテクチャを刷新し、NetBurstマイクロアーキテクチャを導入しました。NetBurstという名称は、Pentium 4で実装されたSSE2命令などを通して、ストリーミングビデオなどのインターネット利用シーンでのパフォーマンス向上をアピールする意図があったと見られています。

NetBurstマイクロアーキテクチャは、従来のプロセッサとは異なる特徴を多く備えていました。特に、極端に小さいL1キャッシュ、比較的大きなL2キャッシュ、帯域の広いFSBなどが挙げられます。L1キャッシュはデータと命令を分離して格納し、命令はデコードされてμOPs(マイクロオペレーション)に変換された状態で格納されます。この命令を格納するL1キャッシュはトレース・キャッシュと呼ばれます。

デコーダは、NetBurstマイクロアーキテクチャの柔軟性と拡張性の中心であり、マイクロコードによって機能の変更や拡張が可能です。これにより、比較的短い開発期間でHTT(ハイパースレッディング・テクノロジー)、SSE3、Intel 64、Intel VTなどが追加されました。デコーダは1度に1つのx86命令をμOPsに変換できますが、P6マイクロアーキテクチャが同時に3命令を変換できたのと比較すると劣ります。しかし、命令実行時にトレース・キャッシュに目的の命令があれば、デコード処理を省略できるため、実行時間の短縮が可能です。

Pentium 4は、命令実行パイプライン段数がPentium IIIやAMDのAthlonに比べて大幅に増加しました。Pentium IIIが10段であったのに対し、Pentium 4では20段(Prescottでは31段)に達し、命令解釈ステージを含めるとさらに段数が増えます。パイプライン段数の増加は動作クロックの向上に貢献しますが、分岐予測の失敗時にはパイプラインがストールし、CPUの動作密度が低下するというデメリットも伴います。そのため、NetBurstマイクロアーキテクチャは、クロックあたりの処理性能が従来のアーキテクチャと比較して劣る傾向にありました。

しかし、当時、条件分岐を多用するプログラムの性能向上よりも、SSE2などの新しい命令を活用するアプリケーションが主流になると予測され、NetBurstマイクロアーキテクチャは開発されました。また、ALUのうち2つはクロック周波数の2倍で動作するなど、演算能力の強化も図られました。ハイパースレッディング・テクノロジー(HTT)もこのアーキテクチャの柔軟性を活用して実装され、CPU全体の演算能力向上に貢献しました。

NetBurstアーキテクチャを採用したPentium 4は、動作クロック周波数の増加により、高性能な印象を与えましたが、実際には「高クロック=高性能」とは言い切れず、発熱や消費電力の増大が問題となりました。また、従来のP6アーキテクチャ向けにコンパイルされたアプリケーションをNetBurstアーキテクチャで実行した場合、同一クロックのP6プロセッサよりも実効性能が劣ることもありました。しかし、NetBurstアーキテクチャ向けにコンパイルされたアプリケーションでは、P6アーキテクチャよりも高速に処理ができました(特にSSE命令を多用する場合)。

発熱と消費電力の深刻な問題



NetBurstマイクロアーキテクチャは、パイプライン段数を増やして動作クロックを向上させることで性能を高めるという設計思想でした。これは、半導体プロセスの微細化が進めば動作周波数が向上し、消費電力が下がると言うスケーリング則が成り立つことを前提としていました。

しかし、微細化が進むにつれて、リーク電流という問題が顕著になりました。リーク電流はあらゆる半導体で発生し、回路の動作に悪影響を与えます。特に、ナノメートル単位で設計されるマイクロプロセッサでは、リーク電流が動作による消費電力と大差ないレベルまで増加してしまいました。130nmプロセスでは電圧低減の効果が勝っていましたが、90nmプロセスではリーク電流が急増し、動作クロックを高めるPentium 4では、発熱や消費電力が問題となりました。同様の問題はAMDのAthlon 64でも発生しましたが、Athlon 64はSOI技術を採用することで、影響を抑えることができました。Pentium 4でも漏れ電流抑制技術が採用されましたが、インテルは高コストなSOIを避け、歪みシリコン技術に留まりました。

開発の終焉



最終的に、10GHzに到達する予定だった動作クロックの向上による性能向上は断念せざるを得ず、4GHzの製品は予告だけで終わりました。モバイル用途では、Pentium 4よりもPentium Mの方が高位の製品として販売されるようになりました。Pentium 4の動作クロックは2004年11月に発表された3.8GHzが最高となり、次世代製品「Tejas」の開発も中止されました。その後、CPUの性能向上はクロック数の向上から、処理効率の改善やマルチコア化へと移行しました。インテルCoreマイクロアーキテクチャであるCoreシリーズの開発にシフトし、NetBurstマイクロアーキテクチャの開発は2007年に事実上終了しました。この動きに対し、AMDもデュアルコア版Athlon 64 (Athlon 64 X2) を前倒しで市場に投入しました。

特徴



  • - 極端に小さいL1キャッシュ
  • - 比較的大きなL2キャッシュ
  • - 帯域の広いFSB
  • - 分岐予測の失敗時のペナルティが大きい

バリエーション



Willamette 世代



デスクトップ向け


  • - Willamette
- 対応ソケット: Socket 478
- 対応ソケット: Socket 423

サーバー向け


  • - Foster
- 対応ソケット: Socket 603

Northwood 世代



デスクトップ向け


  • - Gallatin
- 対応ソケット: LGA775
- 対応ソケット: Socket 478
  • - Northwood
- 対応ソケット: Socket 478

サーバー向け


  • - Gallatin
- 対応ソケット: Socket 603
- 対応ソケット: Socket 604
  • - Prestonia
- 対応ソケット: Socket 604
- 対応ソケット: Socket 603

モバイル向け


  • - Northwood

Prescott 世代



デスクトップ向け


  • - Smithfield
- 対応ソケット: LGA775
  • - Prescott
- 対応ソケット: LGA775
- 対応ソケット: Socket 478

サーバー向け


  • - Paxville
- 対応ソケット: Socket 604
  • - Potomac
- 対応ソケット: Socket 604
  • - Cranford
- 対応ソケット: Socket 604
  • - Irwindale
- 対応ソケット: Socket 604
  • - Nocona
- 対応ソケット: Socket 604

モバイル向け


  • - Prescott

CedarMill 世代



デスクトップ向け


  • - Presler
- 対応ソケット: LGA775
  • - CedarMill
- 対応ソケット: LGA775

サーバー向け


  • - Tulsa
- 対応ソケット: Socket 604
  • - Dempsey
- 対応ソケット: LGA771

脚注



関連項目



もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。