テクニカルノート

Pentium4 (FSB 800MHz) 性能評価 (2003/7/1)

← 戻る

Pentium4は本年5月からFSB(フロント・サイド・バス)速度が800MHz対応製品が出荷され始め、従来よりも格段の性能向上を実現しています。本稿ではPentium4-3.0GHz(チップセットはD875、D865、E7205)で連立一次方程式プログラムを実行した時の性能比較を御紹介します。またそれ以前の代表的なチップセットも参考として御紹介します。テストしたハードウエアは下記の通りです。

  1. Pentium4-3.0GHz + D875P (FSB=800MHz, 6.4GB/sec --PC3200 DIMM使用)
  2. Pentium4-3.0GHz + D865G (FSB=800MHz, 6.4GB/sec -- PC3200 DIMM使用)
  3. Pentium4-3.06GHz + E7205 (FSB=533MHz, 4.2GB/sec -- PC2100 DIMM使用)
  4. Pentium4-2.8GHz + D850E (FSB=533MHz, 3.2GB/sec -- PC800 RIMM使用)
  5. Pentium4-1.9GHz + D850 (FSB=400MHz, 3.2GB/sec -- PC800 RIMM使用)

プログラムはIntel Fortran 7.0で最高速のライブラリAtlasをコンパイルしてコールしたもの(atlasと記載)、LapackをIntel Fortranでコンパイル(SSE2を使用)したもの(Lapack(intel Fortran)と記載)、Lapackをg77でコンパイルしたもの(Lapck(g77)と記載)の3種を実行しました。Atlasはキャッシュを最大限に使用する様に工夫され、CPUのピーク性能を引き出す事ができます。今回のテストでもPentium4-3.0GHz+D875Pチップセットで4013MFLOSを記録しています。Lapackは最悪ではないもののAtlasに比べてキャッシュのヒット率の悪いプログラムであり、キャッシュヒットに注意深く作られていない一般的なプログラムの実行性能に相当するものと考えられます。

3種のプログラムの実行結果から、自明の法則ではありますが次の事が理解できます。
「キャッシュメモリを効率的に使用するプログラム(atlas)ではメモリ速度の差は大きくは影響せず、CPUの周波数に依存する度合が高くなり、逆にキャッシュミスヒットの多いプログラムでは実行性能はメモリバスの速度に依存する度合が高くなる。」

D865、D875の両チップセットともにFSB=800MHzで動作し、ピークのメモリ転送速度が6.4GB/secと高速ですが、Lapackプログラムでは性能に有意の差が生じています。D875には、PC3200(DDR400)のメモリを装備した時に限り、チップセット内部のデータ転送回路(同期回路で構成されています)がショートカットされる経路が設けられているからです。D875でのデータ転送は、実際にデータがバス上を流れている時には800MHzであるものの、ショートカット回路により遅延が少なくなり、メモリアクセスの頻繁なプログラムでは性能に10%強の差が生じたものと考えられます。

以上より、FSB 800MHzのPentium4は非常に高速であり、特にD875チップセット、PC3200 DIMMとの組み合わせはキャッシュミスヒット時の性能が大きく向上しており、科学技術計算分野での使用に最適なコンピュータであると言えます。

弊社ではD875P及びD865Gを装備したTsumuji2シリーズコンピュータを出荷していますが、両者とも4個のDIMMソケットを備え最大4GBのメモリをサポートできますが、4GBで出荷できるのはPC3200対応の512Mbit DRAMが商品化される本年秋以降になります。