Intel Xeon (X5680,E5-2680,E5-4650) ベンチマーク (2012/9/1 更新)
Xeon E5-2600/E5-4600シリーズは、浮動小数点の計算用にそれまでの2倍の長さの256bitレジスタを有し、新たに追加されたAVX命令を使用すれば、4個の計算を同時に行なうことができます。その機能が存分に発揮される専用ライブラリ(MKL)を用いた時には、配列サイズにもよりますが、20GFLOPS超の性能を実現し、Xeon E5-2680は同X5680のほぼ2倍の性能となっています。
また、Xeon E5-2600/E5-4600シリーズはメモリバスの速度が1.6倍高速になっていますので、多数のコアで計算が行なわれた時、特にメモリアクセスの多いプログラムでの性能低下が小さくなっています。
評価したCPU / メモリ
CPU | 周波数 | CPU当り コア数 |
CPU当り キャッシュメモリ |
CPU当り メモリバス速度 |
使用したメモリ |
---|---|---|---|---|---|
Xeon X5680×2 | 3.33GHz | 6 | 12MB | 32GB/sec | DDR3 1333MHz Reg. 4GB <2 Rank> ×3×2 |
Xeon E5-2680×2 | 2.7GHz | 8 | 20MB | 51.2GB/sec | DDR3 1600MHz Reg. 8GB <2 Rank> ×4×2 |
Xeon E5-4650×4 | 2.7GHz | 8 | 20MB | 51.2GB/sec | DDR3 1600MHz Reg. 8GB <2 Rank> ×4×4 |
評価プログラム
- A. 連立一次方程式
-
(1) Intel MKLライブラリ使用
キャッシュヒット率高い
-
(2) LAPACKソースプログラムをIntel Fortranにてコンパイル
キャッシュヒット率低く、メモリアクセスが多い
- B. 一般的なアプリケーション
コンパイラ
- X5680: Intel Fortran 10.0
- E5-2680/E5-4650: Intel Fortran XE 12.1
数値計算ライブラリ
- X5680: Intel MKL 9.1
- E5-2680/E5-4650: Intel MKL 10.3
- ◆
- キャッシュによくヒットしピーク性能を出すプログラムを1~16個同時に実行
(MKLをリンクして生成した連立一次方程式の実行コード)
CPU | Xeon X5680 | Xeon E5-2680 | Xeon E5-4650 | |||||||
---|---|---|---|---|---|---|---|---|---|---|
未知数 | 2000 | 6000 | 10000 | 2000 | 6000 | 10000 | 2000 | 6000 | 10000 | |
実行ジョブ数 | 1 | 11264 | 12831 | 13087 | 20775 | 24536 | 25133 | 19275 | 21760 | 22247 |
2 | 10469 | 12832 | 13092 | 20457 | 24730 | 25317 | 19702 | 23336 | 22289 | |
4 | 10367 | 12757 | 13020 | 20856 | 24453 | 25226 | 19486 | 22685 | 23173 | |
8 | 10327 | 12299 | 12505 | 18734 | 23685 | 24098 | 18867 | 22989 | 23783 | |
12 | 10615 | 11852 | 12133 | 調査せず | 調査せず | 調査せず | 調査せず | 調査せず | 調査せず | |
16 | — | — | — | 17563 | 21128 | 20987 | 18223 | 20488 | 21496 | |
32 | — | — | — | — | — | — | 15658 | 18865 | 20212 |
単位:MFLOPS (実行ジョブの平均値)
- ◆
- メモリアクセスの多発するプログラムを1~16個同時に実行
(Lapackをコンパイルして生成した連立一次方程式の実行コード)
CPU | Xeon X5680 | Xeon E5-2680 | Xeon E5-4650 | |||||||
---|---|---|---|---|---|---|---|---|---|---|
未知数 | 2000 | 6000 | 10000 | 2000 | 6000 | 10000 | 2000 | 6000 | 10000 | |
実行ジョブ数 | 1 | 4113 | 3588 | 3573 | 5453 | 4640 | 4630 | 5398 | 4369 | 4360 |
2 | 4107 | 3587 | 3602 | 5692 | 4625 | 4610 | 5355 | 4366 | 4358 | |
4 | 4072 | 3555 | 3400 | 5692 | 4582 | 4627 | 5270 | 4460 | 4367 | |
8 | 3760 | 2500 | 1434 | 5579 | 4391 | 4218 | 5387 | 4358 | 4362 | |
12 | 2807 | 1113 | 817 | 調査せず | 調査せず | 調査せず | 調査せず | 調査せず | 調査せず | |
16 | — | — | — | 4962 | 3051 | 1605 | 5204 | 3968 | 3928 | |
32 | — | — | — | — | — | — | 4651 | 3160 | 1306 |
単位:MFLOPS (実行ジョブの平均値)
- ◆
- 科学計算プログラムの一例 (MKLルーチンを多用)
CPU | Xeon X5680 | Xeon E5-2680 | Xeon E5-4650 | |
---|---|---|---|---|
実行コア数 | 1 | 45.0 | 25.5 | 27.2 |
2コア並列 | 24.1 | 13.8 | 14.9 | |
4コア並列 | 13.7 | 8.2 | 9.7 | |
8コア並列 | 9.4 | 5.9 | 6.4 | |
12コア並列 | 8.1 | 調査せず | 調査せず | |
16コア並列 | — | 5.4 | 4.5 | |
32コア並列 | — | — | 4.6 |
単位:秒