都相當重視浮點運算的效能
(除非你的程式都用整數來作,如果真的用整數作會加快很多,
但是在Coding的過程會增加很多困擾,如單位轉換)
我沒有用過opteron這麼高階的CPU來組過叢集
都是利用一般常見的桌上型CPU來組
其實選擇AMD最大的好處除了便宜之外
因所選用的商用編譯器為PGI,ACML(AMD的數學函式庫)也包在裡面並最佳化過
一舉兩得(題外話,Intel的數學函式庫賣的可貴了,AMD的是免費)
而Intel的主機板價位總是比AMD高上不少,CPU也貴上不少
在有限的預算下我只能靠向AMD陣營
剛好前一陣子幫現有的計算叢集作了一下HP(High Performance) Linpack的效能測試
可以給大家參考看看
CPU採用的是 AMD AM2 4200+ X2
共16顆,所以有32顆核心可供計算
每張版子配備1GB的記憶體
透過GigaNet網路計算
設定參數為
N : 10000
NB : 50
PMAP : Row-major process mapping
P : 4
Q : 8
求解10000*10000的矩陣,CPU分割為4*8
計算的結果依不同的測試而有差距
最低大約24Gflops
最高大約37Gflops
如果依時脈來看,這個結果其實差強人意
理論上應該要達到70Gflops左右 (2.2Ghz*32)
不過這其中牽扯的因素很多,矩陣的大小,區塊的控制,額外函式庫的最佳化等等
由於只是好玩作個測試,並沒有再作進一步的細部調整
針對實際的應用案例而言,多顆分開平行計算的加速才是最終目的
不過前一陣子在Survey新叢集的時候
找到一篇文章在Linux平台下針對Intel C2D與AMD AM2 X2雙核心的測試
Intel的測試結果幾乎都呈現較佳的表現
但考慮了價錢之下,多出的一些效能是否值得投資就存於各位心中囉
另外,電力的表現AMD雖然計算時較耗電
但是待機時卻比Intel省電很多,我想除非是像國高(NCHC)這種單位的主機
否則一般學校自己組的叢集
待機時間應該大於真正計算時間,電力的花費是另一個考量
因為並沒有使用效能測試軟體去做評估;
Xeon之前我們有買過雙CPU版本,不過是兩年多前的事情吧,
計算效能並沒有跟價錢做上很好的聯結,所以買過那次後就再也沒考慮過Xeon,
建議可以直接組比較好的PC來用,會比較划算,要不就直接買Itanium2或者Opteron,
Opteron的效能將近於兩年前的高階Itanium2,有些人聽起來可能覺得很不怎樣,
Opteron也才跟兩歲的老人家差不多,不過要注意的是,Itanium2的效能雖然好,
但是價錢大概是"4倍"(op=1x, I2=5x~6x)左右,而且很容易熱當,除了關在20度的冷氣房內還要用大型立扇吹。
至於高階PC的AMD與INTEL,相同等級的產品,我們以前測出來的效能差異並沒有很大,
兩方各有各的優點,至於孰優孰劣,有興趣的話建議先撥預算各兩種各買一台測,
畢竟網路上的資訊有時只是片面的,到底哪一台上場會比較好,還是要看軟體的調教與整台主機的設定,
真的要try過才知道,不過我認為近似的設定值,效能的差異應該是within 20%,
如果預算有限,如danish所說的,可以考慮向AMD靠攏。
前一陣子學校採購的大型陣列,也是考慮價格與效能比,所以清一色全部採購Opteron。
電費對於學校機構而言,應該不是問題吧,我們從來沒繳過電費XDDDD 所以這個我沒概念
之前我用4CPU parallel,就是在NCHC的HP Superdome (Hermes),
效能驚人,燒錢的速度也是驚人
