hp服务器性能测试,较新架构服务器用CPU性能对比测试
SPEC FP和lnt 2000是用來測試CPU性能的標準測試軟件。不過,實際的測試得分受編譯器的影響相當大。SPEC fp和integer將會顯示較佳的性能表現。不過在實際運用中,處理器的表現會相對保守一些。
而在我們的這篇文章中,這代表著SPEC的測試數據會比它在實際應用程序的表現中略高一些。不過,通過SPEC CPU 2000,我們倒是可以很好地了解一顆處理器的性能。正如前述,測試中的Xeon 5000就是采用了新Woodcrest核心的Xeon處理器。
SPECfp
Clockspeed SPEC fp 2000
POWER5+ 2200 3271
Itanium 2 1666 2851
Xeon 5160 3000 2783
Opteron 2800 2256
Pentium 4 E 3733 2232
我們看到,新核心的Woodcrest要比最快的雙核心Opteron快20-25%左右。而得益于新的65nm工藝,Woodcrest的核心速度提高了7%。如果AMD能夠讓自己的處理器頻率達到英特爾的水平,將能帶來15%左右的性能提升。不過在大部分的64bit和128bit SSE程序中,英特爾的Woodcrest依舊占據了非常明顯的性能優勢。
SPECint
Clockspeed SPEC Int 2000
Xeon 5160 3000 3057
Pentium 4 E 3733 1870
Opteron 2800 1837
Pentium 4 Xeon 3733 1813
POWER5+ 2200 1705
Itanium 2 1666 1502
在對整數性能的測試中,Woodcrest輕松超越了其他幾款橫向對比的處理器。接下來我們就看看在服務器程序中SPEC lnt 2000的整數性能。
延遲
LMBench是一款能夠用來判定內存時序和指令時序的測試軟件。我們使用LMBench3.0a-5進行了測試。應該說LMBench的結果通常都是正確的,但并不總是正確的。如果軟件無法正確識別出某種架構,很有可能出現錯誤的測試結果。因次我們非常有必要事先來檢查好。
LMBench
Clockspeed L1 (ns) L1 (cycles) L2 (ns) L2 (cycles) RAM (ns) RAM (cycles)
Xeon 5160 3 GHz 3000 1.01 3 4.7 14 117.3 345
Pentium- M 1.6 GHz 1593 2 3 6 10 92.1 147
Sun T1 1 GHz 980 3 3 22.1 22 107.5 105
Opteron 275 2209 1 3 5.5 12 73 161
Xeon Irwindale 3.6 GHz 3594 1 4 8 28 48.8 175
大容量的4MB L2緩存擁有一個非常低的延遲:14cycle。如果我們使用諸如ScienceMark這樣的測試工具的話,我們得到的數值將是12cycle,這樣來看,它會是一個非常不好的結果。不過,即便是14cycle,在3GHz下,它的表現依然令人吃驚。而Core Duo(Yonah),
另一方面,緩存的延遲相當高,不過憑借4MB的L2緩存還是將這種影響降到了最低。造成這種現象的原因可能是FB-DIMMs。AMB會造成高延遲,CAS為4的registered DDR2 533芯片會造成一個更高的延遲。這使得內存子系統中的延遲達到了非常高的115ns,而Opteron只有73ns。
ScienceMark的結果則不盡相同,Opteron系統的測試結果為65-70ns,而Woodcrest的測試結果則在70-76ns。
不過在這里,我們則更傾向于LMBench的結果。
由于具備了可以支持模塊取冪和乘法的MAU,Sun?T1能夠加速處理SSL的RSA(Rivest?Shamir?Adleman)和DSA(Digital?Signal?ALGorithm)的加密、解密操作。每顆T1核心都具備了一個MAU(modular?arithmetic?unit),這樣8個核心就有了9個MAU。為了能夠充分利用8個MAU,我們需要通過SCF(Solaris?Cryptographic?Framework)來完成SSLI的計算過程。我們使用命令openssl?speed?-engine?pkcs11?rsa來測試T1的MAU。Solaris?10系統還提供了in-kernel?SSL終端,它的安全性要比kernel之外的SSL終端要更完善。
我們在測試中選擇了惠普的DL585來測試Opteron?880的8個核心是否可以和Sun?T1?的8個MAU一拼高下。如果想要對Woodcrest和Opteron進行比較,我們則需要檢測2和4并行碼。我們可以在下面的圖表中看到1024bit的數值。每顆核心一個線程師較好的選擇,因此我們測試DL585時使用較大的16線程,這樣8線程的性能就是最強的。測試Xeon?Irwidale使用8線程,因此5線程就是最強的,如此類推。
我們注意到8MAU的Sun T1在關閉32“SSL RSA signing”線程后只能獲得全效性能。在那種情況下,1GHz的T1能夠和2.4GHz的8核心DL585取得近似的性能。如果不考慮MAU,T1的性能表現會和1.8GHzde Xeon Irwindale一樣快。因此如果你想要在Sun T2000上運行自己的安全網絡服務的話,對你的網絡服務器進行SCF的檢查將會是必不可少的了。
此外,我們注意到之前的Netburst架構的表現非常糟糕。這是因為在Pentium?4核心的內部缺少了barrel?shifter,這是一種能夠將大量數據轉換或者循環進入一個時鐘周期的電路。由于缺少了這種轉換裝置,造成延遲過高。就大多數的x86代碼而言不能忽視這一點,不過代碼的加密常常需要使用到這個轉換和循環的過程。我們分別在HYper-Threading打開和關閉的兩種情況下進行了測試。在這種情況下,Hyer-Threading為編碼加密帶來了20-28%的性能提升。
我們對四核心AMD?Opteron?2.4GHz、四核心Xeon?Woodcrest和Sun?T1(打開MAU,分配不同長度的RSA)進行了對比測試。RSA Encryption (Signs/s)
Opteron 2.4 GHz
4 threads Xeon 5160 3 GHz
4 threads SUN T1 with MAU
32 threads
512 bit 19003 21194 35613
1024 bit 6098 6240 10722
2048 bit 1145 1087 1918
4096 bit 185 164 1
我們注意到T1的硬件加速并沒有在2048bit下表現得更加先進一些。考慮到大部分的安全程序依然是使用的1024bit,這樣的結果我們也可以接受了。
在信號的檢測中,服務器必須鑒定客戶端的一致性。在1024bit下Woodcrest和Opteron都能檢測到每顆核心超過50000keys,而且這還是OpenSSL檢測程序的硬件限制。
Opteron再次在測試中取得了一馬當先。8MAU Sun T1的速度只有4Opteron和Woodcrest的一半。加密往往要比檢測代碼更加損耗服務器的速度。
Apache/PHP/MySQL性能
英特爾的新Xeon在這里“掃了地”。比2.4GHz的Opteron高出75%的性能,新Xeon即使在面對3GHz的Opteron也不會存在什么問題。我們本應該做更深一步的研究,不過現在看來似乎是由于大的4MB L2緩存和Woodcrest本身不更加先進的整數性能。而T1在這項測試中的表現則屬于不好不壞。
Java Webserving
整個測試包括了如下幾個部分: Caucho Technology''s Resin 2.1.17
Java Virtual Machine: Java HotSpot(TM) Server VM (build 1.5.0_04-b05)
Sybase ASE 15.0 for Solaris / Linux
AMD在這里的表現仍然只能算是差強人意,如果我們撇開2.4GHz和2.2GHz的兩塊CPU不看,3GHz的Opteron仍要比3GHz的Woodcrest慢25%!
本次用于測試的MySQL參數如下:
[mysqld]
port3306
socket= /tmp/mysql.sock
skip-locking
key_buffer = 1G
max_allowed_packet = 1M
table_cache = 1024
sort_buffer_size = 2M
read_buffer_size = 2M
read_rnd_buffer_size = 8M
thread_cache = 125
max_user_conNECtions = 450
max_connections = 450
thread_concurrency = 16
測試結果:
T1需要20-30 MySQL線程才能全速運行,這很大程度上是受到了8核心"4 thread Gatling gun core"架構的影響。
MySQL的性能很難令人滿意,和上述的優化以后的圖表比起來,性能下降了大約有4-5倍。
接下來我們看看單顆的雙核心Woodcrest和雙核心的Opteron、四核心的Sun T1的比較。
為了能對雙核心進行測試,我們在這里對Xeon Irwindale也進行了測試。額外的1MB緩存使得Irwindale測試成績改善了7-8%。不過Hyper-Threding并沒有對MySQl起到什么幫助,我們注意到這里出現的一個大約7%的性能降幅。
MySQL Linux (Queries/s)
Sun T1
4/8 cores 1 GHz MSI K2-102A2M
Opteron 275 Xeon 5160
Woodcrest 3 GHz MSI K2-102A2M
Opteron 280
Average Dual-core
(T1: quad-core) 362 749 996 805
Average Quad-core
(T1: octal-core) 433 590 904 622
Speedup Dual to Quad 20% -21% -9% -23%
在Linux平臺上,雙核的X86核心要比四核的表現更加好一些,不過使用Solaris系統的T1則為4-8核心方面的性能作了很多改進。
究竟孰好孰壞?是Linux還是Opteron?我們需要通過在Opteron上的Solaris系統來進行測試。不過由于MSI 1U服務器的芯片并不支持x86Solaris。我們只有使用MSI K8N Master2-FAR來判定了。
MySQL Solaris (Queries/s)
Sun T1 4/8 cores 1 GHz Opteron 280 Solaris Opteron 280 Linux
Average Dual-core
(T1: quad-core) 362 456 799
Average Quad-core
(T1: octal-core) 433 605 625
Speedup Dual to Quad 20% 33% -22%
Database PerformANCe (Linux)
MSI K2-102A2M Opteron 275 MSI K2-102A2M Opteron 280 Opteron 280 vs.
Opteron 275 Extrapolated Opteron 3 GHz Xeon 5160
3 GHz
MySQL - Dual-core 749 805 7% 946 996
MySQL - Quad-core 590 622 5% 703 904
PostgreSQL 490 524 7% 616 673
由于Xeon 5160尚未發布,我們現在也尚不可知AMD對此會有怎樣的反應,而我們最關心的則是3GHz的Opteron和3Ghz的Woodcrest的對決。兩個架構的管線長度一樣,同核心技術下能夠達到的時鐘頻率也很相近。我們總店來看看和新Xeon比,Opteron的表現。 Database Scaling (Extrapolated)
Xeon 5160 vs.
Opteron 280 Xeon 5160 vs.
Extrapolated Opteron 3 GHz
MySQL - Dual-core 24% 5%
MySQL - Quad-core 45% 29%
PostgreSQL 28% 9%
Xeon在開源數據庫上的優勢相當顯著,不過還是比不上Spec 2000的整數測試。而Woodcrest能有如此表現的原因很大程度上也是由于其4MB的L2緩存。正如我們之前所說的,相對于前代的Xeon增加的緩存直接為處理器帶來了7-8%的性能提升。我們現在還無法確定在Opteron和Woodcrest上是否也是如此,不過對于較新的Xeon,它的確帶來性能上的增進。
Web Server分析 Webserver Performance
MSI K2-102A2M Opteron 275 MSI K2-102A2M Opteron 280 Opteron 280 vs.
Opteron 275 Extrapolated Opteron 3 GHz Xeon 5160
3 GHz
Jsp - Peak 144 154 7% 182 230
AMP - Peak 984 1042 6% 1178 1828
分別和2.8GHz的Opteron、3.0GHz的Opteron對比測試的結果: Webserver Scaling (Extrapolated)
Xeon 5160 vs.
Opteron 280 Xeon 5160 vs.
Extrapolated Opteron 3 GHz
Jsp - Peak 49% 26%
AMP - Peak 75% 55%
在Web Server的性能測試中,較新的Xeon表現得非常強大,即便是一顆3GHz的Opteron也對他無能為力。
功耗 Max Power usage (全部 CPU load - WaTts)
Configuration Power
Sun T2000 1CPU / 8 Cores - 8 GB RAM 188
Dual Opteron 275 HE 2CPU''s (275HE) - 4 GB RAM 192
Dual Opteron 275 2CPU''s - 4 GB RAM 239
Dual Xeon 5160 3 GHz 2 CPU''s - 4 GB RAM 245
Dual Xeon "Irwindale" 3.6 GHz 2CPU''s - 8 GB RAM 374
單純從測試結果來看,T2000服務器的表現較好。據悉,一經上市的T2000服務器都將配備450W電源。從性能/功耗比來看,新的Woodcrest在大多數場合下要略勝一籌。
首先我們對各款處理器的性能作一個大概的描述:Sun?T2000服務器及其32線程的T1處理器表現比較中庸,它不會使開源數據庫的較好選擇。在Solaris上的PostGreSQL和MySQL的表現要超過了在Linux上的表現。英特爾的Xeon?5160也就是Woodcrest或許會成為本年度最成功的的服務器處理器。正如我們所看到的,2.6GHz的Woodcrest甚至能夠打敗當前的Opteron?285,一馬當先幅度從5-55%不等。而AMD呢?Opteron在不同的平臺上都有著出色的架構。它已經成為了出色的四處理器平臺的選擇,不過在IPC和緩存的增補上,還需要進行一些改進。
Intel?Xeon?5160?(Woodcrest)
優點:
所有程序中性能表現較好
高端產品中較好的性能/功耗平衡
GB-DIMMs提供了高帶寬和高容量的內存
缺點:
在一些特別情況(RSA、AES)下需要SSE優化代碼
FB-DIMM會造成額外的延遲和功耗損失
UltraSparc?T1?/?Sun?T2000
優點:
超強的SSL性能
SSL/Java下不錯的性能/功耗平衡
支持Solaris系統
四通道提供了大容量的內存
缺點:
必須進行相關的優化,否則性能不高
單線程下性能較低,直接導致了服務器軟件的性能低下
性價比不如Woodcrest
AMD?Opteron
優點:
在四處理器平臺下表現優異
得益于NUMA,無需FB-DIMM,即可獲得大容量內存(DDR2內存具備了低延遲、低功耗的特點)
缺點:
Web?Server性能不如Woodcrest
高頻下功耗較大
總結
以上是生活随笔為你收集整理的hp服务器性能测试,较新架构服务器用CPU性能对比测试的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mybatis collection 子
- 下一篇: 电子技术课程设计-正弦波发生及频率显示电