隨著 Intel (那斯達克交易代號:INTC) 在今日發表第三代 Xeon E5 雙 CPU 平台,許多人也相當關注這項產品能如何提升資料中心的伺服器。然而,產品為高檔工作站所帶來的好處就算沒更多,也可說是不遑多讓。
首先,Haswell 核心意味著搭配積和熔加運算 (FMA),使得 AVX 的浮點運算功能大幅增強。舉例來說,像是就 Linpack 等標準而言,理論上錯誤辨識率會增加一倍。Haswell 之 AVX2 的重要性也不相上下,它將整數處理移至寬廣平行的 AVX 引擎,實際上將位址計算之外的任何事物卸載至類似 RISC 的三位址 AVX 指令格式,以及寬的暫存器集。就工作站應用程式而言,一旦為了運用這項產品而重新編譯,就有望獲得龐大的優勢,同時還能逐漸捨棄過時的 X86 程式碼基底。
其次,可就每一個 SKU 選擇多種核心 (從 8 個多達 18 個),能讓你根據應用程式的平行處理原則,在每核心速度 (例如每執行緒效能) 和核心數之間,挑選出恰當的平衡點。有些應用程式在許多核心的延展並不出色,因此偏好採用高的每核心速度,像是射線追蹤等其他應用程式則會儘量利用許多核心。
Xeon-E5 v3 系列的初始工作站 SKU 為E5 2687W v3,擁有 3.1 GHz 10 核零件,且確實在 2 核心 (及其相關快取) 關閉時,使用 12 核晶片。現在它的繼任者,也就是在 Ivy Bridge 平台作業的2687Wv2,即使停用晶片的某些核心,依然擁有完整的 L3 快取,我猜我們只有等到 Broadwell-EP (E5 v4) SKU 在明年推出時,才能見識到這項優勢。
接著我們來看 DDR4,沒錯,初始 DIMM 的速度並不算快,在延遲方面尤其如此,但是 DDR4 擁有較低電壓和其他可靠性的特色,加上其速度和延遲預期會在其後幾季中快速改善,所以應當能夠在雙插槽工作站提供使用者前所未見的生產力,不僅超越1.5 TB RAM,還不會像 DDR3 那樣,在高負載時犧牲頻寬。
改良 PCIe 頻寬、整合電壓調整器,並且將 QPI 的速度提升至 9.6 GT/s,也都是重要的其他優勢。
性能測試
現在我們來檢視初始參考工作站,這以 Intel 的 SKU 為基礎,且由 BOXX 封裝。機器在 SuperMicro X10DAi 工作站主機板採用液態冷卻技術,本身頗為精簡,並且配備三個 PCIe x16 v3 插槽。這並不會讓平台理論上的四個 GPU 完整頻寬功能達到最大值,但是對多數使用者來說,應該夠用了。反之,主機板的空間可供16 個 DDR4 DIMM 使用,也就是如果使用 64 GB 模組,就能在明年年初使用 RAM 完整的 TB 容量。在 Samsung 16 GB ECC DDR4-2133 RDIMM 的 8 個組件中安裝的 RAM 為 128 GB。
此系統搭配 Nvidia Quadro K2000,我改用 AMD FirePro W9100 這款據說是當今市面上最強大的專業 OpenGL 卡。卡片配備16 GB VRAM 和六個 DisplayPort 輸出,甚至能夠驅動 8K 顯示卡,這和我們上星期提到的 BOE 技術類似。Intel 的 240 GB + 400 GB (SATA + PCle) SSD 兩用組合也讓功能更為完整。
第一個標準是 SPEC 針對此系統制定的全新 SPECwpc 全方位工作站生產力標準。此套件的執行時間長達幾小時,從處理器、圖形 (也稱作 ViewPerf) 到整體系統效能無所不包,且和例如 BAPcO SysMark 幾年前在 PC 執行工作的表現相比,似乎減去不少麻煩。
以下是 SPECwpc 在雙 3.1 GHz E5-2687W v3 系統上執行的第一批成果:
接著我們執行了 CineBench 15,請注意,此系統和超頻的 4+ GHz Core i7-5960X,也就與這些 Xeon 系出同門的桌面用 Haswell-E相比,速度快了大約一倍。
你可以在 CPU-Z 中了解 CPU 的相關資料。
接著我們檢視最新版本的 SiSoft Sandra。以下為關鍵效能資料報告。
我們將在下一輪評論中,鎖定在變更並調整主記憶體時,對效能造成的變化,也會探討進一步提升 CPU 速度的機會。在我看來,工作站市場能輕易證明取得更高 TDP,或許甚至是解除鎖定的 Xeon 的合理性,這在每一個插槽的組態使用 8 核和 18 核尤其如此。