Intel 最新的 Basin Falls 旗艦平台,亮點之一莫過於 X299 晶片組,匯流排介面升級為 PCIe 3.0。
雖然規格看起來對了,Kaby Lake-X 處理器卻有只內建區區 16 條通道,並未因應旗艦平台定位而增加數量。
如此搭配組合,遇上 Kaby Lake-S 實在顯得尷尬,哥們倆都受制於 DMI 3.0 頻寬枷鎖。
旗艦平台處理器架構分歧,實質用意耐人尋味
代號 Basin Falls 的旗艦平台,支援代號 Skylake-X 與 Kaby Lake-X 兩種處理器,晶片組部分同樣使用 X299。
如先前概略提到,這兩個家族處理器的規格相差甚遠,Skylake-X 屬於前代 Broadwell-E 正宗接班人。
而 Kaby Lake-X 說穿了是 Kaby Lake-S 孿生產品,兩者核心配置最高規格為 4 核心、8 執行緒,參考下列圖表可以看出差異極小,其存在價值實在令人困惑。
Kaby Lake-X 本質上如同 Kaby Lake-S 的變裝產品,變更了外觀和極小部分內在,因此近乎完全承襲了 Kaby Lake-S 的優缺點。
站在旗艦平台應用角度而言,規格最大缺憾在於內建的 PCIe 3.0 通道數量,和 Kaby Lake-S 一樣只有 16 條。
由於基本設定是提供給顯示卡使用,因此其他任一有 PCIe 通道需求的裝置,全得連結至 X299 晶片組所內建 PCIe 3.0 控制器。
▲ Skylake-X、Kaby Lake-X、Kaby Lake-S 處理器簡要比較表:Kaby Lake-X 結構本質和 Kaby Lake-S 相同,說不上有更好,但裝機代價卻會高一些。
X299 晶片基於 HSIO(High Speed Input / Output)框架,1~6 通道是固定用於 USB 3.1 Gen 1,其餘可彈性配置部分則是有 24 條,因此總和數量為 30 條。
24 條算是相當充裕的數量,可以妥善分配給 SATA 6Gb/s、乙太網路,並堆砌第三方 USB 3.1 Gen 2 控制器。
剩下的部分,可以配置成 PCIe 3.0 x4 規格 M.2 與 PCIe 3.0 x4 插槽,用於安裝 PCIe NVMe 固態硬碟。
話說到這,一切看來還頗為美好,Kaby Lake-X 所內建 PCIe 3.0 通道數量彷彿不是問題,只有使用多路顯示卡時才會受限。
盲點在於就電腦系統架構而言,日常使用的這些周邊可不是各自為政,控制乃至於資料存取仍然由處理器端掌握。
處理器與晶片組之間的連結途徑,Intel 最新 200 系列晶片組,都是使用名為 DMI 3.0 這等同 PCIe 3.0 x4 的匯流排,單向理論傳輸頻寬為 3938MB/s。
▲ X299 晶片組架構示意圖。
▲ Z270 晶片組架構示意圖。
實際以 Intel 近來打出的 IRST for PCIe Storage 應用為例,這設計目的是可以讓 PCIe 3.0 x4 NVMe 固態硬碟,透過晶片組建構成 RAID 使用。
有趣的地方在此,像是 Intel 自家 SSD 750 固態硬碟,最高循序讀取速度可達 2200MB/s 或以上。
若使用 2 張組建成 RAID 0,那麼理論最高速度會有 4000MB/s 左右,光是它單獨運作就能塞爆 DMI 3.0 有限的頻寬。
雖然談論的是旗艦個人平台,不過依據 Intel 當下行銷方針來說,3D 繪圖、超高畫質影音剪輯等商業應用範疇,也納入了 Basin Falls 平台的守備範圍內。
諸如此類 Mega-Tasking 執行超級多工作業,往往同時需要容量大且高速的儲存裝置,基於資料吞吐量與儲存容量等要求、考量,運用數個裝置組建成 RAID 0 來當工作碟,其實這並不是什麼稀奇古怪的事。
在此類應用情境下,別忘了連結到晶片組 PCIe 3.0 控制器的其他裝置,也會有資料需要經過 DMI 3.0 往返處理器與系統記憶體之間。
一旦 DMI 3.0 頻寬趨於飽和,自然會進入資源搶奪狀態,下場不外乎是傳輸速度低。
反觀 Skylake-X 由於內建 28 或 44 條 PCIe 3.0 通道,因而能讓高、低速裝置分流,對於所欠缺的磁碟陣列組建功能部分,Intel 是新推出 VROC 對應之。
▲ PCIe NVMe 3.0 固態硬碟的單價已經降了不少,在特定應用以 2 或更多個組建成 RAID 0,並不會是太稀奇古怪的行為,但此舉將會對平台架構造成資料流量壓力。
DMI 頻寬枷鎖,亦為旗艦與主流平台區隔屏障
接下來實際透過性能簡測,驗證 DMI 3.0 頻寬潛在的影響性,一律使用先前曾經評測過的磁碟裝置,因為對於基本性能特性已經有一定程度瞭解。
我們所使用儲存裝置配置如下列,為了確保能擠出足夠的資料流量,固態硬碟部分組建成等量磁碟、RAID 0 模式,並搭配外接盒來做輔助驗證之用。
在真實資料傳輸試驗階段,主要組合由 M8Pe 複製檔案到 RAMDisk,SK-2520 外接盒複製到 M5 Pro,這是基於資料寫入速度的考量。
主要組合:
Plextor M8Pe 512GB x 2 @ Windows 10 等量磁碟 < 複製 > Asus RAMDisk
輔助組合:
AKiTiO SK-2520 外接盒 Seagate 600 SSD 240GB x 2 @ RAID 0 < 複製 > Plextor M5 Pro 256GB x 2 @ IRST RAID 0
Plextor M8Pe 512GB x 2 @ Windows 10 等量磁碟 < 複製 > Asus RAMDisk
輔助組合:
AKiTiO SK-2520 外接盒 Seagate 600 SSD 240GB x 2 @ RAID 0 < 複製 > Plextor M5 Pro 256GB x 2 @ IRST RAID 0
▲ M8Pe:左圖取用處理器通道、右圖取用 X299 晶片組通道。
▲ 左圖 M5 Pro、右圖 SK-2520 外接盒。
看過上面的單一磁碟跑分結果,再次驗證 PCIe 通道來源的不同,儘管在理論上會讓性能有些差異,但其實不見得讓人很有感。
而當組建成等量磁碟、RAID 0 模式時,雖然循序存取速度會有相當程度提升,然而當系統碟為之關鍵的 4K 存取,基本上並不會有大躍進演出。
至於重點部分,由於是為了衝高資料流量探討 DMI 3.0 瓶頸,因此細項成績姑且不去細節,以下只取最大數值當代表。
M8Pe 組建成等量磁碟模式,當 PCIe 通道來自處理器時,最大值可以達到 4716MB/s。
反觀連接在 X299 端只有 3244MB/s,兩種連接方式速度差異達 45% 之多,DMI 3.0 其 3938MB/s 理論頻寬的影響性再明顯不過。
而輔助組合 M5 Pro 組建成 RAID 0,其最大值為 1021MB/s,與 M8Pe 最佳總和值可以達到 5700MB/s 之譜,這足以預估到真實檔案傳輸的結果將會如何。
▲ M8Pe 組建等量磁碟:左圖取用處理器通道、右圖取用 X299 晶片組通道。
▲ 左圖 M5 Pro 組建 RAID 0、右圖 Asus RAMDisk。
真實傳輸試驗部分,我們取大約 34GB 容量 ISO 檔進行,因為這比零散檔案更能穩定衝高資料流量。
主要組合 M8Pe 複製到 RAMDisk,當 M8Pe 安裝於處理器供應通道的 PCIe 插槽時,單獨運作平均傳輸速度可達 3978MB/s,若安裝在 X299 供應通道的通道則是只有 3091MB/s,雙方差異達 28% 之多。
至於 SK-2520 外接盒讀取到組建 M5 Pro,所得平均速度為 791MB/s,主要、輔助組合單獨運作都有不俗的速度。
▲ M8Pe 組建等量磁碟:左圖取用處理器通道、右圖取用 X299 晶片組通道。
▲ SK-2520 外接盒複製到組建 RAID 0 的 M5 Pro。
前面基本的單獨傳輸試驗,已經能看出 DMI 3.0 頻寬限制,接著我們來做壓力測試,讓主要、輔助組合同時間複製檔案。
主要組合 M8Pe 安裝於處理器通道時,檔案傳輸過程速度變化有限,平均速度總是能維持在 3700MB/s 以上。
至於 SK-2520 外接盒讀取檔案到 M5 Pro,初始速度約 670MB/s 是有稍微受到影響,而在主要組合複製結束後,其平均速度提升至 772.9MB/s。
當 M8Pe 安裝在 X299 晶片組端時,複製過程出現頻寬爭搶現象,主要組合 M8Pe 速度在 1800MB/s 以上,和複製結束後的平均速度相近。
而輔助組合在同步複製過程中,其速度反而高達 844.3MB/s,但是當主要組合複製結束後,其平均值滑落到 814.8MB/s。
就同步傳輸過程中的速度總和而言,M8Pe 安裝於處理器通道大約有 4400MB/s,安裝在 X299 則是只有 2700MB/s,相差 1700MB/s、62% 左右。
▲ 同步傳輸檔案:左圖 M8Pe 取用處理器通道、右圖 M5 Pro。
▲ 同步傳輸檔案:左圖 M8Pe 取用 X299 晶片組通道、右圖 M5 Pro。
以上簡單試驗,已經足以看出 DMI 3.0 有限頻寬的影響性,其有效頻寬未必只能到 3000MB/s 左右,但是就算再高也不會破 4000MB/s。
因此當各式 I/O 全連結到 X299 晶片組端,在大量資料傳輸應用情境下,確實會面臨頻寬瓶頸。
反觀像是 PCIe 3.0 x4 NVMe 固態硬碟,這類高速裝置連接在處理器供應的通道,的確能夠和 X299 晶片組端其他 I/O,達成不爭搶 DMI 3.0 頻寬的分流效果。
由此來看 Kaby Lake-X,它骨子裡和 Kaby Lake-S 沒什麼差別,記憶體只支援雙通道而且容量上限 64GB,也不像 Skylake-X 內建 AVX-512 延伸指令集,處理器端 PCIe 通道數量更是有限的 16 條。
然而 Kaby Lake-X 的 TDP(Thermal Design Power,散熱設計功耗)為 112W,足足比 Kaby Lake-S 高出 21W,使用體驗未必比 Kaby Lake-S 好到哪,只有溫度和耗電量可能略高是真的。
Kaby Lake-X 感覺像是 Intel 的價格策略牌,透過它降低旗艦平台處理器價位門檻,由大約 14,000 元拉低到 8,000 元左右。
不過得留意,Kaby Lake-X 適用的 X299 主機板約 10,000 元起跳,Kaby Lake-S 所適用 Z270 不用 4,000 元就有。
由於 Kaby Lake-X 的存在看似多餘,我們認為選則 Kaby Lake-S,或者稍後將推出來接替其市場的 Coffee Lake,都比挑 Kaby Lake-X 來得經濟實惠。
測試平台
- 主機板:Asus Prime X299 Deluxe
- 記憶體:Crucial Ballistix Tactical 32GB Kit(4 x 8GB)DDR4-2666 UDIMM
- 系統碟:Kingston SSDNow V300 120GB
- 資料碟:Plextor M8Pe 512GB、Seagate 600 SSD 240GB、Plextor M5 Pro 256GB、AKiTiO SK-2520 外接盒
- 顯示卡:Asus DUAL-GTX1050TI-4G
- 電源供應器:FSP PT-550M
- 作業系統:Microsoft Windows 10 Pro 64bit 中文版
沒有留言:
張貼留言