為了應對主流 1440p 解析度遊戲環境,Intel 代號 Battlemage 的 Xe2 核心大幅改進架構,拉抬光線追蹤單元的處理能力,整合更先進 XeSS 2 加速功能,進一步提升整體效能表現。
Xe2 核心
GPU 的構成規模還是以 Render Slice 為基本單位,全新的 Xe2 Render Slice 對所有圖形加速功能進行深入的微觀和宏觀分析,並在減少延遲、消除停頓與改善軟硬體交握效率等方面進行最佳化。
Render Slice 內含 4 組第 2 代 Xe 核心(以下簡稱 Xe2 核心),其特性為運算資源在原生 SIMD16 引擎中重新分配,因而可提高效率。
每組 Xe2 核心內含 8 組 512-bit 的 XVE 向量引擎,以及 8 組 2048-bit 的 XMX AI 引擎,這個兩種引擎的數量是前代 ;Xe-HPG 內 Xe 核心的一半,但單一引擎內部的處理單元則是擴增至 2 倍,因此總量不變,但是單一引擎的資料處理效率會更好。L1 快取則從前代的 192 KB 提高為 256 KB。
Xe2 核心的光線追蹤單元則是在處理光線追蹤運算所需的 Traversal pipelines 和 Box intersections(偵測光線是否與物體碰觸) 提升成 1.5 倍,Triangle intersections(多邊型與光線邊框相交)和 BVH cache(包圍體階層快取)提升成 2 倍,大幅提高整體光線追蹤的性能。
Arc B580 所使用的 BMG-G21 晶片由 5 組 Render Slice,內含共計 20 組 Xe2 核心、20 組光線追蹤核心、160 組 XMX 引擎、20 組材質取樣器、10 組相素後端,加上 18 MB 的 L2 快取,以及 2 組 MFX(多格式解碼器)媒體引擎,再搭配 192-bit 記憶體控制器所構成。
在以上架構特性的幫助之下,相較於前代,每個 Xe2 核心的效能可提升 70%,每瓦效能也提升 50%。資料也顯示 Arc B580 的實際執行時間較 Arc A750 大幅縮短 32.7%,這意味著整體性能成長 48.6%。
XeSS 2 整合超解析度、畫格生成與低延遲
憑藉著 Xe2 核心內算力更強的 XMX AI 引擎,XeSS 2 現在可同時提供 XeSS-SR 超解析度、XeSS-FG 畫格生成與 XeSS-LL 低延遲等 3 種面向的加速效果。
首先看到 XeSS-SR 超解析度,這是先渲染較低解析度的畫面,藉此提高渲染幀率,再運用 AI 演算出更高解析度的最終畫面,前代 Xe 核心就已支援這種做法。Intel 表示,以 1440p 解析度為基準,XeSS 效能模式相較於原生解析度平均可提高 47% 每秒幀數。
這一代更新則是集中在 XeSS-SR 的 SDK(軟體開發套件),完整支援 DirectX 11、DirectX 12 和 Vulkan 等 3 種當前主流 API,便於進一步擴大支援 XeSS-SR 的遊戲數量。目前 XeSS-SR 已支援超過 150 款遊戲。
再來是 XeSS-FG 畫格生成,就如同 NVIDIA DLSS 3 導入的 Frame Generation,參考選染出來的前後畫格、動作向量、深度等資訊,混合光流重新投影和動作向量重新投影,便可在兩個畫格之間生成一張新畫格,讓整體畫面更流暢。
當然,XeSS-SR 超解析度和 XeSS-FG 畫格生成這兩個功能可以互相疊加。以 1440p 解析度的《F1 24》為例,超解析度畫質模式搭配畫格生成,則 FPS 可提升至 2.8 倍;若改為超性能模式,FSP 甚至可提升至 3.9 倍。
如同 DLSS 3 處理畫格生成會提高延遲時間一樣,運行 XeSS-FG 也不可避免會有同樣的情形,畢竟生成畫格前,要先參考前後畫格才能運算並產出最終內插的畫格。
因此, XeSS-LL 低延遲就如同 NVIDIA Reflex 功能,透過改進渲染列隊的方式,提前讓畫面顯示於螢幕上,大幅縮短螢幕顯示的延遲時間。
Intel 同樣以 1440p 解析度的《F1 24》為例,原生解析度下套用 XeSS-LL 低延遲可縮短約 45% 延遲時間。而在 XeSS 2 同時開啟超解析度、畫格生成和低延遲效果的情況下,延遲時間比原生解析度下套用 XeSS-LL 低延遲再縮短一些,等同只開啟超解析度的情境。
對了,即便遊戲不支援 XeSS-LL 低延遲,驅動端也有統一的低延遲模式可以開啟。
目前完整支援 XeSS 2 的遊戲有《F1 24》、《消逝的光芒2 人與仁之戰》(Dying Light 2 Stay Human)和《刺客教條:暗影者》(Assassin's Creed Shadows)在內的這 10 款,希望以後越來越多。
XMX AI 引擎
除了加速遊戲表現,XMX AI 引擎當然能應用在各式 AI 工作流程中。從建構、最佳化到執行,可支援的框架、工具、API 等都相當豐富。根據 Intel 釋出的資料,Arc B580 的大型語言模型效能表現領先 GeForce RTX 4060 達 40% ~ 50%。
全新 Intel 圖形軟體
除了精確的顯示與 3D 圖形設定,新一代 Intel 圖形軟體還支援性能與超頻設定,以簡單易懂的友善圖形介面,讓用戶快速調整超頻紹設定。
性能指標
在實測解禁前,從 Intel 釋出的理論效能來看,Arc B580 的光柵畫性能可領先 GeForce RTX 4060 達 32%,光線追蹤性能也領先有 25%。
再看到遊戲實際表現,Arc B580 平均較 Arc A750 成長 24%,也領先 GeForce RTX 4060 約 10%。
最後,Intel Arc B580 詳細性能預計在台灣時間 12 月 12 日 22:00 解禁,敬請鎖定本站的評測報導。