隨著 Meteor Lake 平台處理器亮相,Intel 進一步解說其內部架構細節。
封裝與製程技術
Meteor Lake 架構是 Intel 歷來能源最高效率的筆電處理器,它包含 Compute Tile、SoC Tile、IO Tile、Graphics Tile 共 4 塊功能甚至連製程都不同的晶片塊,透過 Foveros 3D 封裝技術,以高密度、高能源效率、低延遲的方式集結起來,成為完整的 Meteor Lake 處理器。
目前只有 Compute Tile 是使用 EUV 極紫外光微影技術的 Intel 4 製程,Intel 透露 Graphics Tile 使用著台積電 N5(5nm)製程,SoC Tile 使用台積電 N6(6nm)製程。
Intel 4 製程相較現行 Intel 7 製程,每單位面積 Library 密度可提升至接近 2 倍,同時減少 20% 遮罩與 5% 製程處理步驟,提升良率之餘,還可讓處理器以更低的電壓運行更高時脈,提高電源效率。
運算架構
Meteor Lake 的 Compute Tile 最多可容納 6 顆 P-core(效能核心),以及 2 組共 8 顆 E-core(效率核心),這 2 種核心分別使用全新的 Redwood Cove 微架構與 Crestmont 微架構。
相較於現行 Raptor Lake 平台 P-core 使用的 Raptor Cove ,Redwood Cove 微架構強化了能源效率與效能監控單元,並提高了每個核心的頻寬。
Crestmont 微架構則是相較 Raptor Lake 平台 E-core 使用的 Gracemont,提高了 IPC(每時脈週期指令數量)與運算的分支預測,並強化向量神經網路指令(Vector Neural Network Instructions, VNNI)與指令集架構(Instruction Set Architecture, ISA)等 AI 加速功能。
為了達成高效率這個宗旨,Intel 大幅度修改 Uncore(CPU 核心外)的運算原則。
首先,Intel 在 Meteor Lake 的 SoC Tile 塞進 2 顆 Crestmont 微架構的低功耗 E-core,連同 Compute Tile 的 P-core 和 E-core 構成 3D performance hybrid 架構。
以往 Raptor Lake 的 Thread Director 分配運算資源的順序是從高效能的 P-core 開始,在 Meteor Lake 的 Thread Director 則改成先分配到低功耗 E-core,如果偵測到較高壓力的運算需求,或是環境電力充足,便會依序往 E-core 和 P-core 分配。
從工作負載示意圖可以看到,Meteor Lake 低功耗 E-core 的使用幅度遠高於 E-core 和 P-core,這意味著動用到耗能較多的 Compute Tile 幅度降低了,也就可以提高能源效率。
再來,以往呼叫記憶體、內顯資源都必須透過 CPU 運算核心內的 Ring Fabric,這不僅提高整體的功耗,也讓 Ring Fabric 的頻寬相當擁擠。
Meteor Lake 的創舉就是把低功耗 E-core、記憶體控制器、人工智慧運算專用 NPU、媒體引擎、視訊引擎、影像引擎以及 IO 控制器都整合在 SoC Tile 內,並透過頻寬高達 128 GB/s 且可變動分配的 Scalable Fabric 連通,針對不同的運算負載,分區啟動其他晶片塊。
舉例來說,如果只是影片播放這種使用內顯解碼的超低負載運算,SoC Tile 接到指令後,可從 IO 控制器抓取影片資料到記憶體,低功耗 E-core 和媒體引擎簡單處理後,透過 Scalable Fabric 發送給 Graphics Tile 解碼,再回傳給 SoC Tile,便交由視訊引擎輸出,整個過程不需要動用 Compute Tile 的資源。
厲害之處在於,SoC Tile 設有 P unit 功耗處理單元,以及包括它自己與 Compute Tile、IO Tile、Graphics Tile 都各自擁有 PM controller 功耗控制器,Meteor Lake 可以針對運算需求進行調動,在不需要動用該晶片塊資源的情況下可將其關閉,以達成省電高效率目的。
Xe LPG 內顯
相較 Alder Lake / Raptor Lake 使用的 Xe LP 內顯,Meteor Lake 透過先進架構、邏輯設計、電路設計以及製程調整,將其升級為 Xe LPG 內顯,可在同樣的電壓環境下運行更高的時脈,或是相同的時脈設定下以更低的電壓運作。
Meteor Lake 的 Graphics Tile 容納了規模相當於 Arc A380 獨立 GPU 的 Xe HPG 微架構核心,內含 2 塊 Render Slice 共 8 組 Xe-core,包含 8 個光線追蹤單元。Intel 表示,這塊 Xe LPG 內顯能夠提供近似 Arc A380 的效能,也支援 XeSS 人工智慧超級採樣功能,卻只需要它一半的功耗。
有意思的是,Graphics Tile 並非一塊完整的 Arc A380 GPU,像是媒體引擎、視訊引擎等區塊已被分配到 SoC Tile,顯示埠實體層(Display PHY)被分配到 IO Tile。其中視訊引擎支援到最新的 DisplayPort 2.1 20G 和 HDMI 2.1,這些是 Arc A380 並未擁有的功能。
AI 人工智慧運算
雖然 SoC Tile 內部有人工智慧運算專用的 NPU,但並非所有都只交給它執行。Intel 認為,需要低延遲的運算適合 CPU,需要大量平行運算的適合 GPU,而簡單卻需要持續處理的運算(如視訊處理和音訊降噪)才適合低功耗的 NPU。
Meteor Lake 就是強在它能夠按照需求,使用不同的單元同時處理整筆龐大的人工智慧算。
舉例來說,Stable Diffusion 這種圖像生成應該是近期大家熟知最需要大量資源的運算。
在一套設定好的處理流程中,如果全部交由 CPU 處理會費時 43.3 秒和 40W 能源,效率頗低;全部將由 GPU 處理則會費時 14.5 秒和 37W 能源,速度快但耗能不少,全部將由 NPU 處理則費時 20.7 秒和 10W 能源,速度沒那麼快但耗能最低。
若是分別將其中一半運算交給 GPU 和 NPU,只費時 11.3 秒和 30W 能源,雖然耗能稍高但處理速度最快。這意味著使用者可針對不同的處理速率需求或電力環境,安排最合適的運算方式。
總結
透過以上種種技術的堆疊,不難看出 Meteor Lake 的設計主軸一直圍繞在能源效率上,Intel 甚至表示 Meteor Lake 是該公司歷來能源效率最高的筆電處理器。至於實際產品表現如何,就靜待首款 Core Ultra 處理器 12 月 14 日上市後見分曉囉。