Blackwell 架構最強款,GeForce RTX 5090 實測終於解禁,一起來看看 NVIDIA 自家設計的 Founders Edition 創始版效能如何,以及雙槽散熱器能否真的解掉 575W 高熱。
GPU 規格
NVIDIA Blackwell 架構晶片全系列使用 TSMC 台積電 4nm 的 4N NVIDIA 客製化製程,最大規模的 GB202 晶片面積 750 mm2,內含 922 億個電晶體,配置 12 組 GPC(Graphics Processing Clusters,圖形處理叢集),每組 GPU 內含 8 組 TPC(Texture Processing Clusters,紋理處理叢集)。


每組 TPC 有 2 組 SM(Streaming Multiprocessors,串流複合處理器),每組 SM 包含 128 個可處理 FP32(單經度福點數)與 INT32(32 位整數)的 CUDA 核心,以及 1 顆第 4 代光線追蹤核心;每 32 顆 CUDA 核心配置 1 顆第 5 代 Tensor 核心,每組 SM 共有 4 顆。
所以總合起來,完整的 GB202 晶片共有 192 組 SM,包含 24576 個 CUDA 核心、192 個第 4 代光線追蹤核心、768 個第 5 代 Tensor 核心與 768 個紋理單元。

GeForce RTX 5090 使用的 GB202-300 晶片是稍有刪減的款式,共 11 組 GPC 再屏蔽其中 3 組 TPC,因此共有 170 組 SM,內含 21760 個 CUDA 核心、170 個第 4 代光線追蹤核心、680 個第 5 代 Tensor 核心與 680 個紋理單元。
效能實測
接下來的測試,我們以使用當前遊戲性能最好的 AMD Ryzen 7 9800X3D 處理器為平台,並準備前代最強的 GeForce RTX 4090 Founders Edition 創始版當作參照,來看 RTX 5090 的效能落點。
3DMark
模擬 DirectX 12 遊戲的 Time Spy、Time Spy Extreme 測試中,RTX 5090 的 GPU 分數比 RTX 4090 提升 33% 左右。無光追重負載的 Steel Nomad 測試成績提升幅度非常明顯,達 55.3%。模擬光線追蹤遊戲的 Port Royal 與整合 DirectX 12 Ultimate 的 Speed Way 測試則提升 41% 左右。
由於 RTX 5090 支援可生成至 4 倍畫格的 DLSS,相較於 RTX 4090 只支援可生成至 2 倍畫格的 DLSS 3,RTX 5090 的 fps 可達 RTX 4090 的 2.54 倍以上,最高於 DLSS 畫質模式可達 2.74 倍。
GPU 渲染效能與綜合運算
Blender 4.3.0、V-Ray 6、Geekbench 6 等測試中,RTX 5090 成績大多是 RTX 4090 的 1.3 倍以上,其中 Blender 的 junkshop 成績達到 1.45 倍。
傳統光柵化遊戲
不套用光線追蹤的 20 款 AAA 遊戲實測中,RTX 5090 運行 4K Ultra HD 2160p 解析度的平均畫面流暢度近 180 fps,較 RTX 4090 成長 26.5%。
由於 RTX 5090 的運算速度實在快,即便是 Ryzen 7 9800X3D 平台,WQHD 1440p 解析度已有部分遊戲撞上 CPU 瓶頸,RTX 5090 運行起來平均畫面流暢度逾 250 fps,較 RTX 4090 成長 17.7%。
Full HD 解析度撞上 CPU 瓶頸的遊戲就更多了,RTX 5090 平均畫面流暢度達 300 fps,僅較 RTX 4090 成長 13.4%。
第一人稱射擊遊戲方面與 AAA 遊戲類似,RTX 5090 在 2160p / 1440p / 1080p 解析度較 RTX 4090 分別成長 35% / 19% / 9%。
光線追蹤遊戲
由於光線追蹤負載比較吃重,加上 RTX 5090 的光線追蹤算力較強,2160p / 1440p / 1080p 解析度較 RTX 4090 分別成長 35% / 27% / 19%。
Upscaling 與 Frame Generation 效果
DLSS 在遊戲內主要以 Upscaling 解析度放大和 Frame Generation 畫格生成(補幀)等方式呈現。
相較於有著光線追蹤的原生渲染畫面,RTX 5090 執行只有 Upscaling 解析度放大的 DLSS 2 Quality 畫質模式,性能可提升兩成至五成不等。
若在畫質模式搭配生成至 2 倍畫格的 DLSS 3,幾乎可達 2 倍以上性能,《黑神話:悟空》(Black Myth: Wukong)甚至創出 3.1 倍性能
如若再加上可生成至 4 倍畫格的 DLSS 4,畫質模式至少有 6 倍性能,《星際大戰:亡命之徒》(Star Wars Outlaws)甚至創出近 7 倍效能。
另一方面,以 RTX 4090 為基準,RTX 5090 於 DLSS 2 / DLSS 3 遊戲平均成長約 35% 性能。若運行 DLSS 4 遊戲,RTX 5090 性能可達 RTX 4090 的 2 倍以上,《心靈殺手2》(Alan Wake 2)甚至超過 2.5 倍。
DLSS 4
DLSS 4 是 RTX 50 系列的最重要特色,最多可在 2 張原生畫格之間額外生成 3 張畫格,總數可達原生畫格的 4 倍。
在這幾款支援 DLSS 4 的遊戲測試中,若不使用 DLSS 的 Upscaling 解析度放大功能,僅以原生 100% 解析度搭配 4 倍畫格生成,RTX 5090 平均性能可達原生渲染畫面的 3.4 倍,最高在《星際大戰:亡命之徒》取得近 4 倍性能。
如搭配 DLSS 畫質模式,使用 66% 原始解析度的畫面來放大,則 RTX 5090 平均 可取得原生 100% 解析度渲染畫面的約 5.4 倍性能,《星際大戰:亡命之徒》達 6.8 倍,《電馭叛客 2077》(Cyberpunk 2077)和《心靈殺手2》也有 6 倍左右。
若進一部調整至 DLSS 效能模式,以 50% 原始解析度的畫面來放大,則 RTX 5090 可取得原生 100% 解析度渲染畫面的近 7 倍效能,《電馭叛客 2077》、《心靈殺手2》分別取得 8.3 倍、7.8 倍效能,《星際大戰:亡命之徒》甚至有 8.6 倍。
功耗與溫度
軟體 API 回報的功耗就如同官方宣告,大約是 570W 左右。若使用 NVIDIA PCAT 功耗分析工具偵測 12V-2×6 電源端子與 PCIe 插槽,則測得全卡最高功耗達 611W。
這時不得不佩服 NVIDIA Founders Edition 創始版工藝,即便功耗熱量高達 600W,透過 Double Flow Through 設計搭配 3D 均熱板、熱導管與綿密鰭片構成的雙槽散熱器,照樣能以低噪音方式解掉。滿載風扇轉速與三槽厚的 RTX 4090 創始版差不多,噪音不會超過系統風扇。
總結
從以上實測來看,NVIDIA GeForce RTX 5090 在沒有 DLSS 4 的狀態下,就已領先前代卡王 RTX 4090 約三成,若搭上 DLSS 4,最高性能可達 RTX 4090 的 2.5 倍。
DLSS 4 確實是非常兇猛的功能,生成 4 倍畫格就讓效能至少提升至 3 ~ 4 倍,再疊加效能模式的 Upscaling 解析度放大功能甚至可讓畫面流暢度達到原生解析度的 8 倍,於 4K 解析度環境下跑出超過 240 fps,即便是畫質模式,流暢度也達 200 fps 以上,很適合 2024 年起普及的 4K 240 Hz OLED 電競螢幕。
再者,RTX 5090 支援 DLSS 最新版的 Transformer Model,生成的畫面重影減少、像素穩定性更高,動態清晰度有著顯著提升。
綜觀而言,GeForce RTX 5090 成為當今卡王已無庸置疑,再加上 Founders Edition 創始版厚度僅前代的 3 分之 2,效能密度更令人嘆為觀止,不得不佩服 NVIDIA 的設計工藝。
在中國無供應標準版 RTX 5090 顯卡的情況下,台灣消費者唯一需要擔心的是,能否能順利地用原價購買到 RTX 5090。