好了,就來看看這次 GeForce RTX 4090 到底有多強吧!
創始版精美工藝深度解析
做為最當代最強的 GPU,GeForce RTX 4090 的全卡功耗來到 450W,所以無論供電或是散熱,對於創始版的設計都相當具有挑戰性。NVIDIA 對於 Ada Lovelace 架構創始版的設計指導原則是:「Less, but better.(更少,但更好。)」
從先前的開箱可以看到,GeForce RTX 4090 創始版的外觀與前代 RTX 3090 相比雖然大同小異,但細節方面確實有調整與進化。
首先是 GPU 晶片在 PCB 的位置稍微往上移動,以改善供電布局,達成相位之間的阻抗平衡。PCB 層數從 RTX 3090 創始版的 12 層,增加 2 層到 14 層,同時升級介電材料以改善 GDDR6X 記憶體的訊號。
GPU 供電相數則從原本的 16 相升級至 20 相(另有 3 相供應記憶體和其他元件,總計 23 相),以提高性能與效率。外部輸入電源輸入端子升級至符合 ATX 3.0 規範的 12VHPWR,單組 12 + 4 pin 電源最大可供應 600W。
主要散熱元件仍是均熱板,但透過把蒸發器毛細結構的厚度減少至 0.4 mm、增加粉末柱密度以降低熱阻、增加更多水量、銅底增厚至 1.0 mm 等手段,最佳化內部設計與結構強度。
且不只 GPU 晶片,這回連 GDDR6X 記憶體都能直接透過導熱材料直接接觸均熱板,導熱材料厚度也從 RTX 3090 創始版的 2.0 mm 縮減至 1.5 mm,大幅提高整體冷卻效率。
不過,單靠均熱板是不夠的,整個散熱器還是得靠熱導管串接才有效率。
RTX 4090 創始版把均熱板的覆蓋面積擴大了,所以在左側(也就是 PCB 區域)的延伸熱導管縮減至 2 根,取而代之的是延伸至右側的熱導管增加至 6 根,雖然熱導管總數量與 RTX 3090 創始版相同,但可大幅提高左右兩側散熱片的溫度均勻性。
此外,散熱鰭片間距從原本(RTX 3090 創始版)的 1.7 mm 擴大至 2.0 mm,風扇改用能夠最佳化氣流與噪音表現的全新結構,尺寸也從原本 110 mm 擴大至 116mm,這種種改動疊加起來,能夠增加 20% 風通量。風扇軸承也從原本滾珠軸承改用液態軸承,進一步降低噪音。
整體尺寸方面,RTX 4090 創始版厚度從 RTX 3090 創始版的 2.7 槽增加至完整的 3 槽,寬度不變,但長度則從 313 mm 縮短至 314 mm。
當然,做工細緻精美的陽極電鍍鋁合金外框、奔放不隱蔽的全鋁散熱片,這些 RTX 30 系列創始版的經典特色仍被完整地保留下來。
理論性能
要快速評斷 GPU 性能的最簡單方法就是看它的單精度浮點運算(FP32)能力,NVIDIA 公布 Ge Force RTX 4090 的著色算力(通常是指 FP32)為 83 TeraFLOPs,我們實測到可達 88.75 TeraFLOPs,是 RTX 3090 實測數值的 2.4 倍。
3DMark
指標性的 3DMark 評分也有一定的參考價值,尤其是其中的 GPU 分數。RTX 4090 在模擬 WQHD 1440p 解析度 DirectX 12 遊戲的 Time Spy 測試中取得的 GPU 分數達 RTX 3090 的 1.8 倍,4K UHD 解析度 Time Spy Extreme 測試的 GPU 分數甚至逼近 1.9 倍。
而模擬光線追蹤遊戲的 Port Royal 測試中,RTX 4090 的性能達到 RTX 3090 的 1.92 倍。若是單看光線追蹤的運算能力,RTX 4090 甚至是 RTX 3090 的 2.4 倍。
由於 RTX 4090 支援的 DLSS 3 導入了 AI 補幀技術,因此在 Performance 模式下,可達成原生畫面的 3 倍幀率表現。RTX 3090 因為只支援 DLSS 2,Performance 模式下的幀率只擴展到 2.57 倍。而 RTX 4090 搭 DLSS 3 的總幀率則是 RTX 3090 搭 DLSS 2 的 2.26 倍。
傳統光柵化遊戲
從實測結果可以看到,在不套用光線追蹤、DLSS 等特效的傳統光柵化渲染遊戲中,RTX 4090 於 4K 2160p 解析度的平均 fps 至少是 RTX 3090 的 1.6 倍,最高在《刺客任務 3》(Hitman 3)取得 1.94 倍佳績,總平均也有 1.72 倍。
解析度調降 WQHD 1440p 時,部分遊戲會遇到 CPU 受限(CPU-bound)的狀況,所以部分實際幀率跟 RTX 3090 測得的數值差距不大,但《極限競速 地平線 5》(Forza Horizon 5)也取得 1.81 倍的優異成果,總平均則為 1.5 倍左右。
解析度再降至 Full HD 1080p 後,遇到 CPU 受限的遊戲就更多了,但仍有不少遊戲維持 50% ~ 82% 的性能增幅。
光線追蹤遊戲
在不套用 DLSS 效果的光線追蹤遊戲中,除了《極地戰嚎 6》(Far Cry 6)、《眾神殞落》(Godfall)等遊戲因為跟 AMD 緊密合作而光線追蹤效果不多,所以 4K 2160p 解析度環境的性能增幅大約只有 60% 上下,其餘遊戲 RTX 4090 的幀率平均逼近 RTX 3090 的 1.9 倍,最高在《刺客任務 3》達到 2 倍之譜。
1440p 和 1080p 解析度環境仍有少部分遊戲遭遇 CPU 受限,但其餘遊戲的性能增幅依舊亮眼。
DLSS 3
RTX 4090 最強大的獨門秘技就是 DLSS 3 的 AI 補幀特效,可以看到有支援該技術的《電馭叛客2077》(Cyberpunk 2077)和《F1 22》,其幀率表現分別是 RTX 3090 的 2.76 和 2.33 倍,非常可觀。其餘遊戲即便只開啟 DLSS 2,平均性能仍有 RTX 3090 的 1.8 倍。
值得一提的是《微軟模擬飛行》(Microsoft Flight Simulator),這套遊戲是出了名的 CPU 受限,即便遇到解析度明顯改動如 DLSS Performance 改為 DLSS Quality,甚至是從 Full HD 改至 4K UHD,改動前後的平均 FPS 都相差不大。
然而在套用 DLSS 3 的 Frame Generation 效果後,《微軟模擬飛行》的幀率直接翻成 2 倍,破除 CPU 受限的魔障。
另外從 Unreal Engine 5 的《Lyra》和 Unity 的《Enemies》等最新 Demo 中,都可看到 DLSS 3 已經成功導入這兩大遊戲引擎,且有效增加 FPS。由於市面上至少有 80% 遊戲使用這兩大遊戲引擎,這意味著未來要導入 DLSS 3 的難度並不高。
編碼與渲染
RTX 4090 導入雙編碼器,而且首度支援 AV1 編碼,我們可以看到知名的影音剪輯軟體 DaVinci Resolve 18 已可支援 RTX 4090 提供的硬體加速 AV1 編碼,甚至支援 8K 解析度。此外,由於有雙編碼器的關係,HEVC (H.256) 的編碼速度可達 RTX 3090 的 2.3 ~ 2.5 倍。
GPU 渲染運算方面,RTX 4090 的性能也可達 RTX 3090 的 1.7 ~ 2.1 倍。
功耗與溫度
功耗方面,RTX 4090 創始版就是穩穩的 450W,NVIDIA PCAT 工具測得瞬間最高是 454W。RTX 3090 創始版則是平均 350W 但可測得瞬間最高 422W。
雖然整體功耗增加 100W,但在前面提到的供電與散熱改進下,RTX 4090 創始版的 GPU 最高溫僅 66.2°C,只比 RTX 3090 創始版低了 1.2°C。
更重要的是,RTX 3090 創始版過往被詬病 GDDR6X 記憶體溫度過高的情況已不復見,RTX 4090 創始版記憶體最高溫僅 76°C,比 RTX 3090 創始版低了 24°C!
至於風扇轉速雖然稍微提高了一些,但在構造和軸承調整後,整體噪音表現差不多,即便是長時間燒機的滿速狀態仍很安靜。
總結
不得不說,從沒想過兩世代旗艦 GPU 的性能增幅跨度可以這麼大。在光線追蹤和 DLSS 這些 NVIDIA 強項特效都不開的情況下,GeForce RTX 4090 就至少是前一代旗艦 RTX 3090 的 1.6 倍性能,最高甚至有 1.9 倍。如果在加上光線追蹤、DLSS 3 等特效,性能直接翻到接近 3 倍之譜。
DLSS 3 是 RTX 40 系列的獨門絕技,AI 補幀甚至可為 CPU 受限的遊戲大幅增加幀率,再加上整合進 DLSS 3 的 Reflex 功能減少系統延遲,可以帶來更流暢的遊戲體驗。目前已有 35 款遊戲/程式在 RTX 4090 發售當日(10 月 12 日)支援 DLSS 3。
更值得讚許的是,RTX 4090 在光線追蹤和 DLSS 都開啟的情況下,4K 解析度環境的遊戲平均 FPS 已可破百,這才是 4K 遊戲該有的尊爵體驗。
當然,隨著 ATX 3.0 規範的 12VHPWR 電源端子導入,我們強烈建議使用新式的電源供應器,因為只需要單一條模組線材,就能輸出高達 600W 的電力,相較於如同串肉粽般的轉接線,不僅美觀,更能提供良好的風通環境。
雖然 GeForce RTX 4090 創始版的定價 US$ 1599(未稅)只比 RTX 3090 創始版增加了 100 美元,但礙於匯率瘋漲,台灣的含稅售價來到 NT$ 56990,入手壓力增加不少。但話說回來,如果你真的想擁有 4K 光追遊戲幀率破百的尊爵體驗,這筆錢絕對花得值得!