Ampere架構NVIDIA A100 GPU正式亮相,確認發行GeForce產品線

NVIDIA A100

 

NVIDIA 於 GTC 2020(GPU 技術大會)正式發表 A100 Tensor 核心 GPU,為 Ampere 架構首次亮相,採用台積電 7nm 製程,搭配 HBM2e(第 3 代 HBM2)記憶體,專為人工智慧、資料分析和高效能運算而設計。總裁黃仁勳則在訪談中證實,該架構也會發行消費級的 GeForce 產品線。

 

NVIDIA 資料中心 GPU 系列規格

產品 A100 Tesla V100s Tesla V100 Tesla V100
晶片代號 GA100 GV100 GV100 GP100
製程 7nm 12nm 12nm 16nm
晶圓面積 826 mm^2 815 mm^2 815 mm^2 610 mm^2
電晶體數量 540 億 211 億 211 億 153 億
SM 數量 108 80 80 56
CUDA 核心數 6912 5120 5120 3840
Tensor 核心數 432 640 640 N/A
半精度浮點效能 78 TeraFLOPS 32.8 TeraFLOPS 31.4 TeraFLOPS 21.2 TeraFLOPS
單精度浮點效能 19.5 TeraFLOPS 16.4 TeraFLOPS 15.7 TeraFLOPS 10.6 TeraFLOPS
雙精度浮點效能 9.7 TeraFLOPS 8.2 TeraFLOPS 7.8 TeraFLOPS 5.3 TeraFLOPS
Boost 時脈 1410 MHz 1601 MHz 1533 MHz 1480MHz
記憶體形式 40GB HBM2e 32GB HBM2 16/32GB HBM2 16GB HBM2
記憶體介面 5120-bit 4096-bit 4096-bit 4096-bit
等效記憶體速率 2430 MHz 2214 MHz 1760 MHz 1408 MHz
記憶體頻寬 1134 GB/s 1134 GB/s 900 GB/s 721 GB/s
TDP 400W 250W 300W 300W
封裝形式 SXM4 / PCIe 4.0 PCIe 3.0 SXM2 / PCIe 3.0 SXM

 

NVIDIA A100 GPU
NVIDIA A100 GPU

 

NVIDIA A100 GPU 內建第 3 代 Tenseor 核心,引進全新的 Tensor Float (TF32) 數據格式,可在完全不變更程式碼的情況下,提供比上一代產品高 20 倍的效能,深度學習訓練和深度學習推論效能則分別提升至上一代的 6 倍/7 倍。

 

據外媒 MarketWatch 報導,雖然 NVIDIA 從未正式發表有關 Ampere 架構的 GeForce 產品線消息,然而媒體於 GTC 2020 會前訪談中提問企業和消費者應用 Ampere 的方法是否有其區別時,黃仁勳回答道:「架構存在著大量的重疊,但形式則無。」相當於片面證實 GeForce 產品線將導入 Ampere 架構。

 

NVIDIA DGX A100
NVIDIA DGX A100

 

會中也同步發表搭載 NVIDIA A100 GPU 的超級電腦 NVIDIA DGX A100,可提供高達 10 PetaOPS 的 INT8、5 PetaFLOPS 的半精度浮點、2.5 PetaFLOPS 的 Tensor Float (TF32),以及 156 TeraFLOPS 的雙精度浮點效能,售 US$199000。

 

NVIDIA GTC 2020
由於 DGX A100 效能極高,可大量節省部署成本,總裁黃仁勳甚至表示:「買越多,省越多!」

推薦電競新聞

繼續閱讀
Source Ampere架構NVIDIA A100 GPU正式亮相,確認發行GeForce產品線 https://www.4gamers.com.tw/news/detail/43145/nvidia-announces-a100-and-confirms-ampere-architecture-to-launch-under-geforce-series……