NVIDIA 於 GTC 2020(GPU 技術大會)正式發表 A100 Tensor 核心 GPU,為 Ampere 架構首次亮相,採用台積電 7nm 製程,搭配 HBM2e(第 3 代 HBM2)記憶體,專為人工智慧、資料分析和高效能運算而設計。總裁黃仁勳則在訪談中證實,該架構也會發行消費級的 GeForce 產品線。
NVIDIA 資料中心 GPU 系列規格
產品 | A100 | Tesla V100s | Tesla V100 | Tesla V100 |
晶片代號 | GA100 | GV100 | GV100 | GP100 |
製程 | 7nm | 12nm | 12nm | 16nm |
晶圓面積 | 826 mm^2 | 815 mm^2 | 815 mm^2 | 610 mm^2 |
電晶體數量 | 540 億 | 211 億 | 211 億 | 153 億 |
SM 數量 | 108 | 80 | 80 | 56 |
CUDA 核心數 | 6912 | 5120 | 5120 | 3840 |
Tensor 核心數 | 432 | 640 | 640 | N/A |
半精度浮點效能 | 78 TeraFLOPS | 32.8 TeraFLOPS | 31.4 TeraFLOPS | 21.2 TeraFLOPS |
單精度浮點效能 | 19.5 TeraFLOPS | 16.4 TeraFLOPS | 15.7 TeraFLOPS | 10.6 TeraFLOPS |
雙精度浮點效能 | 9.7 TeraFLOPS | 8.2 TeraFLOPS | 7.8 TeraFLOPS | 5.3 TeraFLOPS |
Boost 時脈 | 1410 MHz | 1601 MHz | 1533 MHz | 1480MHz |
記憶體形式 | 40GB HBM2e | 32GB HBM2 | 16/32GB HBM2 | 16GB HBM2 |
記憶體介面 | 5120-bit | 4096-bit | 4096-bit | 4096-bit |
等效記憶體速率 | 2430 MHz | 2214 MHz | 1760 MHz | 1408 MHz |
記憶體頻寬 | 1134 GB/s | 1134 GB/s | 900 GB/s | 721 GB/s |
TDP | 400W | 250W | 300W | 300W |
封裝形式 | SXM4 / PCIe 4.0 | PCIe 3.0 | SXM2 / PCIe 3.0 | SXM |
NVIDIA A100 GPU 內建第 3 代 Tenseor 核心,引進全新的 Tensor Float (TF32) 數據格式,可在完全不變更程式碼的情況下,提供比上一代產品高 20 倍的效能,深度學習訓練和深度學習推論效能則分別提升至上一代的 6 倍/7 倍。
據外媒 MarketWatch 報導,雖然 NVIDIA 從未正式發表有關 Ampere 架構的 GeForce 產品線消息,然而媒體於 GTC 2020 會前訪談中提問企業和消費者應用 Ampere 的方法是否有其區別時,黃仁勳回答道:「架構存在著大量的重疊,但形式則無。」相當於片面證實 GeForce 產品線將導入 Ampere 架構。
會中也同步發表搭載 NVIDIA A100 GPU 的超級電腦 NVIDIA DGX A100,可提供高達 10 PetaOPS 的 INT8、5 PetaFLOPS 的半精度浮點、2.5 PetaFLOPS 的 Tensor Float (TF32),以及 156 TeraFLOPS 的雙精度浮點效能,售 US$199000。