NVIDIA 於 COMPUTEX 2023 宣布 Grace Hopper 架構 GH200 超級晶片已進入量產階段,同時規劃了包括 DGX GH200 超級電腦在內的各種系統規劃資訊。
GH200 超級晶片囊括 72 Arm Neoverse V2 核心的 Grace CPU,並透過頻寬高達 900GB/s 的 NVIDIA NVLink-C2C 晶片互連技術,串接擁有 4 PetaFLOPS FP8 / INT8 Tensor 算力的 Hopper H100 GPU,最多可配置頻寬高達 4TB/s 的 96GB HBM3 記憶體,總功耗可根據需求和散熱配置,程式化設定 450W 至 1000W。
DGX GH200 超級電腦則是透過 NVLink 互連技術及 NVLink Switch System,串聯 32 台擁有 8 塊 GH200 超級晶片的機台,也就是將總計 256 塊 GH200 超級晶片合併成單一個超強的 GPU,提供了 1 exaFLOPS 算力與 144 TB 的共享記憶體,記憶體容量是 2020 年推出的前代 NVIDIA DGX A100 系統的近 500 倍。
Google Cloud、Meta 與微軟是首批預計可使用 DGX GH200 來探索其生成式人工智慧工作負載能力的公司。NVIDIA 還打算將 DGX GH200設計作為藍圖提供給雲端服務提供商及其他超大規模資料中心業者,以便他們能夠進一步量身設計自己最佳的基礎設施。
最後,NVIDIA 將推出使用 NVIDIA Quantum-2 InfiniBand 網路技術互相串連 4 台 DGX GH200 系統而成的超級電腦,命名為 Helios,內含 1024 個 GH200 超級晶片,預計將在今年底上線。