DoNews 3月23日消息(刘文轩)NVIDIA 在去年公布了首款数据中心处理器“Grace”,不过当时除了知道它会以 ARM 为核心,并使用 NVIDIA 自家的 NVLink 技术外,NVIDIA 并没有公布太多的细节。在 2022 年的 GTC 上,CEO 黄仁勋终于公开了更多 Grace 的内容,包括以其为基础的 Grace CPU 超级芯片(Superchip)。
Grace CPU 以 ARM 的 v9 架构打造,而 Grace 超级芯片更是将 Grace CPU 与 Hopper GPU 或两颗 Grace CPU 透过 NVLink 连接在一起,和苹果近期公布的 M1 Ultra 有点接近,两颗 Grace CPU 整合后的处理器有着 144 颗 ARM 核心,但能耗却控制在 500W。
同时登场的,是名为 Hopper 的新世代 GPU 架构。 Grace 和 Hopper 两个代号来源相同,都是美国知名的电脑科学家与程式设计师 Grace Hopper,可以看出两者架构的紧密关联。 Hopper 将接替 Ampere 成为新一代的高性能架构,但初期将仅供数据中心和 AI 训练等高强度的应用使用。其核心的 H100 GPU 将以台积电的 4nm 制程打造,并拥有高达 800 亿个电晶体。 Hopper 架构并将特别专精于一种名为 Transformer Engine 的特殊 Tensor core,来迎合机器学习市场在这方面的高度需求。相对 Ampere 的 A100,在一般使用情况下 H100 可以快 6 倍,如果是 Transfomer 运算的话,则能达到 16x 至 30x 的速度提升。
NVIDIA 预计在 2023 年上半起将 Grace Superchip 出货给美国能源署等单位,届时可以单购 CPU 系统,或与最多 8 个 Hopper 搭配为一个服务器整体。至于 H100,则会出现在 NVIDIA 自家的 DGX 和 DGX SuperPod 服务器中,也会通过 OEM 伙伴销售 PCIe 卡等产品。