Jensen Huang 刚刚结束了他的 GTC 2022 春季主题演讲,因此,NVIDIA 发布了几项激动人心的公告,解除了禁令。从 Hopper H100 到明年的 Grace CPU Superchips 再到 Jetson Orin,NVIDIA 有很多有趣的硬件和软件要在这个“#1 AI 开发者大会”上讨论。
Hopper H100
NVIDIA 宣布 Hopper H100 是他们有史以来最先进的 GPU,拥有 800 亿个晶体管。H100 适用于 AI 基础设施,基于台积电的 4N 工艺构建。H100 的额定 4000 TFLOPS FP8、2000 TFLOPS FP16、1000 TFLOPS TF32 和 60 TFLOPS 的 FP64 性能。H100 上的 HBM3 内存可提供 3 TB/s 带宽,并支持 PCI Express 5.0 连接和第 4 代 NVLink。H100 SXM 模块的 TDP 为 700 瓦。
NVIDIA 还推出了由 8 个 H100 加速器组成的 DGX H100 和具有 32 个 DGX H100 的 DGX SuperPOD,可实现 1 Exaflops 的 AI 性能。
同时,NVIDIA Eos 是 NVIDIA 的新型超级计算机,可作为 OEM 和云合作伙伴的蓝图。NVIDIA Eos 设计由 576 个 DGX H100 系统组成,在 FP8 时性能为 18 Exaflops,在 FP16 时性能为 9 EFLOPS,在 FP64 时性能为 275 PFLOPS。
144 核 Grace CPU 超级芯片
将于 2023 年上半年推出的 Grace Hopper Superchip 作为 CPU 和 GPU,专为大规模 AI 和 HPC 工作负载而设计。2023 年上半年推出的 Grace CPU Superchip 也即将推出,它提供 144 个内核,使用 LPDDR5X 系统内存,每瓦性能比传统服务器高出 2 倍。
Grace CPU Superchip 基于 Arm Neoverse CPU 内核,旨在提供“两倍于当今领先服务器处理器的内存带宽和能源效率”。Grace CPU Superchip 有两个通过 NVLink-C2C 连接的 CPU 芯片,而 Grace Hopper Superchip 是他们的第一个 CPU-GPU 集成模块。
NVIDIA Jetson Orin 开发者套件
今天还宣布了用于机器人 Edge人工智能目的的 Jetson Orin 开发工具包。Jetson AGX Orin 旨在提供 Jetson AGX Xavier 8 倍的处理能力。Jetson AGX Orin 采用 NVIDIA Ampere GPU、Arm Cortex A78AE CPU 内核和最新的加速器 IP。Jetson AGX Orin 开发者套件的售价为 1999 美元,而量产模型将于第四季度开始,售价为 399 美元。
在软件方面,他们引入了 NVIDIA Triton 作为开源超大规模模型推理解决方案。他们还更新了现有的 NVIDIA 软件包,包括 Riva 2.0、NeMo Megatron 0.9、Merlin 1.0,并更新了 NVIDIA Maxine 作为他们的音频/视频质量增强 SDK。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun141225.html