人工智能 (AI) 的出现及其随后的发展带来了技术格局的重大转变。经历这种转变的领域之一是云计算,传统的基于以太网的云网络正面临挑战,无法处理现代人工智能工作负载的计算需求。这导致了 SuperNIC 的出现,这是一种新型网络加速器,专门设计用于增强基于以太网的云中的 AI 工作负载。
超级网卡或超级网卡具有独特的功能,有别于传统的网卡(NIC)。其中包括高速数据包重新排序、高级拥塞控制、I/O 路径上的可编程计算、高能效设计和全栈 AI 优化。这些功能旨在为 GPU 到 GPU 通信提供高速网络连接,使用 RDMA over RoCE 技术,速度高达 400Gb/s。
SuperNIC 的功能在当前的 AI 环境中尤为重要,生成式 AI 和大型语言模型的出现带来了前所未有的计算需求。传统的以太网和基础网卡在设计时没有考虑到这些需求,很难跟上。另一方面,SuperNIC 专为这些现代 AI 工作负载而构建,可提供高效的数据传输、低延迟和确定性性能。
什么是SuperNIC,为什么它很重要?
SuperNIC 和数据处理单元 (DPU) 之间的比较很有趣。虽然 DPU 提供高吞吐量和低延迟的网络连接,但 SuperNIC 更进一步,专门针对加速 AI 网络进行了优化。这种优化在系统内 GPU 和 SuperNIC 之间的 1:1 比例中显而易见,这种设计选择可显著提高 AI 工作负载效率。
这项新技术的一个典型例子是 NVIDIA 的 BlueField-3 SuperNIC,这是世界上第一个用于 AI 计算的 SuperNIC。该 SuperNIC 基于 BlueField-3 网络平台,并与 Spectrum-4 以太网交换机系统集成,是旨在优化 AI 工作负载的加速计算结构的一部分。
NVIDIA BlueField-3 SuperNIC 具有多项优势,使其成为 AI 计算环境中的宝贵资产。它提供峰值的 AI 工作负载效率、一致且可预测的性能以及安全的多租户云基础架构。此外,它还提供可扩展的网络基础设施和广泛的服务器制造商支持,使其成为满足各种 AI 需求的多功能解决方案。
SuperNIC的出现标志着AI云计算演进向前迈出了重要一步。通过提供高速、高效和优化的网络加速,NVIDIA 的 BlueField-3 SuperNIC 等超级网卡有望彻底改变在基于以太网的云中处理 AI 工作负载的方式。随着人工智能领域的不断发展和演进,超级网卡在促进这一增长方面的作用无疑将变得更加突出。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun271303.html