搭载NVIDIA A10通用加速器的实例开放内测
-
算力升级:基于最新代次的 Ampere 架构, 显著优化图形和计算工作流程的运算效率和性能。应用推理性能相对 T4 提升2.5倍,图形性能提升2.5倍。 -
显存升级:搭配 24GB GDDR6 超高速显存,为渲染、工程模拟和其他 GPU 显存密集型工作负载提供600GB/s带宽。 -
网络性能升级:GPU 计算型 PNV4 实例,基于全新的 100G 网络架构,提供高达 100G 的超大网络带宽,是上一代次 GN7 实例网络带宽的4倍;结合网络虚拟化能力全面提升,网络包转发性能增长了240%以上,为深度学习推理、小规模训练场景下的数据吞吐传输提供超强网络性能。 -
图形处理能力升级:凭借 NVIDIA A10 全新架构的 CUDA core,RT Core 和 Tensor Core,可大幅加快电影内容的逼真渲染以及虚拟原型制作等工作负载的运行速度。在渲染场景中,腾讯云推出的GPU渲染型实例 GNV4/GNV4v 实例与 vGPU 软件结合使用,支持一键安装 vWs License,免去 GRID 驱动安装以及 License 部署一系列工作。 -
性价比升级:腾讯云 A10 实例采用腾讯云首款自研星星海 GPU 服务器,通过独具匠心的产品设计,充分利用每一寸空间,腾讯云自研星星海 GPU 服务器支持高密度的加速卡配置,结合腾讯云卓越的软件优化能力,在兼顾性能最优的同时做到更高密度,有效降低单卡成本,为客户提供更具性价比的异构计算实例。
搭载NVIDIA A100高性能计算实例开放内测
-
全面 AI 算力提升:借助于 Tensor Core, NVIDIA A100 对比当前 HCCG5v 实例在 TF32 训练场景和 INT8 推理场景均有10倍的性能提升,结合 Sparsity,训练推理性能最高可提升20倍。 -
全新 MIG 技术:利用 NVIDIA 的多实例 GPU MIG 技术,可实现资源的物理隔离和独立调度,满足资源切割的安全性和性能需求。 -
高效的集群互联:单节点内 CPU-GPU 基于 AMD Rome 平台支持 PCIe 4.0 技术,GPU-GPU 采用 NVLINK 3.0 的互联技术,多节点间采用 100G 低延时 RoCE RDMA 网络互联,时延低至2-3us。全链路加速数据传输。
内测申请
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun64831.html