AMD 已发布 ROCm 5.2 作为其开源 GPU 计算堆栈的最新版本。
此 Linux 开源 GPU 计算堆栈的 ROCm 5.2 新增了许多新的 HIP API、在 HIP-Clang 编译器中支持设备端内存分配 (malloc)、新的 rocWMMA 库的引入、新的测试/基准各种组件的可执行文件,rocSOLVER 的一些新例程,放弃对 rocBLAS 的胖二进制文件的 Navi 12 / GFX1011 支持,以及对设备跟踪的 OpenMP 跟踪 (OMPT) 目标支持。
新的 HIP API 添加在设备管理、内存管理的 HIP 运行时、图形管理和虚拟内存管理领域。
新的 AMD rocWMMA 库是一个 C++ 库,用于利用专用 GPU 矩阵内核加速混合精度矩阵乘法和累加 (MFMA) 运算。AMD 文档继续总结了 rocWMMA:
“rocWMMA 提供了一个 C++ API 来帮助将矩阵乘积问题分解为片段,并将它们用于在 GPU 波前并行分布的块级操作中。该 API 是 GPU 设备代码的头库,这意味着矩阵核心加速可能是直接编译到您的内核设备代码中。这可以受益于内核程序集生成中的编译器优化,并且不会产生链接到外部运行时库或必须启动单独内核的额外开销成本。
rocWMMA 作为头文件库发布,包括测试和示例项目,以验证和说明 C++ API 的示例用法。考虑到库的大量先例,GEMM 矩阵乘法被用作主要验证。然而,使用组合正在显着增长,并展示了 rocWMMA 的不同消费方式。”
ROCm 5.2 发行说明仅提及 CnetOS/RHEL 7 和 8、SUSE Linux Enterprise Server 15 SP3/SP4、Ubuntu 18.04 和 Ubuntu 20.04 作为支持的操作系统。不幸的是,ROCm 5.2 版本尚未正式支持 Ubuntu 22.04 LTS,RHEL 9.0 也不支持。尽管正如我在今天早上不久前写的那样,22.20 打包驱动程序正在准备 RHEL 9.0 和 Ubuntu 22.04 支持,因此希望下一个 ROCm 版本能够对这些新的企业 Linux 发行版提供适当的支持。
ROCm 5.2 正式支持的显卡是 GFX9、RDNA 和 CDNA 硬件。列出的 RDNA 卡只是 Radeon Pro W6800 和 Pro V620 系列。ROCm 已开始为各种 RDNA/RDNA2 消费级 GPU 工作,但您的里程可能会有所不同。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun175094.html