英特尔连夜发布了 oneDNN 3.0 作为这个开源项目的最新主要版本,用于协助构建深度学习应用程序。这个 oneAPI 软件组件已经可以被 PyTorch、ONNX、MATLAB 和其他著名软件使用,同时 v3.0 版本为未来的英特尔硬件做好了准备。
之前的 oneDNN 2.x 版本已经围绕第 4 代 Xeon 可扩展“Sapphire Rapids”处理器进行了优化,而据说这个 oneDNN 3.0 版本提供了改进的性能。看起来 oneDNN 3.0 对 Sapphire Rapids 来说状态良好,特别是考虑到 Sapphire Rapids 一月份宣布的时间提前。
oneDNN 3.0 版本还为下一代至强可扩展“Granite Rapids”处理器引入了 FP16 支持和其他优化。如果 oneDNN 过去的节奏是正确的,那么预计接下来的几个 oneDNN 版本将进一步优化 Granite Rapids 的神经网络库。
oneDNN 3.0 版本还提高了英特尔数据中心 GPU Max 系列“Ponte Vecchio”以及英特尔 Arc Graphics DG2/Alchemist 和英特尔数据中心 GPU Flex 系列的性能。
英特尔的 oneAPI 努力继续提供非常有用和有价值的开源软件的优秀集合。
很长一段时间以来,oneDNN 一直支持非 x86_64 CPU,而 oneDNN 3.0 也有许多 PowerPC 和 AArch64 改进。在 AArch64 方面,这个用于深度学习软件的英特尔库在可扩展矢量扩展 (SVE) 的使用方面进行了性能改进,并通过 Arm 的计算库 (ACL) 改进了 FP16 性能。在硬件方面,oneDNN 3.0 也对 AMD 和 NVIDIA GPU 的使用进行了更多改进。
除了新的硬件支持和优化之外,oneDNN 3.0 还增加了新的量化方案,带来了实验性的 Graph API,增加了对 Intel DPC++/C++ 2023.0 的支持,扩展了其线程池 API,还有其他变化。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun204880.html