由于 NVMe 驱动器太多,Google 遇到了 Linux 服务器重启太慢的问题

由于 NVMe 驱动器过多,Linux 服务器需要很长时间才能重新启动。值得庆幸的是,谷歌正在努力解决这个问题,他们的一些多驱动器服务器可能需要一分钟以上的时间让 Linux 内核执行其关闭任务,而这项工作也可能使其他用户受益,尽管不太明显。

谷歌工程师正在为 Linux 内核提出一个异步关闭接口。目前,Linux 内核在总线级别的关闭 API 是同步的,这可能会导致类似 Google 报告的问题,即单个服务器中有太多 NVMe 存储驱动器。由于关机处理期间的同步性质,每个 NVMe 驱动器可能需要大约 4.5 秒才能关机。Google 服务器现在有 16 台以上的 NVMe 设备,这可能意味着额外的一分钟关闭和重新启动阶段……使用异步关闭界面并调整 NVMe 驱动程序以使用它,它们的重新启动 – 以及最终的数量服务器停机时间 – 可以轻松减少一分钟。

image.php_-101

来自 Google 的提议补丁允许在总线级别使用可选的异步关闭接口。新接口保持与同步实现的向后兼容性。作为补丁的一部分,所有基于 PCI Express 的设备都被移动以使用异步接口,在 PCIe 级别实现更改,然后更改 NVMe 驱动程序以利用异步关闭接口。

这个提议的当前形式的异步关闭接口只有大约一百行新代码,当然,目前只有一个驱动程序在使用它。但随着现代高性能 Linux 服务器继续添加更多 NVMe 驱动器和其他 PCIe 设备,其中 Linux 内核的同步关闭接口可能意味着额外的停机时间,希望这些补丁将设法在短期内推进主线并调整更多的驱动程序以使用它。

原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun143851.html

(0)
打赏 微信扫一扫不于多少! 微信扫一扫不于多少! 支付宝扫一扫礼轻情意重 支付宝扫一扫礼轻情意重
上一篇 2022年3月29日
下一篇 2022年3月29日

相关推荐