如何在Linux系统开启Persistence Mode

描述

很多使用 NVIDIA GPU 的开发者、科研人员或者图形工作者都会遇到这样的情况:

每次运行 nvidia-smi,等待时间都比正常设备慢几秒;

PyTorch、TensorFlow 的第一行代码执行慢,GPU 初始化明显滞后;

小脚本测试、命令行推理等场景中,每次调用都像“冷启动”。

难道是驱动老旧?资源不足?系统问题?都不是——真相藏在一个容易被忽略的小设置里:Persistence Mode(持久模式)

Persistence Mode(持久模式):

GPU 驱动迟缓的幕后“真凶”

NVIDIA 为了降低系统资源占用,在 Linux 系统中默认开启了一项节能机制——GPU Idle Unloading(空闲卸载)

这意味着:

如果当前没有活跃的程序(如图形界面 X11、CUDA 应用、ML 框架等)调用 GPU,驱动就会主动退出内存。

当你再次发起调用(哪怕只是一条命令),系统需要重新加载驱动、初始化设备、建立通信栈——这个过程在老旧平台上甚至要数秒。

而 Persistence Mode 就是这个行为的“开关”。开启后,GPU 驱动常驻内存,即使系统暂时未使用显卡,也不会释放资源,从而避免每次调用都要“重新开机”。

官方定义如下:

Persistence Mode: A flag that indicates whether persistence mode is enabled for the GPU. Value is either "Enabled" or "Disabled". When enabled, the NVIDIA driver remains loaded even when no active clients exist.

为什么 Persistence Mode

对科研和 AI 场景尤其重要?

在 AI 相关工作流中,下述 GPU 的调用特性依赖 Persistence Mode:

显卡

2025 丽台(上海)信息科技有限公司

本图表由丽台科技制作,如果您有任何疑问或需要使用,

请联系丽台科技

举例:一个常用模型在 PyTorch 中冷启动约需 25 秒,热启动只需 20.5 秒,累计数十次,每天浪费时间可达数分钟。

开启 Persistence Mode 后则可实现:

nvidia-smi  秒开无延迟;

PyTorch、TensorFlow 初次调用时间大幅缩短;

多个 CUDA 脚本反复测试也无需重新初始化 GPU;

整体工作流更流畅,节省大量等待时间。

在 Linux 系统开启 Persistence Mode

执行下面的命令即可开启临时 Persistence Mode:

 

sudo nvidia-smi -pm 1

 

每次开机都得手动输入?开机自动开启才是正解。在 Linux 系统中采用 .run 包方式安装 NVIDIA GPU 驱动,可通过以下方式启用 Persistence Mode:

 

cd /usr/share/doC/NVIDIA GLX-1.0/samples
sudo tar jxvf nvidia-persistenced-init.tar.bz2
cd ./nvidia-persistenced-init
sudo ./install.sh
systemctl status nvidia-persistenced.service

 

执行完成后,以后每次启动系统,NVIDIA GPU 持久模式会自动启用,无需再次配置。

性能进阶之选:

LEADTEK WS3008 AI 一体机

现代 AI 开发中,“响应时间”就是效率,“系统阻力”就是成本。通过开启 Persistence Mode,便能将 GPU 从“冷启动拖延”中解放出来,让每一次调用都即时响应,为你的工作流加速。

如果你渴望的不仅是优化,而是全面性能飞跃,不妨考虑 LEADTEK WS3008 AI 一体机,让它成为算力系统的高效大脑。

显卡

显卡

▲ LEADTEK WS3008 AI 一体机参数

丽台科技为工作站/服务器预装 LeadOS 操作系统(定制版 Ubuntu Linux),为运行 AI 和分析工作负载提供一站式解决方案。LeadOS 包含系统专属优化和配置、附加驱动程序。它是一款稳定、经过全面测试且受支持的操作系统,可在丽台工作站/服务器上运行 AI、机器学习和分析应用程序。

LeadOS 系统特性

基于 Ubuntu 22.04,配备最新的长期 Linux 内核版本 5.15,用于最新的硬件和安全更新以及软件包更新,例如 Python 和 GCC。

包含针对 NVIDIA 优化的 Linux 内核,无需额外补丁即可支持 GPU 直接存储(GDS)。

提供对所有 NVIDIA GPU 驱动程序分支和 CUDA 工具包版本的访问。

默认使用 Ubuntu OFED,并可选择安装 NVIDIA OFED 以获得附加功能。

支持安全启动。

适配多种 NVIDIA GPU 型号。

从 Ubuntu Universe 存储库提供 Ubuntu Pro Client 的扩展安全维护(ESM)订阅。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分