nvitopGPU 进程管理的一站式解决方案
nvitop 是一种交互式 NVIDIA 设备和进程监控工具。它有一个丰富多彩的信息界面,可以不断更新设备和进程的状态。作为资源监控器,它包含许多功能和选项,例如树视图、环境变量查看、进程过滤、进程指标监控等。除此之外,该软件包还为深度学习研究人员提供了 CUDA 设备选择工具nvisel
。它还提供方便的 API,允许开发人员编写自己的监控工具。
特性:
- 信息丰富且精美的输出:显示比
nvidia-smi
彩色精美方框绘图更多的信息。 - 监控模式:可以作为资源监控器运行,而不是只打印一次结果。
- 条形图和历史图
- 过程排序
- 过程过滤
- 通过击键向进程发送信号
- GPU 进程及其父进程的树视图屏幕
- 环境变量屏幕
- 帮助屏幕
- 鼠标支持
- 交互式:在监控模式下响应用户输入(来自键盘和/或鼠标)。(对比gpustat和py3nvml)
- 高效:
- 直接使用NVML Python 绑定查询设备状态,而不是解析
nvidia-smi
的输出(与nvidia-htop相比) - 支持稀疏查询并使用来自 cachetools 的 TTLCache 缓存结果(与gpustat相比)
- 使用curses库显示信息,而不是用ANSI转义代码打印(与py3nvml相比)
- 使用多线程异步收集信息并更快地响应用户输入。(与nvtop相比)
- 直接使用NVML Python 绑定查询设备状态,而不是解析
- 便携式:适用于 Linux 和 Windows。
- 使用跨平台库 psutil 获取主机进程信息,而不是在子进程中调用
ps -p <pid>
。(与nvidia-htop和py3nvml相比) - 用纯 Python 编写,易于使用
pip
安装(与nvtop相比)
- 使用跨平台库 psutil 获取主机进程信息,而不是在子进程中调用
- 可集成:易于集成到其他应用程序中,不仅仅是监控。(对比nvidia-htop和nvtop)
评论