飞道的博客

英伟达显卡监控工具nvtop使用方法

731人阅读  评论(0)

0 背景

在用英伟达显卡做深度学习训练或推理时,我们常用nvidia-smi指令来查看显卡的使用情况,如图所示

这种方法可以看出每张显卡内存和GPU利用率的实时情况,但看不出历史数据和变化曲线,这个时候就需要用到nvtop了。

Nvtop代表NVidia TOP,这是用于NVIDIA GPU的任务监视器。它可以处理多个GPU,并以熟悉的方式打印有关它们的信息。如图所示,很直观的显示了每张显卡的内存、GPU利用率曲线。本文对该工具的安装使用进行介绍。

1 安装方法

在Ubuntu disco (19.04) / Debian buster (stable)系统中,可以直接使用apt安装

sudo apt install nvtop

如果是在旧的系统,如ubuntu16.04等,则需要通过源码安装,方法如下


  
  1. # 安装依赖
  2. sudo apt install cmake libncurses5-dev libncursesw5-dev git
  3. # 下载源码
  4. git clone https: //github.com/Syllo/nvtop.git
  5. mkdir -p nvtop/build && cd nvtop/build
  6. cmake ..
  7. # 如果报错"Could NOT find NVML (missing: NVML_INCLUDE_DIRS)"
  8. # 则执行下边的语句,否则跳过
  9. cmake .. -DNVML_RETRIEVE_HEADER_ONLINE= True
  10. # 编译
  11. make
  12. sudo make install

2 使用方法

安装完之后,可以执行nvtop -h来查看使用方法,介绍的很详细了,如果现实全部信息,直接nvtop就可以现实出我们上边的结果


  
  1. nvtop version 1.0 .0
  2. Available options:
  3. -d --delay : Select the refresh rate ( 1 == 0.1s)
  4. -v --version : Print the version and exit
  5. -s --gpu- select : Column separated list of GPU IDs to monitor
  6. -i --gpu-ignore : Column separated list of GPU IDs to ignore
  7. -p --no-plot : Disable bar plot
  8. -C --no-color : No colors
  9. -N --no-cache : Always query the system for user names and command line information
  10. -f --freedom-unit : Use fahrenheit
  11. -E --encode-hide : Set encode/decode auto hide time in seconds ( default 30s, negative = always on screen)
  12. -h --help : Print help and exit

 

 

转载:https://blog.csdn.net/zong596568821xp/article/details/103712188
查看评论
* 以上用户言论只代表其个人观点,不代表本网站的观点或立场