Linux下查看所有GPU上的使用者和GPU占用情况

在执行深度学习任务的时候,经常需要查看GPU的使用情况
具体使用的命令是nvidia-smi


根据结果可以看到进程2226042在跑训练
执行以下命令:
ps -f -p 2226042
其中
UID 表示用户ID
PID 表示进程号
PPID 表示父进程号
TIME 表示执行时间
CMD 表示执行命令

查看一台服务器上所有显卡上的使用者和GPU占用情况
需要安装gpustat
pip install gpustat
安装完成后使用下面命令即可
watch -n 2 --color gpustat --c
查看完成后 Crtl +c 即可退出!


实时刷新:
watch -n 0.5 -d nvidia-smi
解决多块GPU指定的问题:
import os
# 重新标记第0块GPU,之后用0即表示第一块GPU
os.environ['CUDA_VISIBLE_DEVICES'] = '1'
当前文件夹下有多少个文件:(不包括目录)
ls -l | grep "^-" | wc -l
查看当前磁盘空间
df -hl
