强化学习技巧四:模型训练速度过慢、GPU利用率较低,CPU利用率很低问题总结与分析。 | 您所在的位置:网站首页 › cpu频率太低怎么办提升 › 强化学习技巧四:模型训练速度过慢、GPU利用率较低,CPU利用率很低问题总结与分析。 |
1.PyTorchGPU利用率较低问题原因:
在服务器端或者本地pc端, 输入nvidia-smi 来观察显卡的GPU内存占用率(Memory-Usage),显卡的GPU利用率(GPU-util),然后采用top来查看CPU的线程数(PID数)和利用率(%CPU) 这是由于模型的大小以及batch size的大小,来影响这个指标。 GPU的内存占用率主要是模型的大小,包括网络的宽度,深度,参数量,中间每一层的缓存,都会在内存中开辟空间来进行保存,所以模型本身会占用很大一部分内存。 其次是batch size的大小,也会占用影响内存占用率。batch size设置为128,与设置为256相比,内存占用率是接近于2倍关系。当你batch size设置为128,占用率为40%的话,设置为256时,此时模型的占用率约等于80%所以在模型结构固定的情况下,尽量将batch size设置大,充分利用GPU的内存。 1.2 GPU利用率问题这个是 |
CopyRight 2018-2019 实验室设备网 版权所有 |