cuda | 您所在的位置:网站首页 › gpu更改ecc状态 › cuda |
即使没有其他计算任务正在运行,运行nvidia-smi时GPU利用率也可能变为非零。这与ECC无关。 那么ECC的真正含义是什么? ECC是Error Correcting Code。它不是GPU独有的。在GPU上,它是一种使用额外内存位来存储错误信息的功能,因此,如果内存子系统中发生错误(特别严重),则可以检测并报告,检测和纠正错误信息。 普通用户是否可以将ECC设置为禁用? 禁用ECC需要root权限。 关闭ECC会有什么影响? GPU应用程序可用的可用带宽和内存大小可能会增加。如果关闭ECC并发生内存子系统错误,则不会收到任何明确的通知。根据错误发生的背景,错误可能会产生任何影响范围,从完全没有影响到完全的应用程序崩溃。 我们什么时候打开它?何时关闭? 当您想要防止内存损坏错误时将其打开。如果您想获得最高性能(例如用于基准测试),或者您认为您的应用程序可以容忍内存错误(例如,您检查结果的有效性,并且您不介意重新运行因某些原因失败的应用程序),请将其关闭。 ) |
CopyRight 2018-2019 实验室设备网 版权所有 |