|
我简单说一下吧。
Windows(其实 linux 或者其他 os 亦然) 的 watchdog 作用是防止 GPU 执行某个动作陷入跑死状态,例如某个 kernel(我这里用 cuda 的说法,kernel 是指在 GPU 上执行的程序)需要超过 2 秒以上的执行时间的话,就会触发 watchdog 导致 recover,这个现象一般简称为 TDR,当然也有一些意料外的情况会导致 TDR。
正常情况下,我们不应该关闭掉 Windows 的 TDR,只有在程序排错等情况下才去关闭,因为关闭 TDR 的话,容易导致 GPU 发生意外的时候无法恢复为可用状态,例如关闭 TDR 后,有时候会导致显示器黑屏(不是每次都这样)。
|
|