运行CUDA程序不响应

大家好,我之前写了一段代码,在Titan X上运行一值运行正常,但是最近换了GTX980,系统仍然是redhat6.7,出现了随机的运行过程中,整个系统突然不响应了,只有强制重启才能解决。由于不方便贴出代码就不贴了。咨询下,这个问题大体由那些原因造成,可能的解决方案有哪些,还有我又哪些诊断手段(操作系统不响应,重启后怎么诊断)?

@louis @FE.GTT

信息太少不好判断,最好能给出错误输出内容

我觉得应该是GPU运行内存超了的,改小点的

我检查下,确认下我再反馈一下处理结果。

TITAN X是12G显存,980是4G左右,容易爆显存