最近开始使用shared memory加速,但是用起来还是没那么简单的
当然,最后的结果是没有结果,计算溢出,NAN
有这么几个问题想同大家交流一下
(1)一个有些奇怪的现象: nvcc -o efm EFM.cu 的速度
之前nvcc的时候,实际上是比较慢的,要过个一二十秒钟才能完成,可是现在nvcc却十分快,一点不带卡的,瞬间完成,这是不是就不靠谱??
其余的以后再说。。。。
就这个问题,正常否?
还有,使用shared memory时,nvcc需要什么特别的选项么?
最近开始使用shared memory加速,但是用起来还是没那么简单的
当然,最后的结果是没有结果,计算溢出,NAN
有这么几个问题想同大家交流一下
(1)一个有些奇怪的现象: nvcc -o efm EFM.cu 的速度
之前nvcc的时候,实际上是比较慢的,要过个一二十秒钟才能完成,可是现在nvcc却十分快,一点不带卡的,瞬间完成,这是不是就不靠谱??
其余的以后再说。。。。
就这个问题,正常否?
还有,使用shared memory时,nvcc需要什么特别的选项么?
第一次编译的时候当然慢,只有如果没有改动而再次编译的时候就瞬间完成是正常的。当你改动一下,再编译就又会慢下来。
使用shared memory时候不需要特别的选项
这个知道,我说的就是初次编译的时候就很慢。。。