为了解决多个线程读写global memory数据冲突的问题,我试着用了__threadfence、__syncthreads、原子函数,可是都不行
最后只能在cpu中循环调用kernel函数,但是这样效率太低了
还有什么好的办法吗???
为了解决多个线程读写global memory数据冲突的问题,我试着用了__threadfence、__syncthreads、原子函数,可是都不行
最后只能在cpu中循环调用kernel函数,但是这样效率太低了
还有什么好的办法吗???
atomicExch()
已经用过了,不行啊
不行,是报错,还是正常运行,只是结果不对?
可以正常运行,就是结果不正确
要明白,那个函数实现什么功能,而你又要什么功能。