global memory读写冲突的问题 请各位大牛帮忙

为了解决多个线程读写global memory数据冲突的问题,我试着用了__threadfence、__syncthreads、原子函数,可是都不行
最后只能在cpu中循环调用kernel函数,但是这样效率太低了

还有什么好的办法吗???

atomicExch()

已经用过了,不行啊

不行,是报错,还是正常运行,只是结果不对?

可以正常运行,就是结果不正确

要明白,那个函数实现什么功能,而你又要什么功能。