已删
LZ您好:
大致看过您的代码,您的代码似乎基本上是直接从CPU代码复制过来的,目测有大量的问题。请您逐步骤地加以改写。否则您即使修正了访存越界,结果应该也不对的。
以及您可以使用nsight调试,可以快速找到访存越界的位置。
大致如此,祝您调试顺利~
比如说您的明显问题有:
1:初始化shared memory做了很多无用功+没有线程同步。
2:shared memory和global memory多线程累加没有用原子操作。
请您注意修改。
祝您调试顺利~
谢谢解答,我是直接从C中改的,看来是问题很多啊。我再认真设计下。