CUDA运算结果问题

我用CUDA来进行计算,设置的线程索引是<<<23,512>>>,与CPU计算的结果发现,只有前5120个数据是相同的,后面的数据都不相同,想知道原因是什么?我的GPU型号是Quadro P1000,SM数目是5个,如果用MX250的GPU来计算,则只有前3072个数据相同,后面数据不同,而MX250的SM有3个,不知道是否与这个有关,还是与其他的什么因素相关。