CPU与GPU计算结果在第16位有效数字处有偏差

本人最近运用CUDA技术写了一个迭代,每次迭代的结果都在第16位有效数字处与CPU产生偏差,虽然较小,但对后需处理有一定影响,怎么做到CPU与GPU计算结果统一呢,求解。

:‘(:’(:‘(:’(:‘(:’(:‘(:’(

我也是初学者,您是用单精度进行计算的吗?如果是的话,可以试试双精度