for x 20维 for y 20维 for z 80维 for p 5000维 {
offset 由x[i],y[j],z[m],p[n] 共同决定
然后一个我一些其他计算 }
转到CUDA 如何搞 如何充分利用GPU的优势? 上面是CPU的伪代码