关于全局存储器存访的问题

我在显存中分配空间给一个二维数组(4096X2048),我在内核函数里需要对数组的一列和一行进行存访,这样不管二维数组是按列还是按行存储,都不可能同时做到合并访问。不知道有什么好的办法?

是不是没有什么好办法呀

纹理,还有就是能否用shared避免这个问题