如题:
CUDA数组和线性存储的数组有什么区别?一般什么时候用到CUDA数组?
用到图形功能的时候,如插值,自动地址计算,另外可以用来加速随机访问,但是其值不能修改
能不能再给细说一下
和cache命中率相关的,二维数据局部性在fermi之前的GPU上是专门对于纹理内存情况。相当于”增加“有效带宽,可以这样理解:在某个线程(这里假设一个线程处理一个像素)从二维纹理图像中读取数据时,其周围的数据也会被取来,而对应于一个当前warp处理的像素矩形连同其周围的texel也会被取来(依据的是局部数据的连续性),这样当线程需要访问邻接数据或者切换当前线程时,如果数据已经在cache中,就减少了与全局内存的通信延迟(也就减小了对总线的占用而被其他线程利用,就相当于增加了一定的局部带宽)。