计算能力2.x的显卡,关于shared memory的访问~求助

计算能力2.x的显卡,一个warp束访问shared memory需要分为两个半束来访问吗?
计算能力2.x的显卡,一个warp束访问global memory是整束来访问的吗?
求大神解答~~~~~

LZ您好:

1:2.x的GPU有32个shared memory的banks,每个banks4B宽度。每次是以一个warp为单位访问的。当然如果您访问的是8B宽度的数据,会自动分为两次访问。

2:是的,是整个warp访问global memory的,以及会有各级cache的缓冲。

上述内容请参阅CUDA C Programming Guide以获得详细叙述。

祝您好运~

谢谢斑竹的帮忙~~~:handshake