Tesla P100 全局内存的合并访问

由于不同的Tesla版本的计算能力不一样,对于合并访问的要求也不一样,我想问一下,合并访问是要求一个wrap还是half-warp?另外英伟达官网有没有P100在此方面的介绍?谢谢

half-warp是很早之前提出的概念,现在已经不需要再考虑了,而且目前的显卡硬件和CUDA对于访存进行了很多优化,如果不是非常注重性能可以不考虑。

好的,谢谢!