想问一下,half-warp访问有间隔的显存时,是如何读取的?
比如16个线程读取的数据分别位于16个对齐的段,那是不是会顺序进行16次传输,每次都只读一个数据,或者每次读段里所有数据,最后只用需要的那个数据?
后者,不过存在一个削减的问题,如果用到的数据在段的前32B中,就只读32B
想问一下,half-warp访问有间隔的显存时,是如何读取的?
比如16个线程读取的数据分别位于16个对齐的段,那是不是会顺序进行16次传输,每次都只读一个数据,或者每次读段里所有数据,最后只用需要的那个数据?
后者,不过存在一个削减的问题,如果用到的数据在段的前32B中,就只读32B