想问一下,half-warp访问有间隔的显存时,是如何读取的? 比如16个线程读取的数据分别位于16个对齐的段,那是不是会顺序进行16次传输,每次都只读一个数据,或者每次读段里所有数据,最后只用需要的那个数据?