[attach]3412[/attach]
这个是VISUAL PROFILER的分析截图
我有两个问题,求斑竹帮忙~~
1、寄存器那里,每个线程寄存器27个,一个BLOCK有81个线程,那么每个block不应该有:2781=2187 个线程吗?为什么分析出来的是2688?
2、每个SM 活动block有6个,一个BLOCK有81个线程,那么活动的WARPS不应该是:681/32=15.1875(16)个吗?
为什么分析出来时18个?:2_36:
[attach]3412[/attach]
这个是VISUAL PROFILER的分析截图
我有两个问题,求斑竹帮忙~~
1、寄存器那里,每个线程寄存器27个,一个BLOCK有81个线程,那么每个block不应该有:2781=2187 个线程吗?为什么分析出来的是2688?
2、每个SM 活动block有6个,一个BLOCK有81个线程,那么活动的WARPS不应该是:681/32=15.1875(16)个吗?
为什么分析出来时18个?:2_36:
LZ您好:
因为warp是不能跨block的,所以您每个block 81个线程实际上是(81/32)向上取整=3个warp合96个threads。所以您(2)中提到的18个warp是正确的,即3 warps/block * 6 blocks=18 warps。
图中Registers/Block是2688个,考虑到根据前面的分析,每个block实际上是96threads,两者相除,得28。和图中Registers/Thread 提供的数据27相比,多1,这个可能是分配粒度造成的。
大致如此,供您参考。
祝您编码顺利~
谢谢ice斑竹,又学到了很多~~~
:handshake
novel您好:
请勿在本版对别人的帖子做无意义回复,此行为被视为灌水,本版禁水,请您注意。
好的 谢谢提醒