关于VISUAL PROFILER的性能分析

[attach]3412[/attach]

这个是VISUAL PROFILER的分析截图
我有两个问题,求斑竹帮忙~~
1、寄存器那里,每个线程寄存器27个,一个BLOCK有81个线程,那么每个block不应该有:2781=2187 个线程吗?为什么分析出来的是2688?
2、每个SM 活动block有6个,一个BLOCK有81个线程,那么活动的WARPS不应该是:6
81/32=15.1875(16)个吗?
为什么分析出来时18个?:2_36:

LZ您好:

因为warp是不能跨block的,所以您每个block 81个线程实际上是(81/32)向上取整=3个warp合96个threads。所以您(2)中提到的18个warp是正确的,即3 warps/block * 6 blocks=18 warps。

图中Registers/Block是2688个,考虑到根据前面的分析,每个block实际上是96threads,两者相除,得28。和图中Registers/Thread 提供的数据27相比,多1,这个可能是分配粒度造成的。

大致如此,供您参考。

祝您编码顺利~

谢谢ice斑竹,又学到了很多~~~

:handshake

novel您好:

请勿在本版对别人的帖子做无意义回复,此行为被视为灌水,本版禁水,请您注意。

好的 谢谢提醒