如何统计最终编译出的kernel的local memory使用量

以前看资料的时候,看到过可以在vs编译器输出里面看到寄存器的使用量,cmem和lmem的使用量,但是在实际的编程过程中从来没有见到过lmem这个东西,后来在论坛里面看到lmem这个东西好像被拆分为spill store和 spill load 了,如果这2个东西都为0了,是不是就是不使用lmem了?

后来,我让编译器输出ptx代码,在里面没有找到local memory的访问指令

然后,采用cuobjdump反汇编,找到了local memory的访问指令,但是指令很多,如何统计出local memory使用量呢?编译器输出的spill store和 spill load是不是就是cuobjdump反汇编出的local memory的访问指令的统计值呢?

LZ您好,如果您用NVIDIA visual profiler跑一下您的程序,会自动统计出local memory的使用量的,您不妨这样直接看看。

以及,local memory的用途并不限于register spilling。

大致如上,祝您好运!