斑竹好,如下是程序的编译信息
ptxas : info : 0 bytes gmem, 8576 bytes cmem[2] (任务 ID: 19)
1> ptxas : info : Compiling entry function ‘_Z4echoPdP11gpu_Complexddd’ for ‘sm_21’ (任务 ID: 19)
1> ptxas : info : Function properties for _Z4echoPdP11gpu_Complexddd (任务 ID: 19)
1> 16 bytes stack frame, 0 bytes spill stores, 0 bytes spill loads (任务 ID: 19)
1> ptxas : info : Used 52 registers, 120 bytes cumulative stack size, 64 bytes cmem[0] (任务 ID: 19)
是说使用了52B 的寄存器内存吗,根据Occupancy Calculator 计算,瓶颈在寄存器内存方面,有什么方法可以减少寄存器内存的使用?
感谢斑竹回答!