GTX TITAN 请问nsight支持dynamic parallism调试吗? 如果计算能力到3.5,每块卡对应多少个gird?
LZ您好:
1:Geforce TITAN支持 dynamic parallelism。
2:您可以升级到最新版的CUDA Toolkit和nsight来实现对dynamic parallelism的调试,CUDA 5.5+nsight 3.1是支持的。
刚才点错发出了,现在继续:
计算能力3.5的GPU,根据手册说法,同时执行的kernel数量是32。以及对kernel的线程规模有一定要求。
但是,在DP中,这一般并不成为一个制约因素,因为您不同线程启动的kernel可以在不同时间执行,默认在device端可以启动而没有完成的kernel数量是2048个;而如果是从host端启动(当然此时就不是DP了)是没有数量限制的。
大致如此,祝您好运~