cc3.5dynamic parallelism疑惑

GTX TITAN 请问nsight支持dynamic parallism调试吗? 如果计算能力到3.5,每块卡对应多少个gird?

LZ您好:

1:Geforce TITAN支持 dynamic parallelism。
2:您可以升级到最新版的CUDA Toolkit和nsight来实现对dynamic parallelism的调试,CUDA 5.5+nsight 3.1是支持的。

刚才点错发出了,现在继续:

计算能力3.5的GPU,根据手册说法,同时执行的kernel数量是32。以及对kernel的线程规模有一定要求。

但是,在DP中,这一般并不成为一个制约因素,因为您不同线程启动的kernel可以在不同时间执行,默认在device端可以启动而没有完成的kernel数量是2048个;而如果是从host端启动(当然此时就不是DP了)是没有数量限制的。

大致如此,祝您好运~