kernel 里面要调用一个函数, 这个函数可以并行, 目前cuda好像没办法在kernel里面再并行运行另外一个kernel吧?
关注一下,这个问题没有研究过,学习!
这个是不能的
内核函数是复制执行的,一个线程都在根据自己的ID号在执行。现在cuda没有设计出一个线程可以再去调用内核函数。每个ID的程序在设计时暂时局部串行思考就行了。
kernal的调用需要在host执行吧,没有办法在kernal在调用kernal,只能串行了
遗憾,我也想这样,可是不行!
kernel 里面要调用一个函数, 这个函数可以并行, 目前cuda好像没办法在kernel里面再并行运行另外一个kernel吧?
关注一下,这个问题没有研究过,学习!
这个是不能的
内核函数是复制执行的,一个线程都在根据自己的ID号在执行。现在cuda没有设计出一个线程可以再去调用内核函数。每个ID的程序在设计时暂时局部串行思考就行了。
kernal的调用需要在host执行吧,没有办法在kernal在调用kernal,只能串行了
遗憾,我也想这样,可是不行!