有没有什么办法,让所有block都执行完毕了,在操作啊!除了开启一个新的kernel?
upupup
顶一下,求指教
在kernel外同步????
cudaThreadSynchronize()
Blocks until the device has completed all preceding requested tasks. cudaThreadSynchronize() returns an error if one of the preceding tasks has failed.
这是一个host端的函数吧,那还不如直接换一个KERNAL。