有没有什么办法,让所有block都执行完毕了,在操作啊!除了开启一个新的kernel?

有没有什么办法,让所有block都执行完毕了,在操作啊!除了开启一个新的kernel?

upupup

顶一下,求指教

在kernel外同步????

cudaThreadSynchronize()

Blocks until the device has completed all preceding requested tasks. cudaThreadSynchronize() returns an error if one of the preceding tasks has failed.

这是一个host端的函数吧,那还不如直接换一个KERNAL。