cuda支持全局同步不

cuda支持全局同步不?我写的kernel里面有循环,每次循环结束后都需要全局同步一下,然后开始下一循环。貌似threadfence无法达成这个效果啊