global 函数的调用是异步的,也就是说它会在设备执行完成之前返回。
这句话一直不理解,赐教。
就是说内核还没有完成,它后面的代码就已经开始执行了
是说GPU在运算完成前,就返回CPU线程,继续执行后面程序
是说和cpu的运行可以同时进行