CUDA 运算库里有个_sad(x,y,z)函数的问题

CUDA 运算库里有个_sad(x,y,z),求X与Y的绝对值之差后,在与z相加。这个_sad函数内部做了同步处理了吗?如果多个线程同时进行这个操作。我现现在有一块矩阵,想求这块矩阵内的所有sad值,现在就是不确定最后与z相加时是否是同步的,我这里设z是一个共享的变量。会不会出现不同步的情况?