一个代码

include

global void add( int a, int b, int *c ) {
*c = a+b;
}

int main( void ) {
int c;
int dev_c;
cudaMalloc( (void
*)&dev_c, sizeof(int) );

add<<<1,1>>>(2, 7, dev_c);

cudaMemcpy(&c,dev_c, sizeof(int), cudaMemcpyDeviceToHost );
printf(“2+7=%d\n”,c);
cudaFree( dev_c );

return 0;
}
这个运算结果为什么不是9

为什么我这边运行结果没有问题?