请问如何 CPU 多线程 调用 GPU函数?

1,cuda stream,核函数调用时,如: Kernel_add<<<blocks, threads, 0, stream[i]>>>,第三个参数0是什么意思?

2,现在的CPU都是多核的,想主机4 个多线程 同时调用 GPU 上的同一个函数?

有什么好的建议,请教各们高人们了!

LZ您好:

1:这是extern指定的__shared__ 数据的大小,详情请参阅programming guide。

2:kernel函数写好以后,和其他常规的c函数一样,都可以被反复调用的,只要您保证参数的正确性。
多host线程的话,建议配合多stream一同使用。

祝您好运~