1,cuda stream,核函数调用时,如: Kernel_add<<<blocks, threads, 0, stream[i]>>>,第三个参数0是什么意思?
2,现在的CPU都是多核的,想主机4 个多线程 同时调用 GPU 上的同一个函数?
有什么好的建议,请教各们高人们了!
1,cuda stream,核函数调用时,如: Kernel_add<<<blocks, threads, 0, stream[i]>>>,第三个参数0是什么意思?
2,现在的CPU都是多核的,想主机4 个多线程 同时调用 GPU 上的同一个函数?
有什么好的建议,请教各们高人们了!
LZ您好:
1:这是extern指定的__shared__ 数据的大小,详情请参阅programming guide。
2:kernel函数写好以后,和其他常规的c函数一样,都可以被反复调用的,只要您保证参数的正确性。
多host线程的话,建议配合多stream一同使用。
祝您好运~