CUDA程序设计

请问:
在 CUDA 的 核函数(自己编写的核函数) 运行的同时,还可以从CPU上复制数据至GPU吗?
也就是 自己编写的CUDA核函数 可否 与 主机设备间的数据复制函数 cudaMemcpy() 同时运行?

LZ您好:

这个是可以的,但是有一些先决条件:
1:要使用异步版本的复制函数cudaMemcpyAsync()。
2:host端的内存需要是page-locked memory。
3:您的kernel和cudaMemcpyAsync()需要在不同的stream中,并且都不能在default stream中。
4:请尽量使用Tesla计算卡和TCC驱动模式,geforce卡在不同版本的驱动下异步特性会受到一些限制。
5:请尽量使用kepler核心计算能力为3.5的Tesla计算卡,其Hyper Q技术有助于尽量挖掘kernel和copy之间的并行关系。

大致如此,祝您编码顺利~

嗯,明白了。谢谢版主,最近有事出去了,所以今天才回复您!:slight_smile:

不客气的,欢迎您常来论坛~

:lol嗯,版主!