请教一下CUDA流的概念中一些不明白的地方,谢谢指教

在同一块GPU显卡中,是不是在同一个时间内只允许运行一个内核函数,而不允许多个内核函数之间的并行?

所谓CUDA流的概念,是仅为了提供在 内存复制 和 核函数运行 这两者之间的并行吗?多个不同核函数之间的并行是无法实现的?

楼主看看这个帖子的:http://cudazone.nvidia.cn/forum/forum.php?mod=viewthread&tid=6233&extra=page%3D1

Thank you!

一般是用来计算和传输互相掩盖的。

如果每个kernel的运行规模比较小,喂不饱GPU,那么在fermi或者更新的kepler上可以通过流实现kernel的并发执行,我记得SDK里面似乎有例子,您不妨找找看。

祝您编码愉快~

好的,谢谢版主了。:slight_smile: