在同一块GPU显卡中,是不是在同一个时间内只允许运行一个内核函数,而不允许多个内核函数之间的并行?
所谓CUDA流的概念,是仅为了提供在 内存复制 和 核函数运行 这两者之间的并行吗?多个不同核函数之间的并行是无法实现的?
在同一块GPU显卡中,是不是在同一个时间内只允许运行一个内核函数,而不允许多个内核函数之间的并行?
所谓CUDA流的概念,是仅为了提供在 内存复制 和 核函数运行 这两者之间的并行吗?多个不同核函数之间的并行是无法实现的?
Thank you!
一般是用来计算和传输互相掩盖的。
如果每个kernel的运行规模比较小,喂不饱GPU,那么在fermi或者更新的kepler上可以通过流实现kernel的并发执行,我记得SDK里面似乎有例子,您不妨找找看。
祝您编码愉快~
好的,谢谢版主了。