Femi架构里有说kernel函数可以重叠执行了,不知道不同的kernel函数可以同时在一个SM里执行吗?还是说是硬件自己调度的,这之间没有关系?在编程指南里面没有找到答案,期待牛人帮忙解读。
LZ您好,可以推断如下:
该功能是fermi架构的特性,并无限制SM的数量。
此时在一个SM数量小于kernel数量的GPU上,只要kernel能完全并行,那就说明了不同的kernel函数可以同时在一个SM上执行。以及有人做过类似的实验,答案是肯定的。
(同时需要说明,kernel能否并行还和其他因素有关,比如kernel的发布规模(grid规模);kernel使用硬件资源的多少等)
您的问题大致说明如上,祝您好运~
谢谢ice的解答,顺便问一下既然fermi的可以,那么kepler的应该也可以吧
可以的,以及计算能力3.5的kepler(K20/K20X/TITAN)更强化了一些,还可以kernel启动kernel。
祝您编码顺利~