CUDA负责将kernel函数中的block分发到不同的SM中,这种分发方式遵循什么规律或算法呢?
请问哪位牛人知道或做过相关的测试?
CUDA负责将kernel函数中的block分发到不同的SM中,这种分发方式遵循什么规律或算法呢?
请问哪位牛人知道或做过相关的测试?
顶一下
大家都来谈谈自己的看法吧。
补漏法:
假设SM是一杯子 block是一定量的水,往每个杯子加水,直到不能再加1block的水为止,随着计算的进行 每个杯子里的水是在不断减少的,如果某个杯子能在加1block的水就补上…直至所有block的水都用完了为止
回复#5
非常谢谢。
请问这是您的个人看法,还是有确切根据?
按照“补漏法”,假设我的GPU有两个SM(SM0和SM1), 一共10个block(block0, block1, block2, …, block9)。
首先把block0-block4加到SM0中,然后把block5-block9加到SM1中, 是我这么理解的吗?
[ 本帖最后由 flysky23 于 2011-6-15 21:01 编辑 ]