关于block分发的问题

CUDA负责将kernel函数中的block分发到不同的SM中,这种分发方式遵循什么规律或算法呢?

请问哪位牛人知道或做过相关的测试?

顶一下

大家都来谈谈自己的看法吧。

补漏法:
假设SM是一杯子 block是一定量的水,往每个杯子加水,直到不能再加1block的水为止,随着计算的进行 每个杯子里的水是在不断减少的,如果某个杯子能在加1block的水就补上…直至所有block的水都用完了为止

回复#5

非常谢谢。

请问这是您的个人看法,还是有确切根据?

按照“补漏法”,假设我的GPU有两个SM(SM0和SM1), 一共10个block(block0, block1, block2, …, block9)。

首先把block0-block4加到SM0中,然后把block5-block9加到SM1中, 是我这么理解的吗?

[ 本帖最后由 flysky23 于 2011-6-15 21:01 编辑 ]