开10个线程计算和100个线程的时间会差10倍吗?

开10个线程计算和100个线程的时间会差10倍吗?
如果是kernel的计算时间占主导的话,我觉得应该是两者耗时差不多。
但如果是kernel的数据传输时间占主导的话,会不会差上10倍呢?多个线程是顺序读取Global Memory中的数据吗?

1)线程是并行运行的,所以,如果访问的gmem不同的话,不是顺序读取Global Memory中的数据的,而是"一起"读取.
2)就标题问题来说,答案是不会,而是差不多一样的时间.这就是并行的威力.