线程块由sm执行还是sp执行?

手册上说一个sm可并发执行多达 8 个线程块,而sm一般包含8个sp,那是否意味着1个sp可以执行1个线程块?

由于sm的SIMT 单元以32个并行线程为一组来创建、管理、调度和执行线程,那1个sp执行多少个线程?2个吗?

糊涂了,请大家指点,谢谢!

不能这样想,块就是由SM内SP共同执行的,可以说SM是GPU的最小计算单元,而不是SP。你还没有理解CUDA的执行模型,可以看一下编程指南第四章

[ 本帖最后由 yyfn风辰 于 2010-5-26 08:36 编辑 ]

LS两位的都不完全正确

那楼上的给个正确的解答。??

这个方面手册已经写的很清楚了,只是每个人的理解不同,这不是简单几句说的清楚的,如果想详细了解,加我QQ:295553381

[ 本帖最后由 cyrosly 于 2010-5-26 14:07 编辑 ]