本人新手,所以有一些比较初级的问题。。。GK100的架构每个smx有192个cuda核心,但是只有四个wrap调度器,那么一个wrap还是只有32个线程吗?如果是的话,岂不是最多只应该有32*4和cuda核心会被应用?还请求大神解答~~感激不尽:3_59:
LZ您好:
1:先修正您一个笔误,是GK110核心,官方并无GK100核心发布。以及所有的kepler架构,包括GK110,GK104,GK208等都是每SMX有192个cuda core。
2:此时一个warp仍为32threads。
3:以及,因为这4个scheduler是具备双发射能力的,虽然同时只能加载4个warp,但是在完全双发射的时候,可以将每个warp的两条不同指令(这也对应每个线程的2条指令,因为是SIMT的)发射给不同的cuda core以及SMX内的其他单元。所以,考虑双发射的话,同时最多可以发射4322=256指令(按照线程指令计算),这是高于cuda core数量的,也即发射能力是够用的。
大致如此,供您参考。
祝您编码顺利~
多谢!:3_52::3_52:
不客气的,欢迎您常来论坛。
祝您好运~