双warp调动机制到底优势是什么?

我看到文献中介绍:Fermi 双 warp 调度机制可以同时启动两个 warp ,
并且将每 个 warp 的一条指令分发 到 1 6 个 CUD A 内核上执行或者 是 1 6 个存取单
元或者是 4 个 SFU 。我没有想明白这样意味着有什么优势?是比单warp快2倍的作用吗?
[attach]2857[/attach]

这个应该是fermi 计算能力2.1上的双发射特性,其意图在于平衡/匹配指令发射单元的能力和计算单元/存取单元的能力。属于fermi架构的硬件特性,一般与编程无关。

祝您编码愉快~

奥,那就不去管它了~