有人用过SIMD Video Instructions吗?

效果如何?

楼主您好,看到您的帖子了,
对您的第一个问题:答案是有。
对您的第二个问题:答案是(1)对代码执行来说,执行正确。(2)对程序员来说,感觉良好。(3)对显卡来说,它感觉无所谓。

欢迎莅临本论坛。有问题欢迎继续跟帖。

:o
过于幽默了!
我是想问这些指令的吞吐率如何?资料里面只有介绍用法,没有具体说吞吐率如何。所以不知道这些指令是不是一个噱头?如果吞吐率很低,那就没意义了。

楼主您好,手册不给予您任何关于这些指令的性能,执行单元,以及您要的吞吐率的数据。

未知来源曾经对一些video instructions做过测试,该测试表明,在sm_20上,2组SP里只有1组可以执行该系列执行,或者说,只能往一个port里issue这种指令,即在2.0上,每秒能执行的这种指令是SP数目/2 * SP频率条。该测试继续表明,在sm_21上,3组SP里只有1组能执行(或者说1个port), 性能是1/3.

该未知来源的测试还指出,虽然性能在fermi上是1/2或者1/3, 但其他SP或者LSU等可以继续执行其他指令,从而在合适的指令配比下,可以认为是全速率的。

以上内容仅供楼主songyong2参考,不代表本人或者本论坛赞同或者反对其观点。
欢迎楼主继续跟帖。

:handshake
非常感谢您的答复!
那在Kepler上面如何?按照您的说法,似乎是1/8?也就是说每SM每CLOCK一个?

这个和具体设计有关,就看有没有“未知来源”的测试验证过了。

抱歉,此未知来源没有对kepler进行测试。不一定是1/8. 也可能会更好。