另外,我的C2070开TCC,跑我写的代码(主要是32位整数计算和双精度浮点数计算),只比GTX580快30~40%左右;不开TCC,比GTX580还慢一点点。不知道是什么原因?
(1)关于您的GPU-Z产品的显示问题,我建议您咨询Tech PowerUP媒体集团。本论坛不对此软件进行技术支持。
(2)为何您的kernel(您称其为主要以int32_t和double计算为主)的性能,会最多只比同样拥有512 SP的双精度不行GTX580快30%-40%,甚至可能基本差不多速度, 我想可能的原因如下:
(1)您的发挥C2070优势的运算不多(例如double), 而int两者一样。所以导致只快30%左右。
(2)为何WDDM驱动下,同样的代码却失去了30%的加速,而速度差不多,这个我就不懂了,建议咨询其他版主/会员。
说一点,C2070(sm_20)和GTX580(sm_20)的主要区别在于,
(1)前者double比后者快4倍(折算到每SP,折算到同样频率)。但如果你只用int较多,或者其他指令较多,那么优势则不明显。
(2)其他特性还有global memory ECC支持,可以开启2个copy engine, 以及peer access。
如果你不能发挥(1)和(2)的卡的优势,那么实际上它和GTX580差别不大的。
建议楼主自我看看代码?
谢谢!!!