请教:显卡的哪些参数对计算速度影响大?

我在同一机器上测试了两款显卡: 影驰GTX670 四星黑将 和 影驰GTX570,程序是同一个程序,其中核函数的两个参数是kerl<<<1024,256>>>(x1,x2,x3)。系统是XP,内存2G。测试结果影驰GTX670四星黑将 比 影驰GTX570速度慢。 影驰GTX670 四星黑将 比 影驰GTX570 的位宽窄,其它参数都高。难道与位宽有直接关系?下面是两款显卡的参数对比和测试时间对比:

[table=50%]
[tr][td]

[table]
[tr][td=127]
芯片厂商
[/td][td=192]

NVIDIA

[/td][td=249]

NVIDIA

[/td][/tr]
[tr][td=127]

显卡芯片

[/td][td=192]

GeForce GTX 570

[/td][td=249]

GeForce GTX 670

[/td][/tr]
[tr][td=127]

显存容量

[/td][td=192]

1280MB GDDR5

[/td][td=249]

2048MB GDDR5

[/td][/tr]
[tr][td=127]

显存位宽

[/td][td=192]

320bit

[/td][td=249]

256bit

[/td][/tr]
[tr][td=127]

核心频率

[/td][td=192]

732MHz

[/td][td=249]

1006/1058MHz

[/td][/tr]
[tr][td=127]

显存频率

[/td][td=192]

3800MHz

[/td][td=249]

6008MHz

[/td][/tr]
[tr][td=127]

I/O接口

[/td][td=192]

Mini HDMI /双DVI接口

[/td][td=249]

HDMI/双DVI /DisplayPort接口

[/td][/tr]
[tr][td=127]

总线接口

[/td][td=192]

PCI Express 2.0 16X

[/td][td=249]

PCI Express 3.0 16X

[/td][/tr]
[tr][td=127]

流处理器

[/td][td=192]

480个

[/td][td=249]

1344个

[/td][/tr]
[tr][td=127]

3D API

[/td][td=192]

DirectX 11

[/td][td=249]

DirectX 11.1

[/td][/tr]
[tr][td=127]

block

[/td][td=192]

1024102464

[/td][td=249]

1024102464

[/td][/tr]
[tr][td=127]

grid

[/td][td=192]

655356553565535

[/td][td=249]

X6553565535(第一维忘了,但是比65535大)

[/td][/tr]
[tr][td=127]

程序运行时间

[/td][td=192]

5.3分钟

[/td][td=249]

6.2分钟

[/td][/tr]
[/table] [/td][td]

[/td][td]

[/td][/tr]
[/table]

LZ您好:

应该说显卡的各个指标都会影响最终结果,而具体影响的情况受程序的情况而定。鉴于您这里并无给出具体信息,所以无法进一步分析了。

祝您好运。

本帖如无进一步信息补充将被转移,感谢理解。

谢谢版主,我估计可能与具体的算法有关(算法不方便在此贴出,见谅)。应该不是流处理器越多程序运行速度越快。

LZ您好:

如果您需要评估fermi和kepler的SP的计算峰值能力,建议如下比较:

对于fermi SP数量*基础频率(上文中的732MHz)2
对于kepler SP数量
基础频率(上文中的1006MHz)

两者相比,可以得到单精度浮点数运算的一个大致峰值参考。

详细的比较还需要考虑各个架构对不同的指令有不同的吞吐量,以及其他执行情况。

对于“应该不是流处理器越多程序运行速度越快”,不能直接如此下结论,还有可能是卡在访存上,或者其他原因造成的。

大致如此,祝您好运~

谢谢!另外怎样区分显卡是fermi还是kepler架构?参数里没这一项,还是看制造工艺来区分?

LZ您好:

可以根据计算能力版本来区分,计算能力版本为2.x的为fermi架构,3.x的为kepler架构。
具体到您的硬件,570是fermi架构,670是kepler架构。
同时现有所有fermi架构的显卡都是40nm工艺的,而kepler架构的都是28nm工艺的,但这都只是他们使用了他们所在时代的对应工艺而已,可以由工艺水平辅助您推断,但不是由工艺水平确定架构设计。

大致如此,祝您好运~

感谢版主详细耐心解答!增长了不少知识,谢谢!!!

不客气的,欢迎您常来论坛~