CUDA计算能力

显卡支持2.0,
同一程序GPU架构使用1.3编译出来的程序比
使用2.0编译出来的程序运行稍快,请问这是为什么呢,谢

2.0默认精度高, 不使用fast math等等. 而1.3默认使用低精度的运算, 自然就快了.
在<Fermi兼容手册>里面有对这个问题的详细说明.