显卡支持2.0, 同一程序GPU架构使用1.3编译出来的程序比 使用2.0编译出来的程序运行稍快,请问这是为什么呢,谢
2.0默认精度高, 不使用fast math等等. 而1.3默认使用低精度的运算, 自然就快了. 在<Fermi兼容手册>里面有对这个问题的详细说明.