CUDA 3.0发布了,大家比较喜欢哪些新特性?

CUDA 3.0发布了,大家比较喜欢哪些新特性?

费米架构支持:
支持本地64位GPU
支持多个复制引擎
错误检测与纠正报告
并发内核执行
费米支持cuda-gdb硬件调试
费米上的visualprofiler支持CUDAC和OpenCL的硬件取样
支持C++类继承和模板继承以提升生产力

错误检测与纠正吧

支持opengl的纹理

ISA 2.0(不过没有放出手册);函数指针(但是不支持),想来也是如此,否则设备函数就可以支持递归调用了,那么fermi的设计难度会更大;更高效的双精度支持

[ 本帖最后由 cyrosly 于 2010-3-23 01:58 编辑 ]

这个可以使用函数对象来支持,呵呵!

[

很遗憾,并不是所有情况下都适用,举个简单的例子,假如想让偶数THREAD进行加计算,奇数THREAD进行减计算

用函数指针可以很容易实现:

z=( *entry[ threadIdx.x&1u ] )( x, y );

那么你如何用函数对象在不使用条件分支的情况下实现

[ 本帖最后由 cyrosly 于 2010-3-23 10:51 编辑 ]

把线程ID当成一个参数传进去呗!当然你用函数指针同样有分支啊!呵呵!欢迎指正!