CUDA 3.0发布了,大家比较喜欢哪些新特性?
费米架构支持:
支持本地64位GPU
支持多个复制引擎
错误检测与纠正报告
并发内核执行
费米支持cuda-gdb硬件调试
费米上的visualprofiler支持CUDAC和OpenCL的硬件取样
支持C++类继承和模板继承以提升生产力
CUDA 3.0发布了,大家比较喜欢哪些新特性?
费米架构支持:
支持本地64位GPU
支持多个复制引擎
错误检测与纠正报告
并发内核执行
费米支持cuda-gdb硬件调试
费米上的visualprofiler支持CUDAC和OpenCL的硬件取样
支持C++类继承和模板继承以提升生产力
错误检测与纠正吧
支持opengl的纹理
ISA 2.0(不过没有放出手册);函数指针(但是不支持),想来也是如此,否则设备函数就可以支持递归调用了,那么fermi的设计难度会更大;更高效的双精度支持
[ 本帖最后由 cyrosly 于 2010-3-23 01:58 编辑 ]
这个可以使用函数对象来支持,呵呵!
[
很遗憾,并不是所有情况下都适用,举个简单的例子,假如想让偶数THREAD进行加计算,奇数THREAD进行减计算
用函数指针可以很容易实现:
z=( *entry[ threadIdx.x&1u ] )( x, y );
那么你如何用函数对象在不使用条件分支的情况下实现
[ 本帖最后由 cyrosly 于 2010-3-23 10:51 编辑 ]
把线程ID当成一个参数传进去呗!当然你用函数指针同样有分支啊!呵呵!欢迎指正!