小数组,因为有挺多这样的小数组要排序,比如只适用于一个block的,哪种GPU并行排序算法效率高?而且SDK例程上很多都是只对2^n数目的数组排序,针对一般数目的有哪些比较适合上述要求?
经典排序,查找,二叉树
搜了搜,似乎没有二叉树的CUDA实现
cuda简单迭代法试试呢