小数组排序效率问题

小数组,因为有挺多这样的小数组要排序,比如只适用于一个block的,哪种GPU并行排序算法效率高?而且SDK例程上很多都是只对2^n数目的数组排序,针对一般数目的有哪些比较适合上述要求?

:slight_smile: 经典排序,查找,二叉树

搜了搜,似乎没有二叉树的CUDA实现

cuda简单迭代法试试呢