并行问题

目前有2n个单精度的浮点数,我要从这2n个数中并行的选择出
n个最大的数,请问怎么在CUDA中实现?

双调排序网络