软件流水线

大家说,怎样在CUDA使用软件流水线啊?