关于用CUDA对矩阵做FFT

如果我想对一个M*N的矩阵做行FFT或者列FFT,及一行一行的做FFT或者一列一列的做FFT,有什么有效的方法?

CUFFT的一维FFT是可以通过batch参数同时对多列进行FFT的
如果要对多行做,可以先转置(参考transpose new)在再用CUFFT的1维FFT

有意思!!!