写的一个fft程序, 计算2M大小的数, 从主机拷贝到设备只花了几ms,我觉得还比较正常,计算完成后从设备把数据再拷贝回主机就一下花了6s钟,实在是吓了我一跳,没搞明白是怎么回事,以前用cufft库直接计算的时候也是2M的数,拷进拷出也就是几ms的时间,不知道怎么自己写一个程序拷个数据就要花这么长时间. 后来我把数据拷进后不经过计算再原封不动的拷出来,也只花几ms, 感觉应该是计算过后得到的数据有点问题, 会不会是跟数据存储结构或者其他因素有关呢
写的一个fft程序, 计算2M大小的数, 从主机拷贝到设备只花了几ms,我觉得还比较正常,计算完成后从设备把数据再拷贝回主机就一下花了6s钟,实在是吓了我一跳,没搞明白是怎么回事,以前用cufft库直接计算的时候也是2M的数,拷进拷出也就是几ms的时间,不知道怎么自己写一个程序拷个数据就要花这么长时间. 后来我把数据拷进后不经过计算再原封不动的拷出来,也只花几ms, 感觉应该是计算过后得到的数据有点问题, 会不会是跟数据存储结构或者其他因素有关呢