我用cudamemcpy进行内存拷贝,从显存拷贝到主机内存,4兆的数据,需要拷贝16MS,怎么会是这么多时间,用分页锁存技术,需要11MS,还是很多,各位有什么办法,让拷贝需要的时间少一些吗?我的PCI2.0的接口,理论带宽8GB/S,怎么可能拷贝的速度这么慢?哪位高人 指点下啊
1)基本没有办法减少时间.可能可以用sream将复制和内核执行时间重叠,但复制本身时间基本不变.
确认一下,LZ是否是一次性复制4MB的?
2)PCI-E2.0X16的接口的理论带宽8GB/S,x8接口减半,依次类推.
我也是刚开始接触~