想請問 cuMemcpyDtoD (CUdeviceptr, CUdeviceptr, unsigned int)這api
做的是 copies from device memory to device memory
我原本以為device memory間的copy不會造成cpu usage的升高
但在我的程序上發現這竟是使得cpu usage變高且運算速度變慢的原因
(會做這行的目的是在 cuvidMapVideoFrame後,對map到device memory的資料做處理)
請問這樣的結果合理嗎?! 有其它方式可解決嗎?!
謝謝