你有没有测试运算时间和显存的分配拷贝时间?

你有没有测试运算时间和显存的分配拷贝时间?我遇到过类似的情况,当时查明是cudaMalloc()函数执行时间在不同平台下区别非常大,应该是驱动的问题。

问下风辰吧