今天用CUDAopenmp(2块GTX580)跑了一个简单的两向量(512*512)相加程序,发现双显卡耗费的时间比单显卡多很多,这应该是Openmp开启双卡需要耗不少时间。有没有什么方法来隐藏延迟,还有就是什么样的程序才适合用双卡(CUDAOpenmp或者多线程)来做。
今天用CUDAopenmp(2块GTX580)跑了一个简单的两向量(512*512)相加程序,发现双显卡耗费的时间比单显卡多很多,这应该是Openmp开启双卡需要耗不少时间。有没有什么方法来隐藏延迟,还有就是什么样的程序才适合用双卡(CUDAOpenmp或者多线程)来做。