衡量并行算法的性能是加速比,那么gpu并行算法以及cpu串行算法的时间如何测定?
对于普通的host代码片段,您可以使用1,2这2种方式;
以及对于kernel, 您可以使用1、2、3这三种方式。
如下:
(1)QueryPerformanceCounter()(windows),
(2)或者gettimeofday()(nix),
(3)或者cudaEventElapsedTime()(windows和nix都可以)来测定。
前2者将使用host端的时钟源(一般情况下是High Performance Event Counter)
后1者可能使用GPU端的时钟源。
谢谢帮助,我试一下:)