在linux系统下,执行cuda程序时,调用一次kernel所执行的时间是多少?
貌似一下下就好了。
我在windows(x64)下的测试(普通情况硬件),fermi是大约1~5个微秒(us)可以完成一次对空kernel的启动(包括设置形状,设置参数+launch)。
我没有在其他平台此项测试的经验,考虑到楼主问的是linux, 而一般人的普遍报告是linux下的性能要稍微好一点点,我认为几个微秒依然是可供楼主多少参考的数据。
这个数据是根据经验大致估计的,如果有一个我有较为精确的数据。我将会回来更新此帖子。
好,谢谢你