CUDA程序如何输出kernel函数的处理时间

小弟初学CUDA编程,用Openhero大哥的向导创建了一个Windowsapplication,但是不知道如何输出在GPU上程序执行的时间,向论坛上的各位高手求助!希望大家多提宝贵意见,谢谢!!!