土问CUDA指令分类及性能评测

依据执行时间的差别,目前我能想到的是加法、乘法、除法、访存指令,大虾们能不能给出一个这些指令大概所需的时间clock?或者相关资料?
另外,能不能用一个脚本统计一个kernel里上述分类指令的数量,通过其执行时间最终计算出这个kernel的复杂程度?