在一个kernel中一个长的表达式与拆分开的几个短的表达式,对IPL有没有影响呢?比如 D = A1+A2 +B1+B2+C1+C2
拆成
A=A1+A2;
B=B1+B2;
C=C1+C2;
D=A+B+C;
楼主你好,
如果你的IPL是IPC(instructions per clock)的缩写的笔误的话。
那么答案是明确的:
您后续的拆分可以提高IPC。
但你需要注意的是,对于float, A+B+C+D+E+F和你拆分后的(A+B) + (C+D) + (E+F)并不等价。可能会造成些许的结果差异。如果您的结果要严重依赖顺序的话。请您不要拆分。
请您知晓这点。
不好意思 我笔误了 是IPC 谢谢横版主