global void addVect(float* a, float* b, float*c, int len);
如果通过cudaConfigureCall(),cudaSetupArgument (),和cudaLaunch()来调用addVect内核时,应该怎么调用呢,关键是如何把四个参数通过cudaSetupArgument ()传递给内核?
我不推荐您使用该函数,请直接使用<<<>>>语法来启动您的kernel。
以及,如果我没记错的话,该函数在老的手册里可能还有介绍,但现在我已经不推荐您使用了。
目前该函数存在的意义可能更大的仅限于cuda runtime内部使用。
以及,我记得该函数还有古怪的要求。
举个例子说,您有一kernel: __global__void wkf(int a, double b){…}
那么您将a放置到offset 0处,却需要将b放置在offset 8处。(注意偏移4-7没用上)。因为各个参数有他们的不同的对齐要求。
这些在老的手册里应该都有介绍,但是现在都被去掉了。所以我不建议您使用。
嗯,已解决。老师的要求啊
既然如此,那么您和BStatistics的问题我以后将不再回答。