单显卡的程序实现了,怎样实现在多显卡上执行,代码需要作哪些修改?
LZ您好:
您这个问题有些太大了,单卡的程序实现了,要改成多卡的,还需要您根据您的算法对计算工作进行具体拆分,如果有需要还得交换各卡计算的边界数据等。
这里仅就最简单的设定多卡的方法简单说一下。
您可以使用cudaSetDevice()这个函数来指定您选定的GPU,指定之后的内容都是在这个GPU上执行的,直到再次指定另外一个GPU。
您可以参阅手册和CUDA Samples中的simple MultiGPU这个例子。
祝您好运~
多谢版主大人!我试下。