我的在C#程序中有一个大量循环计算的过程(循环240次),此过程需要调用一个CUDA的dll库函数
现在我将该循环分成4个块(0-599,600-1199,1200-1799,1800-2399)我们知道,对于多核计算机来说,这种多线程的技术是真正意义上的并行,cpu计算部分肯定加快。因为我的每个线程都去调用GPU函数,但GPU只有一个,那么这样的多线程会不会在调用GPU时产生调用冲突?会不会使计算速度加快?加快的速度会与什么有关?
我的机器配置:4核cpu GTX260显卡
我的在C#程序中有一个大量循环计算的过程(循环240次),此过程需要调用一个CUDA的dll库函数
现在我将该循环分成4个块(0-599,600-1199,1200-1799,1800-2399)我们知道,对于多核计算机来说,这种多线程的技术是真正意义上的并行,cpu计算部分肯定加快。因为我的每个线程都去调用GPU函数,但GPU只有一个,那么这样的多线程会不会在调用GPU时产生调用冲突?会不会使计算速度加快?加快的速度会与什么有关?
我的机器配置:4核cpu GTX260显卡