您好
刚刚开始接触cuda,编程中需要涉及大量的并行运算
一个重要的难题就是ILU-BICGSTAB的大型稀疏矩阵求解
发现cusparse中有现成的代码可以调用
但是并未发现类似kernel<grid,block>等代码
所以想请问一下,在cublas和cusparse的库中,是否已经内置了多线程的并行运算?
谢谢
LZ您好:
1:这些库无疑是多线程的,否则无法利用GPU的运算能力的。
2:这些库提供的函数可能对启动的线程形状的信息做了封装,所以您无法直接看见。(比如会自动根据处理问题的规模,当前GPU的硬件版本等,综合确定一个合适的线程规模,并自动执行,而无需您自己动手。)
3:<<<>>>的线程形状指定方式只在CUDA RUNTIME API中使用,这是一种简单明了的使用方法。而比如说driver API中,并不使用这一方法。
大致如此,供您参考。
祝您编码顺利~
非常感谢
帮大忙了
不客气的,您应该感谢NV感谢黄总出钱出力提供了各种通用的高性能计算库,并且是免费的。
祝您编码顺利~