关于求解大规模二元域上的线性方程组在GPU上的实现

用高斯消元法,如何对矩阵分块

一个线程处理一行

一个线程处理一块始不行的

建议还是使用迭代解法,比如对于堆成正定的采用PCG,预处理子可以选择Jacobi, poly,incomplete cholesky。前2种并行程度高,如果条件数比较大,可以使用poly预条件子(多项式预处理器),或者也可以使用M矩阵预处理器,如果PCG要多次使用且每次系数矩阵A不变,则可以使用IC预处理器(使用CPU计算预处理阵)。类似的对非对称矩阵的GREMS方法同样适用

此外对于规则大规模二元域的问题求解我更建议使用Multigrid+GS/SSOR方法或者用AMG或者GMG作为PCG的预处理器

那么多名词,要不给点链接!?

没有链接。还有,我可不是仅仅知道这些名词而已,我都做过

[
一个线程处理一列行不行?

行,关键看你数据怎么组织,数据决定操作

还有一个问题,在内核里定义变量有什么大小限制吗,比如一些中间变量等

[

老大镇强悍!学习!!!
.

External Media

开源图形处理器体系结构论坛(OpenGPU论坛) http://www.opengpu.org/bbs/

OpenGPU Graphics Open Source community图形开源社区),聚焦领域(focus domain)包括:

牛叉

注意硬件能力就行了