我有 一个十乘十的矩阵,可以分成4个4乘4 的小矩阵,起点分别是(1,1)(5,1),(1,5 )(5,5)。而每个小矩阵还有上下左右四个4乘一的单维矩阵当其边界。我把大矩阵传入这四个小矩阵及其边界。完成后对每个小矩阵同种类型的计算,把算完的值传回大矩阵。然后4个小矩阵在读大矩阵来更新其4个边界,然后再算。不过结果不好,可否有人帮忙解决。
谢谢
我有 一个十乘十的矩阵,可以分成4个4乘4 的小矩阵,起点分别是(1,1)(5,1),(1,5 )(5,5)。而每个小矩阵还有上下左右四个4乘一的单维矩阵当其边界。我把大矩阵传入这四个小矩阵及其边界。完成后对每个小矩阵同种类型的计算,把算完的值传回大矩阵。然后4个小矩阵在读大矩阵来更新其4个边界,然后再算。不过结果不好,可否有人帮忙解决。
谢谢
没看明白!不过你的数据量好像太少了
应该是划出4个66shared memory的矩阵比较符合实际
55是原来的数据 多出来的存储你的边界的数据
这样的话就可一在block内进行一个项与其上下左右的项进行运算
你的数据量太少了 所以效果不好