最近在做有图像连通域检查的项目,从网上找了篇论文“GPU加速的二值图连通域标记并行算法”,
写的挺好的,可是自己实现起来老是有问题,怎么也达不到他说的效果。
兄弟,我也看了“GPU加速的二值图连通域标记并行算法”一文,我实现了前面的大部分,后面我感觉他那篇文章存在问题。有兴趣讨论讨论
我也是,我做完标号这一步了,感觉效率没有他写的那么快
我的问题主要是纠结在一些方面:
1.全局变量Completed没法实现block间的同步(我的解决方案是循环调用kernel函数)
2.对全局内存的写操作效率太差了,占用了我大部分的运行时间(还没想到太好的办法)
不知道兄弟遇到的情况是不是跟我的类似,或者你有什么更好的处理方式,分享一下呗:D
中国的论文就是这样,看起来实现挺好的,其实根本不行
楼上也看过那篇论文?
我现在还不敢肯定的说是论文的问题,还是我实现的问题
比较困惑
没人回复,自己顶一下吧