请教此类问题适不适合用cuda作?

问题:
现在有一个global一维数组A,其每个元素都是由每个block中的相应线程计算后得到的结果。但是有些线程得到的结果经过判断不应该要,也就是不要写入到A中(相应元素仍保持初始值),而有些线程得到的结果经过判断可以写入到A中。如果这样做了,A中的数据有些是无效数据,对于以后的进一步处理就不好处理了;如果还想使A保证全部元素都是按序的有效数据,该如何解决?或者说这种问题本身就不适合用cuda解决?谢谢了!