穷举并行的问题

比较大规模的穷举问题,如2^16,现在想用分段穷举,比如: 有一个16元的一次多项式,现在穷举未知变元,在GPU中用一个块中的256个线程穷举,也就是每个线程做2^8个,但当线程在同时做的时候会同时读取多项式的系数值,这个会发生冲突吗,有什么更好的办法吗