浮点数计算精度问题

请问有人注意过浮点数精度在FPU和GPU上不同,造成大序列的迭代时结果完全不同的问题吗?
我是用9600gso测试的,发现有误差。这个误差在我们的算法中急剧放大。