CUDA中使用CULA库求逆问题

在使用CULA进行乘法和求逆计算时,乘法计算并未出现问题,但是求逆时首先进行第一步LU分解的时候出现了访问冲突的问题(如图片中所示),然后我进行了大量的实验,发现了下面的几个问题:
1、在我笔记本上(Windows7, Geforce 610M ),程序并未出现任何问题(double数据类型),可以直接跑通,并且最后得到正确的结果
2、在另外一台台式机(Windows10, Gtx1060),程序在分解的时候报错(double数据类型),如下图所示,另外在将矩阵大小设置较小时(小于等于23),并未报错,再大就直接报错了
3、在上面的1060台式机上面,将数据类型由double变成float类型之后,程序可以跑通,但是结果在进行求逆之后与正确的结果相比,偏差特别大
4、以为是系统的问题,但是在另外的一个台式机上(Windows7, 750)同样适用double数据的类型,但是出现同样的错误,有打算把win10的系统重装下,但并不知道重装后是不是还有这样的问题,所以暂时还并未实行
5、Windows 10;cuda版本8.0;VS 2015;CULA R18

不知道为什么无法上传图片,把错误信息打印出来如下:
test.exe中的0x010244ac处有未经处理的异常:0xC0000005:读取位置0x0000000000000478时发生访问冲突

之前Win10的提示里面说是在(lapack.dll)中的错误,
现在关键是不清楚错误处在什么地方,望各位大神能给点相关建议,
感谢~

看不见图,单从错误上貌似是越界访问。CULA已经很久没更新了,对于新的显卡可能会产生不支持,如GTX1060,建议采用cuSolver