怎样把一个大矩阵放入显卡内存呀

显卡是9500GT,显存应该有1G
用cudamalloc 为什么最大只能申请128M的空间呀,有什么办法申请更大的空间吗