GPU上内存分配问题

现在要用CUDA并行处理一个大的数据网格。50005000的,但是只是外边的10层需要进行特别计算。如果分配5005000的网格,最简单,但是这这样太耗费GPU内存。在CPU上做的时候,是用指针,内存不是线性的,不用的地方,用指针置空,但是在GPU上,这种情况如何处理?
谢谢了~~

自己先顶下~~
求救啊

如题,菜鸟问题

你可以考虑一下数组指针,比如每个数组元素存储一行或一列,希望对你有用,呵呵!

那我分配内存的时候用哪个函数呢?

当然是cudaMalloc,只是多分配几次,呵呵!

我也不是很清楚,我是来打酱油的
呵呵
顺路学习学习