App=new Fields**[Nx]; //Fields 为结构体
for (i=0;i<=Nx;i++)
{
App[i]=new Fields*[Ny];
for (j=0;j<=Ny;j++)
{
if (/判断条件/) //符合条件的较少,
{
App[i][j]=new Fields;
App[i][j]->zx=0;
App[i][j]->zy=0;
}
else
{
App[i][j]=NULL;
}
}
}
请问像这种方式,如果要在GPU设备上分配内存的话,应该怎么处理?我以前用的是cudamalloc((void**)&d_m,sizof()NxNy),这样太耗费内存,请问怎么合理的处理这种情况呢?