cuda内核拷贝数据的问题

cuda 在 执行过程中,要拷贝很大的数据,超过了显存的容量,有什么办法解决呢?不要说是用分成几段的方法吧?