CUDA如何减少线程中寄存器的使用量

CUDA如何减少线程中寄存器的使用量,有哪些方法呢?谢谢