CUDA能实现堆栈操作吗

CUDA能实现堆栈操作吗
堆栈是否能在一个block内执行,CUDA里有没有类似临界区的事物?

目前的GPU不能,不过感觉Fermi应当可以。