kernel函数中如何动态分配内存

各位大侠:
小弟刚刚接触cuda,现在想用cuda做一些尝试,我想问一下,如果在kernel函数的计算过程中,需要根据实际情况,来确定分配内存的大小,也就是动态分批额内存,这时用c语言的malloc函数还管用吗?如果不管用,那么用什么函数好呢?
如您知道,还望不吝赐教。谢谢。