把已有的CPU架构的程序中的一些函数修改成CUDA程序

请问,把已有的CPU架构的程序中的一些函数修改成CUDA程序,这种情况要怎么处理。
有两个问题,第一,如何在CPU的thread中调用cuda函数,cuda函数的host部分是直接写在CPU 的thread函数里面还是把host部分也要另外写个函数
第二,参数要如何传递?
这个问题困扰了很久了,也没有找到系统的说明这个问题的文档啊,希望能得到解答啊,最好能有些代码看看就好了。
菜鸟急问啊,老师给安排了个这么任务,无奈对CUDA实在不了解。