CUDA关于图像处理的编程中block设置的问题

问题一: CUDA 中block的大小有什么限制吗?假如我设置thread的大小为16*16,那么把block设置为(Width/16,Height/16),
(其中Width,Height非别为图像的宽和高),但是我一直觉得假如图像的宽和高很大的话,那么block中的值可能很大,就有
可能超出了block的范围。

请问各位朋友会不会出现block超限的问题,或者,有没有别的设置block的办法?

谢谢各位了!

问题二: CUDA 中的device 中支持float, double,long型的数据吗?