为啥cudamalloc的执行时间几乎每次一样的 而且与分配空间大小无关
[
很多内存分配算法是O(1)时间复杂度的…比如TLSF算法…
考虑到cuda的内存分配是被context隔离的, 而且一个context只能同时进行一个分配, context内不需要锁…很可能cudaMalloc使用了类似的算法…
为啥cudamalloc的执行时间几乎每次一样的 而且与分配空间大小无关
[
很多内存分配算法是O(1)时间复杂度的…比如TLSF算法…
考虑到cuda的内存分配是被context隔离的, 而且一个context只能同时进行一个分配, context内不需要锁…很可能cudaMalloc使用了类似的算法…