请教:
(1)内存和显存之间的传输速度大概多少?为什么会有那么大瓶颈呢?
(2)“GT200与主机(host)的外部接口采用PCI-E 2.0 x16,上下行数据带宽达8GB/s,由于PCI-E数据封包的影响,实际可用的带宽大约在5-6GB/s。”这不是很快吗,为什么大数量的host->device拷贝,还是那么慢?
(3)GPU的高存储器带宽又是怎么回事呢?(GT200 GPU显存带宽达到140GB/s)
请教:
(1)内存和显存之间的传输速度大概多少?为什么会有那么大瓶颈呢?
(2)“GT200与主机(host)的外部接口采用PCI-E 2.0 x16,上下行数据带宽达8GB/s,由于PCI-E数据封包的影响,实际可用的带宽大约在5-6GB/s。”这不是很快吗,为什么大数量的host->device拷贝,还是那么慢?
(3)GPU的高存储器带宽又是怎么回事呢?(GT200 GPU显存带宽达到140GB/s)
呵呵!相对于计算速度来说,CPU和GPU之间的数据传输是非常的慢的
一、的答案你在二中已经说了
三、指的是SP取数的带宽
CPU与GPU之间的数据传输慢原来是相对的啊?我拷贝一个几十M的矩阵数据,要十几秒,这样很崩溃哦。如果统计一个算法的时间,算上拷贝的话,加速比低得可怜啊!
不至于要十几秒,有点反常,你仔细看一下,呵呵!感觉十几毫秒有可能,呵呵