白皮书发布 | 看 NVIDIA BlueField DPU 如何让数据中心变得更加...

据估计,数据中心目前消耗的电量占全球发电量的比例略高于 1%,这一占比在美国为 1.8%,在欧洲为 2.7%。根据华为在 2015 年发布的一项研究,到 2030 年,数据中心消耗的电量占全球发电量的比例预计将上升到 8%,甚至会高达 13%。

全球数据中心面临能效挑战

由于成本上升和供电量方面的限制,能效在数据中心内变得越来越重要。最近,全球电价在不断飙升, 加上许多数据中心可以获得的供电量都有硬性限制,这就形成了一个强劲的激励因素,促使数据中心提高效率,以便通过一个数据中心来容纳更多应用、租户,并实现更高的生产力,而不是再构建或租用一个新的数据中心。

此外,云服务提供商不仅承受着持续的竞争压力,要不断降低软件即服务、平台即服务和基础设施即服务(SaaS、Paas、IaaS)的每小时租用成本,而且在许多地区还要承受不断上涨的电力成本。各种组织(服务提供商、企业和政府机构)都面临着提高能效来应对气候变化的压力,通常是通过购买更昂贵的“绿色”电力来替代火力发电产生的电力。

在节省资金、更大限度地提升每个数据中心的利用率以及应对气候变化等压力下,每个数据中心运营商都在力争提升服务器的能效。

降低数据中心电力成本的传统策略

数据中心运营商通常会采取多种策略来降低耗电量和电力成本:
[list=1]
[*]
在电力供应成本更低或供应量更丰富的地区建立新的数据中心,这种方式可以降低电力成本而非耗电量。

[*]
改善电源使用效率(PUE),这意味着更大限度地提升供应给数据中心的电力中用于实际计算设备的电力所占的百分比。不过,这本身并不能衡量或提升各个服务器的能效。

[*]
提高冷却效率,因为冷却所消耗的电量在数据中心用电量中所占的比例最高可达 30%。这可以降低冷却所需的电力,并降低 PUE 比率。

[*]
使用虚拟化、容器和可组合基础架构更大限度地提升每台服务器的工作负载利用率。

[*]
提升单台服务器的能效。

[*]
将选定的 IT 工作负载外包给公有云,或外包给电力成本更低的主机托管中心。不过,并非所有工作负载都可以外包,公有云的高能效所带来的好处也并非始终都能惠及租户。

[/list]

借助特定领域专用的处理器

来提升服务器效率

当今的数据中心依靠软件定义的基础设施来实现灵活性、可扩展性和易管理性。在典型服务器中,虚拟化、网络、存储、安全、管理和配置均由运行在服务器主 CPU 上的 VM、容器或代理程序来处理。这不仅会消耗最高可达 30% 的处理器计算资源,而且 CPU 在运行这些类型的基础设施工作负载方面效率并不高。通用 CPU 擅长处理通用单线程工作负载,并且通常是针对性能而非能效进行了优化。

使用特定领域专用的加速器有助于提升性能、降低耗电量,并释放服务器 CPU 核心来运行它们更擅长的应用。比如在运行数据中心基础设施任务方面,DPU 的效率要比通用 CPU 高得多。DPU 有专门的硬件引擎来用于加速网络、数据加密/解密、密钥管理、存储虚拟化和其他任务。此外,DPU 上的 CPU 核心通常比一般服务器 CPU 更节能,并且可以直接访问网络管线。因此,即使一些网络任务无法通过 DPU 的专用引擎来加速,DPU 核心也能比服务器 CPU 更高效地执行 SDN、遥测、深度数据包检查或其他网络任务。

通过硬件加速的 DPU 卸载来降低服务器耗电量

NVIDIA 与主要合作伙伴通力合作,在多项测试中将各种任务卸载到智能网卡或 DPU 来测试耗电量节省情况。

测试表明,通过将网络和安全任务卸载到 NVIDIA BlueField DPU,可显著提升效率。该 DPU 包含特定领域专用的加速器,这些加速器擅长执行基础设施任务处理,包括网络、存储和安全。该 DPU 还具有比 x86 CPU 更节能的 Arm CPU 核心,非常适合卸载基础设施应用的控制平面和/或 服务器虚拟化平台或容器管理软件的部分功能。

通过 DPU 卸载和节能

进一步节省成本

随着能源价格不断攀升,DPU 卸载的节电量也将不断增加。而电力价格越高,意味着从 DPU 卸载可节省的成本就更多。

通过测试发现,NVIDIA BlueField DPU 的卸载和加速功能显著节省了双向成本。卸载可释放 CPU 核心, 从而减少服务器部署数量,节省资本性支出。通过减少服务器数量,降低每台服务器的耗电量,客户能显著减少运营性支出。因此,拥有 1 万台服务器的大型数据中心三年期间可大幅节省 2600 万美元。通过使用 DPU,服务器可节省 6.3% 的资本性支出,由于较低的电力成本,运营性支出又节省了 46%。

降低服务器耗电量还可以节省额外的附加成本,因为这同时减少了配电和冷却成本。每瓦进入数据中心的电力都需要电源管理硬件,例如不间断电源、发电机(加上燃料输送和存储)和配电装置。而消耗的每一瓦电力也会转变成必须从数据中心排放出来的热量。可高达 40% 的数据中心耗电量专门用于冷却。因此,服务器端节省的每一瓦电力都会减少数据中心冷却装置所需的电量,以及供电和散热所需的资产设备数量。

DPU 卸载

是提高数据中心效率的新一波浪潮

使用适当 DPU 实现通过硬件加速的网络卸载,可大幅减少每台服务器的耗电量,从而提高服务器效率、数据中心效率,降低用电量,减少冷却负载,最终大幅降低成本。在这个能源成本不断上涨和对绿色环保 IT 基础设施需求不断增加的世界中,采用 DPU 将是大势所趋,通过它来降低数据中心的资本性支出和运营性支出,进而降低 TCO.

下载白皮书全文,进一步了解为什么在 IT 领域内能效成为一项越来越重要的指标,以及提升数据中心能效的六种主要策略。您还可以查看多个示例,了解 NVIDIA BlueField DPU 加速和卸载技术是如何降低耗电量,并同时降低资本性支出(CapEx)和运营性支出(OpEx),助力实现更低的 TCO。