全新 DLI DOCA 中文课程上线

两门全新的以 DOCA 为重点的中文 DLI 课程已开发完毕并正式上线!它们旨在有效地培训客户对 NVIDIA BlueField-3 DPU 进行编程,重点是实现基于 DOCA PCC 的定制拥塞控制算法,以实现云端/数据中心 AI 工作负载的最佳性能。

构建基于 DOCA 的拥塞控制算法优化 AI 工作负载

课程介绍
NVIDIA Spectrum-X 平台专为加速生成式 AI 云而设计,旨在实现最佳性能和可扩展性。本课程将指导学员在 NVIDIA Spectrum-X 平台上利用 NVIDIA BlueField-3 DPU 实现自定义拥塞控制算法,优化多个大型语言模型训练的性能,并有效隔离各个任务之间的干扰。

结合理论讲解与实际操作,学员将深入理解 RDMA 技术和拥塞控制的基本原理,并通过使用 DOCA PCC SDK,开发和优化拥塞控制算法。课程还将提供相关的调试工具和技巧,帮助学员提升数据中心的运行效率。
课程链接

拥塞控制入门

课程介绍
RDMA 在高性能计算和人工智能应用程序等场景中 ,可以加快数据处理以及低延迟。RDMA 还可以提高数据中心存储系统的性能。作为提高数据中心网络性能的关键技术, 要想发挥出 RDMA 真正的性能,势必要为 RDMA 搭建一套不丢包的无损网络环境,而不丢包的关键就是解决网络拥塞。

在本课程中,您将学习网络基础知识,RDMA 技术的实现以及流量和拥塞控制原理。本课程还涵盖 NVIDIA DOCA 框架的介绍,适合希望深入学习拥塞控制的人士。
课程链接

1 个赞