NVIDIA CUDA 库助力您的人工智能开发 - 最重要的 8 个 CUDA 库介绍

cuDNN - Webpage | Doc


NVIDIA CUDA® 深度神经网络库 (cuDNN) 是一个 GPU 加速的深度神经网络基元库,能够以高度优化的方式实现标准例程(如前向和反向卷积、池化层、归一化和激活层)。

The NVIDIA CUDA® Deep Neural Network (cuDNN) is a GPU-accelerated library of primitives for deep neural networks. cuDNN provides highly tuned implementations for standard routines such as forward and backward convolution, attention, matmul, pooling, and normalization.

Related blogs:

o 使用 NVIDIA cuDNN 9 加速多个 Transformer

o 神经网络通过检查绘画的笔触来精确定位艺术家

Modulus – Webpage | Doc


NVIDIA Modulus 是一种神经网络框架,它以控制偏微分方程 (PDE) 形式将物理学的力量与数据相结合,以构建具有近乎实时的延迟的高保真参数替代模型。无论您是想着手解决 AI 驱动的物理问题,还是为复杂的非线性多物理系统设计数字孪生模型,NVIDIA Modulus 都可以为您的工作提供支持。

NVIDIA Modulus is an open-source framework for developing physics machine learning neural network models.

Related blogs:

o 图神经网络在增材制造中的应用

o 利用碳捕获和存储数字孪生实现净零战略

o 基于物理的机器学习平台 NVIDIA Modulus 现已开源

Aerial – Webpage | Doc


NVIDIA Aerial 是一套用于设计、模拟和操作无线网络的加速计算平台、软件和服务。Aerial 包含用于电信公司、云服务提供商 (CSP) 和构建商业 5G 网络的企业的强化 RAN 软件库。学术和行业研究人员可以访问云端或本地 Aerial 设置,用于 6G 方面的高级无线、人工智能和机器学习 (ML) 研究。

NVIDIA Aerial is a suite of accelerated computing platforms, software, and services for designing, simulating, and operating wireless networks. Aerial includes hardened RAN software libraries for telcos, cloud service providers (CSPs), and enterprises building commercial 5G networks. Academic and industry researchers can access Aerial setups in the cloud or on-premises for advanced wireless, AI, and machine learning (ML) research on 6G.

Related blogs:

o 借助 NVIDIA Aerial CUDA 加速 RAN,增强 5G/6G 的 DU 性能和工作负载整合

o 借助 NVIDIA 6G 开发者计划加速无线通信的未来

cuLITHO – Webpage


NVIDIA cuLitho 是一个库,包含优化的工具和算法, 用于 GPU 加速计算光刻和半导体制造工艺, 比目前基于 CPU 的方法多个数量级。

NVIDIA cuLitho is a library of optimized tools and algorithms for GPU-accelerated computational lithography and semiconductor manufacturing processes that outperforms current CPU-based approaches by orders of magnitude.

Related blogs:

o SDK 加速行业 5.0 、数据管道、计算科学等在 GTC 2023 上亮相

Parabricks – Webpage | Doc


NVIDIA® Parabricks® 是一个可扩展的基因组学分析软件套件,能够充分利用全栈加速计算在几分钟内处理数据。它与所有领先的测序仪器兼容,支持多种生物信息学工作流程,并集成了 AI,有助于实现超高的准确性,并允许用户随心定制。Parabricks 是一种经济高效且节省空间的解决方案,非常适合用于侧重推进疾病理解和管理的大型基因组学项目。

NVIDIA® Parabricks® is a scalable genomics analysis software suite that leverages full-stack accelerated computing to process data in minutes. Compatible with all leading sequencing instruments, it supports diverse bioinformatics workflows and integrates AI for accuracy and customization. A cost-effective and space-saving solution, Parabricks is ideal for large-scale genomics projects focused on advancing disease understanding and management.

Related blogs:

o 借助 NVIDIA AI 基础模型 VISTA-2D 推进细胞分割和形态分析

o 借助 GPU 加速和生成式 AI 加速多组分析

o 借助 NVIDIA Parabricks v4.2 加速任何测序器的基因组分析

o 使用 RAPIDS-singlecell 进行 GPU 加速的单细胞 RNA 分析

o 使用 NVIDIA Parabricks ,通过深度学习加速整个外显子组分析,降低 70% 的成本

cuOpt – Webpage | Doc


NVIDIA® cuOpt™ 能够借助加速计算更快地做出更好的决策,从而优化运营。cuOpt 能够帮助团队解决具有多重约束的复杂路线规划问题,并且能够提供动态重新规划路线、作业调度和机器人仿真等新功能,同时实现亚秒级求解器响应时间。

NVIDIA® cuOpt™ optimizes operations by making better decisions faster with accelerated computing. cuOpt helps teams solve complex routing problems with multiple constraints and delivers new capabilities such as dynamic rerouting, job scheduling, and robotics simulation, all while achieving sub-second solver response times.

Related blogs:

o 突破性的 NVIDIA cuOpt 算法将路线优化解决方案的速度提高 100 倍

o 体验 NVIDIA cuOpt 加速优化,提高运营效率

o 使用 NVIDIA cuOpt 优化 ISAAC Sim 机器人路线规划

cuQuantum - Webpage | Doc


作为一个包含经过优化的库和工具的 SDK,NVIDIA cuQuantum 可用于加速量子计算工作流。借助 NVIDIA Tensor Core GPU,开发者可以使用 cuQuantum 将基于状态向量和张量网络方法的量子电路模拟加速一个数量级。

NVIDIA cuQuantum is an SDK of optimized libraries and tools for accelerating quantum computing workflows.

Related blogs:

o 借助 NVIDIA cuQuantum 23.10 加速量子电路模拟

o 借助宝马集团和 NVIDIA cuQuantum 对量子计算应用程序进行基准测试

o CUDA Quantum 0.5 为量子经典计算提供新功能

o 量子经典超级计算机的编程

o 使用 NVIDIA cuQuantum 实现基于矩阵产品状态的量子电路仿真

cuDF - Doc


cuDF(发音为“KOO-dee-eff”)是一个用于加载、连接、聚合、过滤和以其他方式操作数据的 GPU DataFrame 库。 cuDF 利用 libcudf(一个超快的 C++/CUDA 数据帧库)和 Apache Arrow 列格式来提供 GPU 加速的 pandas API。

cuDF (pronounced “KOO-dee-eff”) is a GPU DataFrame library for loading, joining, aggregating, filtering, and otherwise manipulating data. cuDF leverages libcudf (a blazingly fast C++/CUDA DataFrame library) and the Apache Arrow columnar format to provide a GPU-accelerated pandas API.

Related blogs:

o Databricks 上的 RAPIDS: GPU 加速数据处理指南

o RAPIDS cuDF 在 Google Colab 上瞬间加速 pandas 达 50 倍

o RAPIDS cuDF 可将 pandas 加速近 150 倍,且无需更改代码

o 在 RAPIDS libcudf 中使用嵌入式数据类型简化 ETL 工作流程