GPU CUDA 用于分子模拟计算领域的简单基础和发展近况

GPU计算高性能计算机与传统的CPU计算高性能计算机比较,10分之一的价格,20分之一的电力消耗!本文旨在介绍GPU用于分子模拟计算领域的简单基础和发展近况。

一、GPU(Graphic Processing Unit)计算介绍
GPU计算使用 GPU(图形处理器)来执行通用科学与工程计算。 GPU计算模型在一个异构计算模型中同时使用了 CPU 和 GPU。应用程序的顺序部分在 CPU 上运行,计算密集型部分在 GPU(图形处理器)上运行。

应用程序开发人员将需要修改其应用程序中的计算密集型内核,并将其关联到 GPU(图形处理器)。应用程序的其它部分将仍然依赖于 CPU 进行处理。

GPU计算得到了 NVIDIA(英伟达™)被称作 CUDA(Compute Unified Device Architecture) 架构的 GPU大规模并行架构的支持。CUDA™是一种通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。该架构拥有针对流行编程语言与API、内容丰富的开发者工具集(编译器、分析器、调试器),其中包括C语言、C++、Fortran语言以及OpenCL和DirectCompute等驱动程序API。

与最新的四核CPU相比,Tesla 20系列GPU计算处理器以二十分之一的功耗以及十分之一的成本即可实现同等性能。每一颗Tesla GPU均包含数以百计的并行CUDA核心并且基于革命性NVIDIA(英伟达™)CUDA™并行计算架构。
现在GPU已经发展到了颇为成熟的阶段,可轻松执行实际应用程序并且其运行速度已远远超过了使用多核系统时的速度。未来计算架构将是并行核心GPU与多核CPU串联运行的混合型系统。

二、Tesla BIO Workbench - 助力新型科学
NVIDIA(英伟达™)Tesla™ Bio Workbench让生命科学家与计算化学家有机会挑战生化研究的极致结果。利用NVIDIA(英伟达™)Tesla™ Bio Workbench, 生物物理学家和计算科学家们实现了生物化学研究的突破性发展,运行医药研究、DNA排序等复杂的生物科学计算代码,与传统CPU计算系统相比较,运行速度快出10至20倍。

支持GPU计算的分子动力学与量子化学软件
ACE MD (即将问世)
AMBER
BigDFT (即将问世)
GROMACS
GROMOS (即将问世)
HOOMD
LAMMPS
NAMD
TeraChem (QC)
VMD
支持GPU计算的生物信息学软件
CUDA-BLASTP
CUDA-EC
CUDA-MEME
CUDASW++ (Smith-Waterman)
GPU-HMMER
MUMmerGPU

AMBER:凭借支持CUDA的GPU,加速AMBER中的显溶剂(explicit solvent)隐溶剂(implicit solvent)模拟。辅以基于CUDA架构的Tesla GPU计算解决方案,系统即可获得10倍于四核CPU的计算速度。

研究性代码测试和下载见:http://ambermd.org/gpus/

LAMMPS:GPU-LAMMPS编码支持MPI,并且适用于大型GPU集群扩展。大部分的代码仍然基于CPU,坐标每一时间步长都传给GPU,计算作用力后再传回CPU。在运行 GPU-LAMMPS 时,两块 Tesla GPU性能超过24块 CPU。

代码下载见:http://code.google.com/p/gpulammps/

NAMD:NAMD由于开发CUDA架构代码比较早,现已相对比较成熟。实测结果8个GPU的性能能与96个CPU相比,并且性能随GPU数量增加而线性增加。

代码下载见:
http://www.ks.uiuc.edu/Development/Download/download.cgi?PackageName=NAMD

GROMACS:目前在Beta版中,GROMACS已经向CUDA平台进行了移植,从而可实现GPU加速功能,这一版本还支持Particle-Mesh-Ewald(PME)、非键合相互作用的任意形式以及隐式溶剂Generalized Born等方式。目前暂不支持MPI。

代码下载见:
https://simtk.org/project/xml/downloads.xml?group_id=161#package_id600

CHARMM:c36a2开始支持GPU库,不过由于charmm代码的特殊性,开发成熟的CUDA版本还需要一段时间,初步测试结果显示,和其它软件一样,有10倍的性能提升。

VMD:VMD中多个关键内核与应用程序目前均能够利用NVIDIA(英伟达™)GPU(图形处理器)的大规模并行CUDA架构。现在CUDA代码已在1.8.7正式版本放出。与单纯在CPU上运行时相比,当使用NVIDIA®(英伟达™)CUDA GPU时,这些应用程序实现了20至100倍的速度提升。

代码下载见:
http://www.ks.uiuc.edu/Development/Download/download.cgi?PackageName=VMD

GAMESS:支持HF和DFT方法,Firefly 7.1.G版改善并提高对CUDA的支持。

HOOMD:基于CUDA构架编写,暂不支持MPI,一颗Tesla GPU所实现的性能可以和32个CPU核心相当。

代码下载见:http://codeblue.umich.edu/hoomd-blue/

更多BIO Workbench的近况见:
http://www.nvidia.cn/object/tesla_bio_workbench_cn.html

四、AMAX是NVIDIA指定中国唯一Tesla BIO workbench 测试平台供应商

Tesla BIO workbench 是提供了针对CUDA优化过的一系列生化行业常用软件,如AMBER,GROMACS,NAMD等。AMAX集团是中国地区唯一为客户提供BIO相关软件免费远程测试体验服务,以及GPU计算硬件平台的供应商。(相关信息请参考NVIDIA官网:http://www.nvidia.cn/object/gpu-test-drive-cn.html

AMAX公司是NVIDIA的推荐供应商,是NVIDIA在中国唯一的Work Station和Server双推荐供应商,我们公司的销售工程师,技术工程师以及售后工程师都是经过NVIDIA培训和认证的,根据客户的具体需求,专业为客户定制化生产GPU计算工作站,服务器,集群等解决方案。

GPU计算是这2年兴起的技术,2009年我们为同济大学海洋学院搭建了全国第一套GPU计算集群,我们在中央政府采购网的PSC-2N是销量最好的GPU计算工作站(相关信息请参考中央政府采购网:http://www.zycg.gov.cn/td_xxlcpxygh/show_by_category/1447),我们的Xn-4101G是全国唯一一款单节点最多支持8块GPU计算卡的高性能计算机。