MD模拟的硬件
在计算机技术高度发达的今天,计算机已经渗透到现代社会的各个角落。因 此,MD模拟用户经常可以不消耗或只消耗很少的经费就能得到一定的计算资 源,用于MD模拟。
MD模拟用户最容易得到的计算资源是个人计算机(PC)。目前,个人计算 机的功能已经相当强大,一般能够满足MD模拟的初步需求。一台最新的具有 八核芯CPU的个人计算机,已比十年前的一台工作站(workstation)或服务器 (server)的计算速度更快。
如果个人计算机无法满足用户开展MD模拟研究的要求,可以考虑购置计 算性能更优的工作站,专门用于MD模拟研究。具有多个多核芯CPU的工作 站,性能比一般个人计算机优许多倍,但价格比个人计算机高更多倍。目前,一 台工作站的CPU数量常为2〜8,而一个CPU的核芯数为4〜8。这样,一台配 置8个八核芯CPU的工作站,拥有64个核芯,其计算性能已经十分强大,可以 满足大多数MD模拟工作的需求。
除单台多核芯多CPU的工作站外,小型研究组也可以考虑购置集群式计算 机系统(cluster)o 一个集群式计算机系统一般由一台主机或主节点(master) 和多台计算节点(node)组成,通过内部网络系统实现节点间的通信和数据传 输,构成灵活的计算机系统。由于单台服务器的价格,随配备的CPU数的增加 呈非线性增加;因此,具有相同计算能力的集群式计算机系统与单台高性能服务 器相比,集群式计算机系统的成本大大低于单台高性能服务器。集群式计算机系 统的另一个好处是既可以在同一节点运行多个串行作业,又可以在同一节点上并 行运行同一个作业,甚至可以在整个集群式计算机系统运行一个并行作业。这样 的运行模式,对一个小型研究组来说非常灵活。当模拟计算工作需要时,整个集 群系统可以并行运行同一作业,完成特定的大型模拟任务。当计算模拟工作不需 要时,各个计算节点可以分别运行不同的作业,满足研究组内多人使用的需求。
最初步的集群式计算系统是PC集群,由若干台PC组成主节点和计算节点, 各节点之间以千兆以太网连接,对外通过主节点与局域网连接。局域网与互联网 相连,所有用户都通过互联网以远程登录的方式使用集群系统。为了节省空间, PC集群常做成机架式样,在一个机架上放置约10台PC。
这样的PC集群,可以实验室自己装配,价格低廉。实验室自己装配的PC 集群的缺点是总节点数不能太多,一般限制在32台以下,以20台左右的并行效 果最好。当PC集群拥有更多的节点时,受节点间通信带宽的限制,并行效率明 显下降。特别是,MD模拟等计算化学作业,各个计算节点之间的通信量比其他 计算作业大,大集群的并行效率降低明显,加速比的提高受到限制。在工程、物 理、力学、数学等领域广泛应用的有限元计算中,各个计算节点之间的通信相对 较少,可以利用更大的计算机集群。因此,在计算化学工作者和主要使用有限元 计算的工程、物理、力学、数学工作者共同建设计算机集群时,相互之间往往有 不同的需求,计算化学工作者希望把较大的集群拆分成若干中等规模的集群,相 反,使用有限元计算的用户希望把集群做得越大越好,以满足并行计算的需要。
PC集群的另一个缺点是占用的实验室空间比较大、噪声和发热也比较大。 因此,需要一个配备空调设备的计算机房,以放置PC集群。特别是,我国的大 部分地区,夏天炎热,如果没有配置空调设备,PC集群可能因过热而不能正常 使用,甚至停止工作。
比PC集群更稳定、性能更优的是服务器集群。服务器集群与PC集群具有 相似的结构,只需把其中的部分或全部节点替换为服务器。服务器集群的性能优 越、功能强大,可以满足大多数研究组的需求。但是,服务器集群的购置费用高 昂,一般研究组的科研经费难以承担。
除了研究组自备的集群式计算系统外,学校、学院、研究所等机构配备计算 速度更快的计算系统,通常也是服务器集群。大型集群的节点数在数百到数千之 间,价格在数百万到数千万之间。如果研究组所在的机构拥有公用的大型计算系 统,应该首先考虑使用公用资源。通过向计算系统的管理部门提出申请,往往可 以免费或以很低的成本获得计算资源。在使用公用计算资源时,即使需要支付一 定的机时费,总费用也往往是研究组自备计算系统的一小部分。另外,研究组自 备的计算系统,包括空调等的维护费用也很高。相反,机构公用计算系统的维 护,有专人负责,不需要研究组负责。
但是,研究组自备计算系统也有很多优点。一方面,研究组能够完全掌控计 算系统,在工作需要时可以集中所有的计算资源完成重要的作业。另一方面,使 用者可以学习计算系统的日常管理和维护技能,对以后的工作帮助巨大。
