计算化学购机配置推荐

文/Sobereva @北京科音

First release: 2018-Oct-8  Last update: 2021-Jul-24

http://sobereva.com/444


重要前言

经常有人问买机子做计算化学计算该用什么配置,

这要根据预算、主要用的程序、主要做的任务类型、算的体系大小、对购买渠道有无限制等很多因素综合考虑。


这里,笔者根据不同预算档次,

给出相应预算下

目前能买到的性价比最高的配置。


这些配置对常规的量子化学、第一性原理计算都是非常适合的。


而对于分子动力学,

由于可以利用GPU加速达到比起用纯CPU的机子好几倍的性价比,

故在文末单独给出了配置。


本文是给那些把经费当自己的钱看待、有节约意识,

而且水平不是弱到连个操作系统都不会装的读者。


而那些经费极度充裕、不仇视奸商、就算可能明知道被坑一倍的钱也不心疼的人就别看此文了,

我对这些人彻底放弃治疗,

这些人就去买那些看似是大品牌(记住除非是那种有制造、定制硬件能力的厂家,否则和淘宝上的组装的服务器没丝毫差别)、

有所谓的上门售后(大多数品牌的技术服务其实很坑爹,未必能达到计算化学同行平均技术水平)、

性价比通常也就是本文推荐的机子的一半甚至1/3的而且性能可能特别鸡肋的机子好了。



文中的这些服务器配置在淘宝(不是京东)上的很多卖服务器的商家处都可以买到


如果商家的动态评分都比较高,比如都是4.9或有个别4.8的,

总出货量也较高(比如好几个钻或者有皇冠),

卖家的评价也都没什么问题,

并且通过淘宝旺旺与之沟通也比较顺畅,

那么这样的商家就是靠谱的,

给出的机子的稳定性以及售后都不会有问题。


这些商家都可以根据你的需要对配置进行灵活定制。

他们不一定恰好能给出和文中一模一样的配置,但只要相仿佛即可。


如果为了避嫌不方便以淘宝方式交易,

也可以直接联系那些店家以其它方式交易,

他们大多都有实体店,一般只要补上税点也都能开发票,直接淘宝旺旺咨询便知。


强调一点,淘宝上这些服务器卖家大多都是正经公司性质的,

我发现有人求助配置时居然以为他们自己去社会上找的一些服务器公司才是公司,真是糊涂。


顶多也就是有的淘宝上的卖家不给上门服务,

有问题需要把整机寄回去,维修服务自行咨询卖家便知。



由于配件、价格经常会有变动,

新硬件也不断推出,所以本文也会时不时更新,注意看本文开头的最后更新日期

可能几个月或者半年更新一次。


文中推荐的配置都是最后更新时最高性价比配置,报价也都是最后更新时候的报价。


大家没必要去给个配置单问我或其他人价格是否合理

淘宝上的服务器价格都很透明,自己去淘宝上查当下每种散件的价格,

自行向加就知道卖家给的整机价格是否靠谱、有多少水分。



笔者强烈建议在阅读本文的同时阅读《淘宝店购买双路2696v3服务器的过程、使用感受和杂谈》(http://bbs.keinsci.com/thread-6310-1-1.html)了解一些关于购买服务器的基本知识,这也可以同时令你充分认识到只要商家选对了,从淘宝商家处购买服务器是100%可靠的。


笔者很久很久之前还写过一篇《单路计算化学攒机配置推荐》(http://sobereva.com/243),里面做了不少硬件方面的讨论,但现在来看里面的配置已经过时了,但有兴趣的话仍可以看看。http://sobereva.com/datasheet.rar是笔者从2002年开始就一直维护至今一个硬件资料库,里面可以查到各种文中涉及的CPU和GPU型号。当你被型号搞糊涂的时候,查一下这个表格立刻就清楚了。



注意现在社会上的卖服务器的奸商奇多(不是指淘宝商家),猖獗至极!!!笔者在网上答疑时,经常看到有人贴出市面上商家给他的配置和报价,配置不仅很不合理,好多地方严重瞎糟蹋钱,而且本来性能也就值不到2万的机子,居然能报到5万左右;


好点的配置,本来也就3万就能拿下来,愣是报7、8万乃至10万!


注意这绝对不是小概率事件,而是极大概率事件!笔者见过太多太多了!

如果你对配置、行情一点都不懂就到社会上去找服务器商家购买,9成几率血亏花大价钱就买了个很垃圾的服务器,扔了也不是,用着又慢,简直添堵。


每次在答疑时看见奸商利用信息不对称,给硬件小白列的这种配置和报价我就很火大。如果你对计算机配置方面一无所知,除了看上述文章外,吐血建议阅读计算化学公社论坛的“硬件配置与采购板块”的帖子:http://bbs.keinsci.com/forum-61-1.html


花个一两个小时的时间看看,很快就能对行情、配置选择心里有数,碰见不靠谱的配置和报价很容易就能识破(但也不是说那个板块里所有人的发言都是很正确、合理的,不过凡是有严重不合理的言论出现,基本上都会有真正懂行的人斧正)。


PS:我发现计算化学圈里居然有公司把我本文的配置(或高度类似的配置)大幅加价向计算化学工作者兜售,或者价格和本文差不多的情况下把CPU换成工程版来谋取暴利,笔者表示强烈鄙视!大家应当仔细看本文,弄清楚什么配置到底应该卖多少钱,别上黑心公司的当!


以下推荐的服务器配置里没包含显示器,要显示器的话就用推荐的PC机配置的显示器即可。


由于不做GPU加速的时候显卡对计算性能没有丝毫影响,因此除了最后推荐的基于GPU加速的做动力学的配置外,用的显卡都是最低端的,因此可见用的要么是CPU集显或主板集显,要么用淘宝上的二手亮机卡(即远古时期的PCI-E显卡)。


对于观看计算化学研究牵扯的3D模型,CPU集显和亮机卡的3D加速性能就已经够了。


本文推荐的配置都没有包含固态硬盘,因为对于绝大部分类型的计算,硬盘速度不会明显影响计算速度,但牵扯到大量读写硬盘的任务用高速固态硬盘则很有好处,如果你需要的话可以加一块,关于这点务必阅读《硬盘速度与内存容量对量子化学计算速度影响的测试》(http://sobereva.com/397)。


本文推荐的配置用的CPU,若无特殊说明,都是正式版CPU。


虽然用工程版CPU便宜得多得多,但在稳定性和兼容性上会有一定风险,看RP,因此本文不考虑,但如果想省钱且不怕折腾的话则可以考虑用正显版。


有个别读者担心本文里某些配置用的CPU是二手什么的,这种担心完全是多余、毫无意义的!只有小白才担心这个。

CPU又不是消耗品,不管是全新还是二手,只要能点亮机子就完全一样,使用上绝对没有丝毫差别。


CPU只需要区分正式版和工程版,这有本质差异,而本文推荐的配置没有一个是用工程版的。

同理,内存也不用管是新品还是二手的。

至于文中的其它配件(亮机卡除外),价格都是全新品的价格。


有人问怎么我推荐的服务器的配置里的CPU那么便宜,而很多服务器公司给的配置单里差不多核数、频率的CPU报的价格是我文中的N倍。


这是因为我文中用的CPU不是INTEL ark上能查到的明面上的型号。


8173M、2696 v3之类特殊渠道流出来的OEM的CPU是在大陆等很少数地区的人能才能享受到的bug级福利,这些正式版的OEM CPU的体质、兼容性和明面上的型号没有任何差异,没有丝毫风险。


显然,对于买自己用的机子,不选这些U而多花几倍的钱买同样性能的明面上的型号简直是傻子。


下面的配置越往后价格越高,相应地性能也越好,应根据预算和实际需要来选择。

影响计算速度最有决定性因素的是CPU的“频率*核数”(当然还有很多其它因素,如CPU架构、程序支持的指令集、并行效率等),因此可以看到随着配置价格的提升,大趋势是“频率*核数”逐渐增加的。


本文中1~7号配置对于量子化学计算(如主流的Gaussian、ORCA等)以及第一性原理计算(如主流的Quantum ESPRESSO、CP2K等)都是完全适合的。

如果你是做分子动力学的且计算程序支持GPU加速,优先考虑8号,远比用CPU计算划算得多。


1 可用于简单计算的PC机推荐配置

这个配置做一些小体系非高精度计算,或者就当做普通PC使用,都是适合的。如果需要时不时做一些耗内存大的后HF计算,可以把内存升到2*16 GB。

CPU:i5 10500(六核3.1G,盒装,集显)
主板:技嘉B460M H
CPU、主板套装价约1950
散热器:酷冷至尊T400i  80
硬盘:希捷 2TB 256MB 7200rpm SATA3 410
内存:2*8G套条 金士顿骇客神条DDR4-2666 535
电源:振华冰山金蝶450战斗版(额定450W)320
机箱:任意 200
键盘鼠标:罗技MK200 多媒体套装 85
显示器:优派最便宜的 700
总价:约4300

以下是基于AMD CPU的方案,性能和上面的接近,但明显更便宜。用AMD的CPU的潜在不足见后文。

CPU:R5 3500X(六核3.6G,盒装带散热器,无集显)
主板:微星B450M PRO-VDH MAX
CPU、主板套装价约1370
内存:2*8G 金士顿 DDR4-3200 共590
显卡:淘宝上二手PCI-E亮机卡 30(若必须买新显卡,可以用市售最便宜的诸如小影霸GT610之类的,不到200块钱)
散热器:CPU自带
其它同上
总价:约3400


2 廉价双路服务器推荐配置

由于XEON v3的CPU已经快退出历史舞台了,因此其中规格略低的型号价格非常便宜。这样的机子使用Gaussian用DFT方法结合像样的基组算100个原子的体系已经完全无压力了。

注意有些别有用心的商家会贬损说v3 CPU已经很过时了,让你换别的。绝对别听他们说的,他们的目的通常只是想让你换个对于他们而言利润更高的CPU而已,然而对于你而言性价比则低得多得多得多。

CPU:2* XEON E5-2678 v3(12核2.5G,散,无集显)2*660
散热器:酷冷至尊T400i*2  80*2
主板:超微 X10DRL-I(C612芯片组,集显) 2400
硬盘:希捷ST4000NM000A银河企业级4TB SATA 880
内存:三星DDR4-2400 ECC REG 8*8GB  8*240
电源:振华LEADEX HG 650W 640
机箱:先马黑洞玻璃版 330
键盘鼠标:罗技MK200 多媒体套装  90
总价:约7700


3 较好双路服务器推荐配置

这个机子的性能在目前来说已经算不错了,属于中上档次。这里配了固态硬盘,用于加速需要大量频繁读写硬盘的后HF任务,此硬盘建议仅作为存放临时文件使用。如果你以做DFT为主,由于读写硬盘量相对较少,固态硬盘可以去掉。更多讨论参看《硬盘速度与内存容量对量子化学计算速度影响的测试》(http://sobereva.com/397)。由于此配置的主板较老,不自带M.2口,而PM981A固态硬盘是M.2口的,所以需要淘宝上花二三十块钱买个M.2口到PCI-E口的转换卡。

CPU:2* XEON E5-2696 v3(18核2.3G,散,无集显)2*1330
散热器:酷冷至尊T400i*2  80*2
主板:超微 X10DRL-I(C612芯片组,集显) 2400
机械硬盘:希捷ST4000NM000A银河企业级4TB SATA 880
固态硬盘:PM981a 1TB + M.2到PCI-E转换卡 950
内存:8*三星DDR4-2400 ECC REG 16GB  8*450
电源:振华LEADEX HG 650W 640
机箱:先马黑洞玻璃版 330
键盘鼠标:罗技MK200 多媒体套装  90
总价:约11700


4 基于AMD的高性能单路服务器推荐配置

这个配置的性能和上面2*2696 v3的机子差不多,虽然价格更高,但好处是更省电,对于并行效率比较低的程序性能更好些,想用的话也可以用。此机子的潜在缺点是对软件的兼容性可能个别情况下没有用INTEL的CPU那么好,例如此帖http://bbs.keinsci.com/forum.php?mod=redirect&goto=findpost&ptid=15119&pid=109880&fromuid=1。用INTEL的CPU比较省心,所有计算程序对INTEL CPU的兼容都是最完美的,而且INTEL有自家的编译器和数学库,其编译器还有专门为自家的CPU优化的选项,这都是AMD不能及的优势。目前90%以上的超算中心用的也都是INTEL的CPU。

值得一提的是5950X最多只能上128GB内存,所以不要指望用更多内存,毕竟不是服务器CPU。固态用的PM9A1是PCI-E 4.0 M.2口,当前的CPU+主板支持,速度明显超过PM981a。

CPU:AMD Ryzen 9 5950X(16核32线程,3.4~4.9G,散装,无集显)
主板:华硕TUF B550M-PLUS 重炮手
CPU、主板套装价约5400
散热器:九州风神大霜塔 200
机械硬盘:希捷ST4000NM000A银河企业级4TB SATA 880
固态硬盘:PM9A1 1TB 1100
显卡:淘宝上二手PCI-E亮机卡 30
内存:4*海盗船DDR4-3200 32GB 4*1140
电源:振华冰山金蝶450战斗版(额定450W)320
机箱:先马黑洞玻璃版 330
键盘鼠标:罗技MK200 多媒体套装  90
总价:约12900


5 顶级双路服务器推荐配置

这个机子的性能在目前来说是属于顶级的。如果预算实在不太够,内存可以降到8*16GB,此时每个CPU只能利用原本6个内存通道里的4个通道,对于全核满载时性能会打一定折扣(如10%,也可能更多,视程序和任务而定)。

CPU:2* XEON Platinum 8173M(28核2.0G,全核睿频到2.7G,散,无集显)2*8500
散热器:2*捷豹LGA3647散热器  2*260
主板:超微X11DAi-N(C621芯片组,集显) 3100
机械硬盘:希捷ST4000NM000A银河企业级4TB SATA 880
固态硬盘:PM981 2TB 1800
内存:12*三星DDR4-2666 ECC REG 16GB  12*500
电源:振华LEADEX HG 650W 640  
机箱:先马黑洞玻璃版 330
键盘鼠标:罗技MK200 多媒体套装  90
总价:约30400

以上配置是192 GB内存的,平均每个核3.4 GB,一般足够用。但如果你要跑一些耗内存非常高的任务,比如ORCA跑DLPNO-CCSD(T)和DLPNO-STEOM-CCSD,对于较大体系、较大基组的话需要降低并行核数来让每个核有足够内存,像这种情况应考虑12*32 GB=384 GB内存。固态硬盘用了较大的2 TB,因为做一些大型后HF计算耗硬盘非常厉害,1T都往往不够。但如果你只是做做普通DFT泛函的计算、TDDFT计算,固态也可以不用。

值得一提的是,还有与8173M性能相仿佛,而价格显著更便宜的型号,诸如Platinum 8175M和8259CL(24核2.5G,全核睿频到3.1G)、8179M(26核2.4G,全核睿频到3.0G)、8171M(26核2.3G,全核睿频3.0G)、8273CL(28核2.2G、全核睿频到3.0G)、8275CL(24核3.0G,全核睿频到3.6G)等等,但都属于OEM定制版本,常用的超微、INTEL主板不支持,需要用专门的永擎或技嘉主板,详情咨询卖家。这些CPU的热设计功耗(TDP)都明显高于8173M。鉴于这些CPU比较特殊,所以不纳入正式推荐,如果想用也完全可以,性价比很高,也没有什么实际问题,但应当和卖家确认退换货相关事宜。具体用哪个,可根据卖家实际报价、有没有货来决定。

有人可能想用AMD顶级单路CPU线程撕裂者做计算,实际上其性价比相对于8171/73/75/8179M等特殊渠道的INTEL CPU来说并不高,而且不能组双路,主板还特别贵,因此本文不予推荐。(有人老拿线程撕裂者跟INTEL官方的https://ark.intel.com页面上能查到的型号对比性价比,由此鼓吹AMD的U做计算多划算,这是极具误导性的)


6 超土豪双路服务器配置

如果你完全不在乎花多少钱的话,就是想要个最快的,可以用双路AMD的EPYC 7742,单颗64核128线程、8个内存通道,双路一共128核256线程、16个内存通道。


用正式版的EPYC 7742并且内存插16*32GB=512GB的话(平均每个核4G,不算多),将近9万块钱,基础配置可以参考https://item.taobao.com/item.htm?spm=a1z10.5-c.w4002-8633537290.13.3fc9217b2N6cd5&id=605430666705


速度测试见http://bbs.keinsci.com/thread-19256-1-1.html


按照文中的说法,对于Gaussian的话,利用所有核心跑单个任务比8175M也就快百分之几十,在我来看完全不值得。

但是如果同时跑很多个任务来让CPU计算能力最大化的话,这配置的总算力是2*8175M的2.5倍。

值不值得花这个钱就根据自己的经济状况和要算的任务决定了。


7 GPU加速做分子动力学的推荐配置

如果你用GROMACS、AMBER、NAMD、Lammps等支持GPU加速的分子动力学程序,在“可用于简单计算的PC机推荐配置”配置基础上增加一块时下中高档次的nVidia的游戏显卡即可达到很好的性能(可以把10500改为不带集显的10600KF,这样可以便宜几十块钱,而CPU性能更好)。如果预算不多,建议上RTX2060 6G,跑GROMACS性价比极高。牌子就选耕升、映众、索泰的就行,性价比高,质量也靠谱。如果预算较多,可以用更好的RTX3070。如果不太在乎钱只在乎速度,用RTX3080。如果你发现时下RTX3080Ti比RTX3080市场价高得不多的话,也可以用RTX3080Ti,性能高百分之十多一点。RTX3090则完全没必要考虑,性能仅比3080Ti强一丝,价格却远高于与之,故没有丝毫性价比(这卡主要卖点是显存高达24GB,但这对于加速经典力场的分子动力学完全用不着,白浪费)。不要考虑AMD的显卡,因为支持AMD显卡做GPU加速的动力学程序较少,而且虽然GROMACS等也支持AMD显卡上GPU加速但是在功能上有限制,不建议折腾。

如果你经常同时跑两个任务,那么可以用上面说到的廉价双路服务器配两块RTX3070 Ti,每个显卡分别算各自的任务。但应当把主板换为X10DAL-i,因为这个板子有两个PCI-E 3.0 16x接口,而X10DRL-i只有一个这种接口。另外,由于此时功耗很高,应当用1000W左右的电源,建议用振华1000W LEADEX G 1000,约1060元,在额定1000W的电源中这个已经算很便宜的了,而且质量靠谱。特别需要注意的是:这个电源长度比一般电源长5厘米(一般的是15厘米,而这个是20厘米,插上输出线之后又长一截),如果你的机箱的电源仓位尺寸是固定的,长度达不到25厘米的话,别买这个电源,否则塞不进去(我就吃亏过,买来后发现这电源没法塞进先马泰坦机箱)。其它的可以考虑海韵FOCUS GX1000,1250元,整体素质很好,而且有个好处是长度仅有14厘米,是额定1000W电源里最短的。但这个电源的缺点是其模组设计只能提供三个独立的PCI-E输出,因此不太适合带两块高端显卡(每个显卡最好通过两个独立的PCI-E输出供电)。如果你的双路服务器CPU要带两个RTX3080,建议电源用海韵旗舰金PRIME GX1300,是额定1300W电源,1900元。

顺带一提,从GROMACS 2018开始,绝大部分计算量都已经被挪到GPU上了,因此对CPU要求不高。只要有个6核CPU,就基本能释放高端GPU的全部加速潜力;而有个十几核CPU,就足够释放两块高端GPU的潜力。因此用高端CPU没必要。J. Comput. Chem., 40, 2418 (2019)是一篇专门测试不同CPU与GPU组合跑GROMACS性能的文章,有兴趣可以看看。

绝对不要用好几万的Tesla产品跑分子动力学,血亏,也不要用Titan系列产品,很不值。因为绝大多数分子动力学程序做GPU加速关键看的是GPU的单精度浮点运算性能,游戏用的显卡在这方面性价比是最高的,其中最高端产品的GPU加速性能和最高端的Tesla产品是相仿佛的。绝对不要因为一些卖服务器的人一听说你要做GPU加速就给你推荐Tesla然后你就买了。

Materials $tudio里的动力学模块超贵又不灵活又特慢,还不支持GPU加速,要速度的话只能老老实实买高性能CPU机子来跑。不过M$ 2021开始其中Forcite倒是支持GPU加速了,加速效果如何笔者不清楚,但肯定还是远比不上GROMACS等主流MD程序。

做经典力场的分子动力学对内存需求量远低于做量子化学计算和第一性原理计算,因此如果你打算买双路服务器又想少花钱,可以在内存容量上大幅缩水。

做分子动力学不需要配固态硬盘,因为分子动力学过程中硬盘读写量很小,故硬盘读写速度不会影响到跑动力学的速度。


8 买服务器划算还是租超算划算?

现在很多人都在用超算跑计算任务。据我所知(这里说的是2019年中旬的情况)主流超算中心的价格平均是1毛钱1核时(即一个核跑一个小时)。看起来很便宜,但相对于自己买服务器真的划算么?下面来算笔帐。本文2019年5月底更新的报价中,2*XEON E5-2696 v3的双路服务器是15600元,36核。如果把这个钱全用来租超算,就是15600*10=156000核时。如果用这个服务器来跑,就相当于跑156000/36=4333小时,折合180天。也就是说,你买这个服务器,只要满载跑超过半年,用超算的价格来衡量的话你就相当于回本了,显然对于专门长期做计算的人来说,自己买服务器划算得多。虽然也有人说自己跑还要出电费,但价格一点也不夸张。比如在北京城区,目前商业用电按照平段时间来算是0.87元每千瓦时,笔者实测这种配置CPU满载时整机功耗是455瓦,因此每天电费是0.87*0.455*24=9.5元,因此跑180天是1710元,只是买机子的钱的零头而已。用自己的服务器比用超算有很多优点,比如(1)安装软件方便、自由 (2)提交任务省事,不用排队 (3)上传、下载大文件速度比通过互联网快得多。虽然有人说自己买服务器得装系统、配置、编译什么的,需要一定技术才能搞定,但实际上这点技术根本就没啥复杂的,绝对不可能难倒任何一个以后在计算化学领域能稍有作为的研究者,碰到什么问题多google、鼓捣鼓捣很容易就能解决,这都搞不定的话干脆别搞计算化学了。

不过如果你短期内需要大量的计算资源,超算倒是可以充分满足你的需求,这是用超算的主要一个好处。