电磁仿真

ABAQUS相应计算机工作站方案建议 abaqus专用工作站

2022-04-23 21:09:48 gx 374

【文章很长,请耐心看完】

ABAQUS 是一套功能强大的工程模拟的有限元软件,

相对简单的线性分析到许多复杂的非线性问题。 


ABAQUS 包括一个丰富的、可模拟任意几何形状的单元库。

并拥有各种类型的材料模型库,可以模拟典型工程材料的性能,其中包括金属、橡胶、高分子材料、复合材料、钢筋混凝土、可压缩超弹性泡沫材料以及土壤和岩石等地质材料。


ABAQUS 除了能解决大量结构(应力 / 位移)问题,

还可以模拟其他工程领域的许多问题,

例如热传导、质量扩散、热电耦合分析、声学分析、岩土力学分析(流体渗透 / 应力耦合分析)及压电介质分析。


可以分析复杂的固体力学、结构力学系统,特别是能够驾驭非常庞大复杂的问题和模拟高度非线性问题。

ABAQUS可做单一零件的力学和多物理场的分析,还可做系统级的分析和研究。

图片关键词


ABAQUS求解器

ABAQUS在大量的高科技产品研究中都发挥着巨大的作用,

它有两个主求解器模块— ABAQUS/Standard和ABAQUS/Explicit

 

    ABAQUS/Standard的并行求解器包括:

    具有动态负载均衡功能的并行直接稀疏矩阵求解器

    基于区域分解的并行迭代求解器并行Lanczos特征值求解器


    ABAQUS/Explicit的并行求解器也是基于区域分解的,

 

    ABAQUS并行计算特点

    ABAQUS支持Threads和MPI两种模式的并行。

    Threads模式在SMP架构的图形工作站上运行,而MPI模式在分布式集群系统上运行。

 

    ABAQUS求解器计算特点


求解器

Standard

Explicit

算法分类

隐式算法

显式算法

主要应用

静力、模态、屈曲等

接触、碰撞、冲击

算法特点

内存占用多, 硬盘IO多

内存占用少,硬盘io低

硬件要求

内存容量大,磁盘io快,读写带宽高,进程通信量大

CPU要求高

显式和隐式对计算机配置(CPU、内存、硬盘io和读写带宽)侧重点不同,


增加CPU数目能够提高显式的计算速度,对动态隐式则帮助不大。

增加内存的比例能够提高隐式的求解速度等。

 

Standard硬件配置特点

项目配置重点
1CPU1.高频  2.多核(32核以内)
2内存物理核数:内存容量=1:8
3GPU加速支持GPU加速,主要型号:QuadroGP100,Quadro GV100
4GPU前后处理,Nvidia Quadro 系列,入门级,中端系列
5硬盘回写高IO,推荐ssd硬盘,


不推荐sas硬盘,噪音太大,速度比ssd差太多

Explicit硬件配置特点

关键项配置重点
1CPU1.高频  2.多核(64核以内)
2内存物理核数:内存容量=1:4
3GPU加速暂时不支持
4GPU前后处理,Nvidia Quadro入门级,中端系列
5硬盘回写无要求


ABAQUS运行与计算机配置

    通常决定网格计算速度的因素有三个方面:

 

        1 计算模型的大小和复杂度

        2 图形工作站硬件配置

           CPU核数和频率、内存容量、硬盘IO读写带宽和IOPS、总线频率

        3 操作系统和应用软件的优化设置

 

 

        CPU----决定网格计算速度

        内存---决定的网络计算规模

        硬盘---决定隐式计算中间数据回写性能

        显卡---决定计算结果的图形生成可视化模型规模和性能

 


分类

CPU核数

内存

硬盘IOPS

硬盘带宽

隐式计算(静态)

隐式计算(动态)

显式计算


 

关于CPU和内存的要求

    首先CPU和内存频率越高,计算速度就会越快

    如确保CPU所有的核心100%进行运算,


    所进行运算的数据容量一定不要超过可使用的空闲内存容量,


    否则整个计算过程要被内存空间不足,

    内存不足 就需要从虚拟内存硬盘缓冲区频繁数据读写,

    由于SSD的IO与内存的IO带宽的差异较大,导致系统需要等数据的过程,延迟等待.

 

关于网络计算规模对应CPU核数

    从现有规格Xeon E3、Xeon E5 2600处理器规格来讲,

    通常小规模(300万网格以内)推荐4-8核图形工作站,

    中大规模(600万网格以内)推荐8-16核图形工作站,

    超大规模(1000万网格)推荐16-32-64-128核图形工作站。

 

    核与内存容量的比例

    每个核与内存数据计算量大概在1:4~8比较合理 ,

    例如:    4核对应内存16GB~32GB,

                8核对应32GB~64GB,

                16核对应64GB~128GB,

    当然内存越大越好,如果使用RAMDISK或者NVME U2 SSD 可以帮助你大幅缩短数据交换时间。

 

    网格规模与内存容量合理分配
    如果设置ABAQUS使用的内存上限超过实际的物理内存,

    调用的数据就会从虚拟内存、硬盘来读去,

    CPU的等待时间大大变长,造成计算速度整体下降。


    所以务必保证控制好数据占用内存容量上限,必须是计算机物理内存实际能空闲提供给ABAQUS使用的内存。

 

    硬盘的性能

    在计算过程中,如果内存容量不够, 数据文件是放在硬盘上的, 

    如果内存足够大的话, 这个文件则会由ABAQUS进行任务调度放入内存以提高速度, 

    即设定内存使用量的百分比. 这个不是指所需的内存量, 而是作为一个控制磁盘剩余空间的参数.

 

    内存容量毕竟有限,如果模型特别大的话,两类文件加起来得几十个GB,肯定得往硬盘里写数据。

    所以提升效率最经济的方法就是把硬盘读写的速度提上去,就得通过RAID方式提升硬盘的读写性能,

    详细推荐参考下面配置方案中得硬盘使用。

 

计算中的操作软环境注意


一般计算所用的操作系统,基本都是window和linux 64位,

但是基于Linux环境的计算时间普遍比Windows环境要短的多,

另外安装过程也有很多注意事项,只有对整个运行过程非常了解,设置合理,对计算速度提升非常大的。

 

在ABAQUS的有限元模型分析计算中,

会生成临时文件,尽量将文件存储介质放到最快的存储介质上,对整体运算也是非常重要的。

 

由于内存读写速度比硬盘读写速度快,

所以如果计算机配置不变的情况下,

要达到最快计算速度,就要在计算时让两种临时文件都放在内存中。



 ABAQUS工作站配置方案

方案1   中小规模网格计算配置方案

        定位  适合100万以内自由度(30万节点)的计算规模

 




 

该配置特点:

CPU采用intelSandy Bridge Xeon E3处理器,使用了新的环形总线设计,这条环形总线由四条独立的环组成。环的访问总会自动选择最短的路径,以缩短延迟。随着核心数量、缓存容量的增多,缓存带宽也随时同步增加,因而能够很好地扩展到更多核心,这样,SNB每个核心的三级缓存带宽都是96GB/s,堪比高端Westmere,而四核心系统更是能达到384GB/s,因为每个核心都在环上有一个接入点。

环形总线的存在,可以大大减少核心访问三级缓存的周期。在以往的产品中,多个核心共享一个三级缓存,需要访问的话必须先经过流水线发送请求,在进行优先级排序之后才能进行。新的环形总线将三级缓存分割成了若干部分,借助于每个节点,核心可以快速的访问LLC。

另一个亮点就是 “AVX高级矢量扩展”指令集”,Sandy Bridge平台的SIMD演算单元扩展到了256bits,同时数据传输也获得显著提升,AVX指令集使得CPU内核浮点运算性能提升到了2倍。

 

 

方案2  中大规模的网格计算配置方案

 

            定位  适合300万以内自由度(100万节点)的计算规模

 




 

方案3 超大规模的网格计算配置方案




        定位  适合600万以内自由度(200万节点)的计算规模

 




 

 

方案4 分布式静音计算集群解决方案


        定位  适合办公环境下的,1000万以内自由度(300万节点)的计算规模

 

 

分布式静音集群配置




 

 

ABAQUS仿真计算选型

计算规模划分,推荐硬件架构
    1000万节点以内,图形工作站
    1000万节点以上,多机集群

Abaqus/Standard硬件配置特点


NO

关键项

配置重点

1

CPU

1.高频  2.多核(32核以内)

2

内存

对应CPU核心1:8(32核*8GB=256GB)

3

GPU加速

支持GPU加速,

主要型号:GP100,GV100

4

图卡

前后处理,Quadro入门级

5

数据回写

高IO,推荐NVME SSD

不推荐机械,速度差太多


Abaqus/Explicit硬件配置特点


NO

关键项

配置重点

1

CPU

1.高频  2.多核(64核以内)

2

内存

对应CPU核心1:2或者1:4(32核*2GB=64GB-128GB)

3

GPU加速

不支持

4

图卡

前后处理,Quadro入门级

5

数据回写

无要求






解决方案