高性能计算集群系统 2020-11-26 14:14

华中科技大学土木工程CAE高性能计算集群项目方案设计及具体实施方案,全方案驻场维护服务

此高性能计算集群实施和培训服务将会在已经完成上架的各种硬件设备进行系统软件的安装和配置,从而真正成为一套可用于实际工作的集群系统。联想企业级业务集团专业服务团队的高性能计算实施工程师通过快速配置集群以满足客户的需求,并且针对集群日常管理所需的技能对客户进行培训。联想企业级业务集团专业服务团队拥有专业的高性能计算领域的知识和技能,快速帮助客户将各种硬件组合成集群系统。

本项目遵循标准的流程,以下标准实施流程图:

111.png

我们负责安装本项目中所有的硬件产品,包括服务器设备、存储设备、InfiniBand网络和以太网络设备等,完成这些设备之间的互连以及与客户网络连通。

在硬件平台安装期间我们将先通过信息收集了解系统的安装环境,为规划和设计做准备,同时在装机之前,我们将发送设备物理环境要求给客户,以便客户可以尽早准备好硬件安装环境,保证未来的设备安装过程顺利。

在本项目实施过程中,根据客户要求,我们工程师可对项目涉及的硬件、软件及相关技术进行现场技术交流培训和介绍。经过现场培训后,用户能够掌握集群的基本软、硬件维护工作并能排除大部分的故障。

内容主要包括:

  • Linux操作系统培训:用户管理,文件管理,设备、网络管理,进程管理等;
  • 集群管理软件培训:界面操作,用户管理,系统管理等;
  • 作业调度软件培训:作业提交与管理,状态查看等;
  • 并行文件系统培训:并行文件系统的配置、使用和日常维护;
  • 集群管理及日常维护:日志查看,日常维护,故障诊断与排错等;
  • Intel套件培训:编译器,数学库,并行开发环境的相关培训。
  • 应用运行特征的收集和分析方法相关培训

在系统安装工作完成后,由我们技术人员向华中科技大学项目组提交一份系统安装验收计划和验收方案,经双方同意后,该方案将作为验收的依据。当该方案中所开列的所有测试项目均通过后,视为系统安装工作通过华中科技大学的验收。系统安装验收工作结束后,我们和华中科技大学共同签署系统安装验收证明。