用课堂授课方式。通过集中授课培训,让学员掌握硬件设备的架构、原理,平台技术、应用选型和安全维护,以及常见故障的判断分析;整体系统的架构、平台技术;各种操作系统、软件系统、应用软件的基础知识、原理介绍、系统调优、应用软件迁移等知识。Р现场操作培训Р在预安装阶段,客户可以安排人员参与我们的工作,我们将通过对整个系统的安装、调试,让用户管理员有一个感性的认识,并能够对硬件设备进行一般的操作、维护和常见故障的判断分析。对软件系统有深入的理解,可以自主使用应用软件功能。在上述的实践培训和实际操作过程中,我们将和您一起分析遇到的问题,并对您进行故障判断、排除等方面的现场培训。Р用户现场培训Р在用户现场培训阶段,我们的工程师将主要培训客户如果管理和使用这套集群系统,尤其是集群管理,作业任务提交,系统维护等方面能够熟练使用。在上述的实践培训和实际操作过程中,我们将和您一起分析遇到的问题,并对您进行故障判断、排除等方面的现场培训。Р国家超算中心运营Р目前,随着越来越多的高性能计算机的面世,超算中心关键设施的运营和维护(O&M)正受到与建设和设计这些复杂场所同等地位的对待。由于关键基础设施变得更加复杂,提高了容错性和并行维护能力,建立同等的O&M实践管理这些设施的重要性变得日益明显。研究显示,有60%甚至更多的事故都与人类的活动相关,包括例行的维护和关键系统的重新配置,维护任务以及人为失误。Р支持连续运营的必要人员和程序必须在数据中心运行第一天到位,这需要在数据中心开始运营之前就做好这些准备工作,最好在规划和需求定义阶段就开始准备。Р用户国家超算中心的建设是一个非常重大的项目,面对一个如此大规模的系统,后期的运营和维护将是一个很大的挑战。Р后期工作主要包括:Р维护超算系统稳定高效运行Р.定期对超算系统进行巡检,发现问题及时排除。Р定期检查用户作业运行情况,必要时进行处理。Р负责超算中心扩充建设