系统维护服务 2015-11-23 11:12

目前BOSS/NGBOSS认证子系统中采用了EMC公司RSA SecurID双因素身份认证产品。文讯公司将提供RSA软件技术的支持服务,确保服务的可靠性和安全性。

为了提供更好的管理监控,并与项目执行组织的持续运作之间建立恰当联系,我们把整个项目执行分为五个阶段:

  • 准备阶段:项目前期的准备工作,证实一个项目已经正式启动。
  • 计划阶段:制定并维护一个可执行的进度计划,以实现所承担项目所要达到的目标。
  • 实施阶段:协调人员和其他资源以执行计划。
  • 控制阶段:通过监控和测量过程,并在必要的时候采取纠正措施以确保项目目标的实现。
  • 收尾阶段:项目的正式接收并达到有序的结束。
  • 各个阶段通过它们创造的结果相互联系-每个阶段的输出或结果成为另一个阶段的输入,如下所示:各阶段的相互关系。

    1.1    故障处理服务

    广州文讯公司的故障解决服务是根据用户业务的时效性需求,对用户 IT 元件提供的响应式服务。其服务对象包含信息系统软、硬件组件;服务级别由高到低分为 A+、A、B、C 四个级别,也可根据需求为用户定制;通过远程或现场服务, 在用户可接受的时间范围内对用户的信息系统进行故障诊断和排除,最大限度地 保障用户信息系统的可用性,降低故障对业务运作的影响。

    服务内容

    • 远程问题诊断和支持服务

    在用户对广州文讯公司提出问题诊断和支持服务请求后,广州文讯公司将在合同规定的响应时间内与客户沟通,共同解决系统问题。在提供任何必要的现场 服务之前,广州文讯公司将首先使用远程支持服务工具对服务范围内的设备进行远程诊断,或通过其他远程方式为解决问题提供帮助。

    • 现场支持服务

    对于不能通过远程方式及时解决的问题,广州文讯公司的工程师将到客户现场进行系统的维修并使其恢复运行。 在提供现场技术支持前,工程师将作好必要的准备(包括如查阅客户和设备档案,了解设备运行情况及设备以往所发生过的问题的处理办法等)。 到场后,技术支持工程师首先提交现场技术服务申请报告给用户现场负责人签字确认。经用户方批准根据现场情况提出的现场支持解决技术方案后,指导用户方的技术人员具体实施;或经用户允许由现场技术支持工程师进行具体实施, 以避免因盲目动手给用户方造成损失。

    技术支持工程师到达客户现场后,在系统能够重新正常运行之前,不能停止服务;只有当需合同外的备件或资源时,服务工作可暂停;一旦这些备件或资源 备齐,可应用户要求立刻进行服务。当用户方为了解决故障确定实施软件版本/补丁升级后,广州文讯负责作出 补丁加载的计划、步骤、可能对设备/网络造成的影响以及甲方需做的准备工作 等。在用户方人员配合下,按照用户方确定的时间完成软件补丁安装或版本升级 操作。软件补丁或升级完成后,广州文讯技术人员根据用户需要可以配合用户方 观察设备运行一至两天,并提供升级报告。

    现场技术支持服务完成后,技术支持人员将向用户方提交现场技术服务报告,用户方签字确认,双方各自存档;另外针对本次服务的相关内容,广州文讯 技术人员可根据用户需要对用户方进行解释和现场培训。

    • 紧急故障恢复服务

    紧急故障恢复服务包括紧急电话支持服务、紧急远程支持服务和紧急现场支援服务。根据用户申告的设备故障信息及其要求,立即安排经验丰富的技术工程 师进行电话支持和远程技术支持,同时安排技术工程师立即赶往现场,并成立后 方专家小组配合进行故障处理,如有必要将在后方实验室模拟故障发生原因和解决方法。

    在紧急故障恢复服务过程中,广州文讯工程师负责记录所有事件的发生时间 及所采取的措施;设备故障处理完毕以后,视情况双方协商决定可以由技术工程 师在现场观察 1-2 天,在征得用户同意后,技术工程师再离开现场。

    • 疑难问题升级服务

    广州文讯公司具有完善的、全国性的技术支持网络,并设置了正式的疑难问题升级流程,以便解决复杂的系统问题。疑难技术问题,可以利用升级服务的支 援手段,通过广州文讯公司服务交付中心和第三方合作伙伴予以解决。

    • 辅助故障定位

    当涉及到多厂商产品的用户业务系统出现系统故障时,用户往往难于准确定 位故障点。作为软硬件系统维护的综合服务商,广州文讯可以为用户提供辅助故 障定位服务。通过协调、配合相关软硬件厂商,共同对系统故障进行排查,使得 故障得以准确定位,并以合作的态度共同完成故障的解决,从而避免因多方推委 造成用户业务的更大损失。

    1.2    巡检服务

    (一)   我公司将定期对RSA认证系统进行例行巡检,发现故障,排除隐患,并提出改进意见。

    (二)   对认证系统的巡检按照平台的巡检对象,检测与之相关的系统检测点,填写相应的巡检报告,并提交广东移动维护人员。

    (三)   巡检按周期可分为日巡检、周巡检、重大节日或会议之前的巡检。

    (四)   巡检的对象包括:

    • 检查各台认证服务器上相关认证进程运行情况、检查各进程日志。
    • 检查认证接口程序与服务器上的监控程序的运行情况和日志、分析。
    • 通过分析各应用系统管理员每天的管理登陆日志、管理行为日志对各管理员异常的管理登陆情况进行及时发现并迅速处理。
    • 通过分析各应用系统每天的用户认证登陆日志对各系统用户异常的登陆情况进行及时发现并迅速处理。
    • 检查认证系统的主备服务器用户数据同步情况,检查系统数据同步进程及其分析日志。

    (五)   不定期的系统全面巡检一般在重大节日或召开重大会议等需要加强系统安全保障的非常时期进行,按照广东移动的要求进行。其目的是为优化系统的性能,排除故障隐患,更新系统维护统计资料。

    (六)   在巡检过程中发现的异常情况,及时通知广东移动维护人员,查找原因,排除故障隐患。发现巡检中系统地异常或者认证量突变时应及时提交专家小组进行分析,必要时由专家小组提供优化。

    1.3    技术支持服务

    1.3.1        技术支持体系

    我方一贯坚持服务至上的原则并付诸实际行动,把这一理念作为公司标准组织架构和标准规范的方式确定下来,予以保证。

    我方技术支持服务体系围绕每个服务请求建立独立的线索(case)进行跟踪和管理,直到完全完成服务相应并将所有相关资料的归档为止。我们配备独立的客户服务中心负责CASE流程的执行和管理,并与相关部门进行协调合作。

    1.3.2        技术支持服务流程

    1.3.3        技术支持服务方式

    我们承诺,对本项目至少提供热线电话、网站公告、电子邮箱,远程技术支持等技术支持服务方式,但不限于如下服务方式:

    • 热线电话:7*24小时全方位支持,办公时间之外紧急情况专人电话支持。免费提供咨询电话技术支持服务,提供主机、中间件、数据库、BOSS、NGBOSS的技术咨询服务,及时提出解决问题的建议。
    • 网站公告:在技术支持服务期内,通过指定的网站,对系统重大更新信息进行发布,便于用户及时掌握更新信息,发布的信息包括常见问题解决方法。
    • 电子邮箱:提供专门的技术服务电子邮箱,对用户反馈的技术问题进行收集。我方承诺对所提出的技术问题在2小时内给予响应。
    • 远程技术支持:在用户许可的情况下,由专业的维护工程师采用电话、即时通讯、远程终端、互联网远程登录等手段对用户的系统进行调试、故障诊断和故障排除,确保第一时间内恢复系统运行。该远程技术支持将严格按照安全保密的要求,只在用户授权的情况下方可操作,并记录维护日志。

    1.3.4        技术支持服务内容

    • 我方将安排专门人员面向广东移动及各系统集成商提供以下服务响应工作:
    • 处理各系统使用RSA认证服务器进行主机登陆保护的相关部署工作。
    • 根据各应用系统的的需要协助处理各系统的认证用户数据。
    • 协助各应用系统进行RSA服务器license的管理。
    • 根据各应用系统的需要协助查询和跟踪分析各系统的认证用户log日志。
    • 处理各应用系统软、硬件令牌PIN码锁定后的初始化工作。
    • 针对各应用系统管理员RSA认证用户的管理工作提供直接的帮助和技术支持。
    • 能够提供7*24的电话支持服务的解决广东移动在系统使用中遇到的问题
    • 提供7*8的现场维护服务,保证服务的响应及时

    1.3.5        技术支持响应时间

    我司保证对不同等级的问题,各阶段处理时限不低于下表要求:

      

    故障等级

    解决时间要求

    重大故障

    在广东移动公司报障后2小时内,业务恢复。

    严重故障

    4小时内,不再影响业务运行

    一般故障

    2个工作日,故障彻底解决

    1.3.6        技术支持输出文件

    提供过往IT运维项目中的交付文档供参考,提供的文档包括系统运行周报、系统巡检月报、系统故障分析报告、应急演练、运维管理操作手册等交付参考案例文档的样例。

    交付文档清单表

    交付文档

    说明

    项目计划书

    合同签定

    《系统周巡检报告》

    每月月度服务例会上向客户汇报

    《重大故障分析报告》

    《月度服务报告》

    《RSA系统应急演练报告》

    《系统性能问题分析报告》

    数据维护知识库文档《运维管理操作手册》

    不断更新

    《RSA系统架构优化建议书》

    《RSA网络架构优化建议书》

    在项目开始后,根据实际情况进行更新。

     

    1.4    系统调整、工程支持服务

    在项目实施的过程中当广东移动需对RSA软件系统进行调整时,我公司的工程师将会按照甲方提出的时间要求及操作要求,准时到达现场提供技术支持(包括甲方在进行硬件搬迁、系统升级、系统割接等工作时,文讯将配合完成系统停、启及故障排除等工作)。

    在需要进行与主机系统相关的工程施工时,我公司将按照广东移动的工程实施安排,提供现场技术支持服务。我方工程师将会配合甲方和其他相关厂商工程师对系统运行情况进行分析,保障系统的稳定运行。

    1.5    预防性维护

    为了提高系统的可用性,要做好事前预防,将故障排除在发生之前。健康检查服务是我们提供的一项针对设备的非常有效的事故预防服务,它是主动服务的一种。通过健康检查服务可以尽早发现系统的问题或潜在问题,保证系统健康运行。健康检查将帮助客户从技术角度对正在运行的服务范围内生产系统的技术特征,故障隐患有一个全面的了解,以便根据业务发展需求和目前系统资源状况,制定合理,可行的系统扩容,改造,维护计划,提高网络生产的安全性。

    服务内容

    根据事先与客户约定的检查频次和检查内容,定期检查系统的工作状态,告知系统状态。

    • 制定健康检查计划;
    • 制定健康检查方案;
    • 制定健康检查流程;
    • 对RSA软件系统等进行健康检查;
    • 分析评估发现的报警、错误或故障;
    • 分析评估系统的目前状态;
    • 完成《健康检查报告》;
    • 与客户沟通健康检查效果,并根据设备系统运行情况向用户提供设备系统升级、改造、更换的建议。
    • 根据用户的需求,执行技术交流,现场培训

    技术交流:为了更好的了解客户的技术需求,同时也是与客户互相学习、共同提高的机会,我们可以根据用户的需求举行技术交流。形式可以是座谈,也可以是讲座和培训。

    1.6       RSA认证系统维护服务内容

    1.6.1        本维护小组结构

    为了更好的为广东移动业务支持中心RSA认证系统提供维护服务,服务供应商应成立RSA认证系统基本维护小组,配备专业的工程师提供一线服务及二线支持。

    1.6.2        系统基本维护内容

    数据备份:

    服务供应商应定期对RSA认证系统进行数据备份,数据备份包括各接入应用系统认证服务器的账号认证用户数据备份、各应用系统用户登陆认证log日志数据备份、各认证服务器上与认证相关的进程日志备份、接口程序日志备份、监控程序日志备份。

    系统软件维护:

    服务供应商应定期对RSA认证服务器进行系统软件维护,检查各认证主机系统软件运行情况:CPU、内存、SWAP、硬盘空间占用情况(各重要目录占用情况单列)、LOG空间使用情况。检查系统软件的事件报告,遇到异常记录或信息应及时报告给广东移动人员配合处理。

    巡检服务、运行保障:

    (一)   服务供应商应于定期对RSA认证系统进行例行巡检,发现故障,排除隐患,提出改进意见。

    (二)   对认证系统的巡检按照平台的巡检对象,检测与之相关的系统检测点,填写相应的巡检报告,提交广东移动维护人员。

    (三)   巡检按周期可分为日巡检、周巡检、重大节日或会议之前的巡检。

    (五)   不定期的系统全面巡检一般在重大节日或召开重大会议等需要加强系统安全保障的非常时期进行,按照广东移动的要求进行。其目的是为优化系统的性能,排除故障隐患,更新系统维护统计资料。

    (六)   高度重视巡检过程中发现的异常情况,及时通知广东移动维护人员,查找原因,排除故障隐患。发现巡检中系统地异常或者认证量突变时应及时提交专家小组进行分析,必要时由专家小组提供优化。

    (七)   不断完善重要监测点的实时监控机制。

     


    2         系统维护服务要求

    2.1       系统维护工作内容

    1、系统生产服务

    • 配合完成任务工单的处理,如提取非报表的数据、考核与指标数据、批量更新数据等。
    • 配合广东移动完成业务生产工作,包括日常数据管理、统计分析等。
    • 根据广东移动的要求,配合完成其他生产支持服务工作。

    2、系统日常巡检服务

    • 定期检测应用软件和接口,发现故障,排除隐患,提出改进意见。
    • 不断完善重要监测点的实时监控机制。
    • 重视巡检过程中发现的异常情况,及时通知相关维护人员,查找原因,排除故障隐患。

    3、系统支持服务

    • 我公司将安排专门人员面向广东移动及各系统集成商提供以下服务响应工作:
    • 处理各系统使用RSA认证服务器进行主机登陆保护的相关部署工作。
    • 根据各应用系统的的需要协助处理各系统的认证用户数据。
    • 协助各应用系统进行RSA服务器license的管理。
    • 根据各应用系统的需要协助查询和跟踪分析各系统的认证用户log日志。
    • 处理各应用系统软、硬件令牌PIN码锁定后的初始化工作。
    • 针对各应用系统管理员RSA认证用户的管理工作提供直接的帮助和技术支持。

    3、系统性能优化服务

    我司会在服务期间内对系统运维中出现的性能下降、故障频繁等异常现象高度敏感,积极主动进行原因分析,向广东移动提出合理解决方案建议,并配合进行实施,负责定期进行应用软件优化工作,包括工作内容包括:

    • 对应用软件的运行情况进行监控,对应用软件的性能进行分析,指出可能引起性能问题的应用软件及其原因;
    • 结合业务发展情况,分析业务变化对应用软件的影响,并提出合理的优化建议;
    • 根据长期维护经验,指出应用软件可以改善、提高性能的地方,向甲方提出合理的优化建议。

    4、故障处理服务

    服务供应商应按照广东移动管理信息部故障处理流程和规范,完成RSA认证系统的故障处理。

    故障的分类及定义

    我司将严格执行广东移动对RSA系统故障现象及后果的等级划分来处理

    重大故障、严重故障、一般故障,划分标准按照广东移动故障管理办法执行。

    故障处理质量保障

    1. 我司会在在处理完重大故障之后,会在2个工作日内向广东移动提交书面故障处理报告。该报告的内容包括故障发生时间、现象描述、故障处理过程、故障原因、所采取的措施等,如果有必要,就组织人员进行专题优化。
    2. 建立完善的故障处理跟踪机制,杜绝故障发生。
    3. 在处理紧急故障时,在故障原因难以定位,而处理时限又非常紧急的情况之下,在征得广东移动维护人员同意之后,可采取主动重启服务器的方式给予解决。重启之后要进行全面的系统进程检测,确保系统正常。
    4. 我司将会努力改进故障处理方法,变被动处理为主动出击,充分发挥监控报警系统的作用,做好RSA认证系统监控工作,努力消除故障隐患。
    5. 故障原则上应由服务供应商工程师进行处理,对于影响重大,棘手的故障,为提高故障处理速度可以远程指导在现场维护的代维公司资深工程师处理。
    6. 各等级的故障处理都指派了专人负责跟进,保障故障的顺利进行。

    2.2       系统维护服务要求

    • 我方应按照中国移动广东公司相关技术业务规范、业务需求、相关指标要求,向甲方提出系统建设、维护、产品等的设计方案和建议。
    • 我方必须建立系统安全检查的制度,定期对系统及监控软件进行定期的检查和分析,并向甲方提交检查报告,保证系统安全正常的运行,并提出系统优化建议。
    • 针对各种系统的补丁升级信息,我方必须提前通知甲方并且对升级的可行性和必要性进行论证,保证系统安全可靠的运行。
    • 在维护过程中,因我方原因造成系统异常或出现重大故障,给业务发展带来的负面影响,我方必须接受甲方按合同和相关管理规定进行的管理、考核、惩罚。
    • 在系统出现故障后,我方必须全力以赴,加派技术骨干以配合甲方完成故障处理工作,保证故障处理的准确性和及时性;杜绝因误操作引发的故障;负责完成编制故障分析和处理报告。

    3         系统优化服务

    我司将对RSA认证系统运行中出现的性能下降、故障频繁等异常现象高度敏感,积极主动进行原因分析,向广东移动提出合理解决方案和建议,并配合广东移动实施。

    3.1       服务器软件优化服务

    定期对递交的巡检报告或者按照广东移动的需求对认证服务器端软件的运行情况进行优化需求分析,提交优化请求。认证服务器端软件包括:认证服务应用软件各模块、及认证接口程序各类认证Agent。

    针对认证的路由问题进行高级分析并对接口程序及参数进行优化。

    针对广东移动的系统认证接口包及用户认证管理接口的规划、开发和测试。

     

    3.2       认证系统架构优化服务

    我司将据业务支撑中心系统运行和业务发展情况的需要,就RSA身份认证系统结构等提出优化、调整和升级的建议。

    3.3       认证数据优化服务

    根据系统运行情况,对各认证用户数据库和登陆日志数据库进行参数配置、索引等方面的优化,确保各认证服务器数据库高效运行。