电信行业

Telecom Industry

您的位置:首页 > 成功案例 > 电信行业

唐山移动IT运维管理项目

项目背景
    为提高客户感知,增强网络维护能力,唐山分公司网管软件项目需求如下:
    1、监控管理:主要包括网络系统监控、服务器监控、操作系统监控、数据库监控、中间件监控、应用监控等。
    2、运维管理:主要包括配置管理、变更管理、发布管理、突发事件管理、问题管理、任务管理和巡检管理等。此外还应该包含知识管理:如文档管理、知识库管理等。
    交付使用时应当为一个完整的运维监控和IT服务管理系统,实现对网络、应用系统的全面监控,建立起统一、完善、科学的运维管理流程,全面提高和规范运维水平。

解决方案
    针对唐山移动在开展业务时遇到的问题,上海泰信科技为唐山移动提供了一套全面管理网络设备,服务器,应用服务系统,主机和链路的有效管理工具,包含了APEX NetManager网络管理、APEX ApplicationsManager应用与服务管理、APEX OSSWorks运维管理这三个模块,帮助联合金融集团实现了花最少的时间、最少的人力、物力、财力来完成日常运维工作,提高信息中心工作效率和工作质量,降低网络运维成本,充分提高了金融客户的满意度。
统一监控
    APEX系统能够实现对骨干网及所有分支机构网络状况的统一展示、统一监控,能够对所有网络设备的性能状况了如指掌,并且可以将不同网络设备的健康状态以及链路的负载状况实时展现在拓扑上,如果遇到网络故障,不用打电话或者来回奔波各个移动营业部现场,运维人员只需通过网络监控系统的实时告警详情以及所对应的根本原因分析就能迅速找到故障根源节点,在信息中心就能完成运维工作。
服务台
    本次项目服务台为唯一对用户开发的故障申告接口,用户通过拨打报修电话方式,报告故障、咨询问题。服务台人员接到故障电话后,在系统中记录用户故障情况,进行初步故障原因分类判断后,生成事件工单发送给实际处理问题的运维人员,服务台人员不做故障解决工作。所以运维平台采用集中式部署即可。
    对于服务台工作界面的要求:能够快速检索到故障申请人的基本信息,能够快速记录故障描述,并确定故障分类,准确的发送给一线技术人员处理。
    根据以上需求,服务台模块实施时,首先按IT部门运维中实际情况,在系统中建立故障分类明细表,故障类别与负责处理此类故障运维人员建立对应的关联关系,保证服务台人员在判断选择故障类型后,此工单处理人即可自动关联。其次,建立与用户人员信息数据库的接口,从原有计费系统中读取用户信息。最后,对工单中的信息项做微调。
事件管理
    IT部门负责本地信息中心设备及院内外接入网络用户的维护工作,运维部门按维护对象分为3个组,应用服务器组、网络组、接入用户组。故障处理机制为一人负责制,运维人员接到工单后,需要一直跟单,所有运维人员可以统一定义为相同的角色,具有承接工单、编辑工单、处理工单、转发工单的权限。IT部门技术负责人定义为事件经理角色,负责事件审核,具有关闭工单、重开工单、指定工单处理人、删除工单的权限。
    当工单出现运维对象判断错误发送给错误的组别人员时,可以选择转发工单,但转发必须在备注中写明转发原因。
    事件流程只涉及IT部门内部人员,不触发其他流程,不涉及其他业务部门审批环节。
值班管理
    除了日常运维工作外,IT部门都有值班制度,以保证正常工作时间以外的业务系统运转及紧急服务请求,值班管理模块用来对IT部门人员的值班工作进行管理,确保值班人员安排有计划、有步骤的执行,有记录可查。
    值班表的部署,重点在于协助客户理清人员值班时间、值班周期,在系统中进行周期性排班设置。值班表设置完成后,每个运维人员登录系统后,即可看到工作台界面值班表上自己的值班班次,在值班当天,可以填写值班日志。
问题管理
    一线工程师在工作中发现,经常有大量重复性的事件发生,经过分析,有些事件故障根源是相同的,只要解决故障根本问题,此类事件将不会再次发生,为了解决这类问题,需要引入问题管理流程。
    根据客户运维组现有组织机构设置,问题评估、问题调查、制定方案3个环节流转权限赋予二线工程师,由二线工程师负责设和相应事件分类的问题评估及解决方案制定。为方案审批、方案实施分配、变更流程触发权限设置问题经理角色,由运维部门技术经理担任。
配置管理
    配置管理负责提供一个综合数据库,记录所有IT设施信息及之间的关系,并提供科学化的流程来负责核实日常运维工作中的变更、配置项之间的关系是否被正确地记录下来、管理IT组件的运行状态,以确保配置管理数据库能够准确地反映现存配置项的实际版本情况。
    对配置管理数据库中的数据项不能直接进行修改,必须由变更管理流程发起,因此配置管理与变更管理是紧密结合的,变更管理流程引发和控制对配置项的修改,相反,配置管理向变更管理提供详细的信息,以帮助分析评估比变更带来的影响。
知识库管理
    知识库是技术经验积累与传播的重要功能模块,新的IT运维人员可以通过老员工积累下来的知识记录迅速提升运维效率,老员工也可以随时查阅遗忘的知识库记录,及时共享及时经验。普通用户可以通过知识库查找通用IT设施的操作指南,简单应用的执行方法,通过FAQ排查、定位常见故障。
    建立完善的知识库,除了项目实施时,把已有的知识录入外,需要在系统运行过程中不断更新维护。知识库必须设置专门的知识库管理员角色,负责日常知识维护。
资产管理
    资产管理模块是通过对资产生命周期的一整套过程进行科学管理的流程,帮助IT部门解决软硬件设备统计、资产状态维护、资产维修记录、设备借调借用等问题。

客户评价及收益
    唐山移动信息中心部署了上海泰信科技有限公司的APEX IT运维和服务管理系统后,可通过APEX统一监控平台及时发现网络、服务器、业务系统等的故障征兆,防患于未然,快速定位故障根源,有效的缩短故障时间和影响范围。使可预知故障发生率收敛。实现事前处理,改变了以前头痛治头,被动运维的模式,提高运维效率,业务部门对IT运维团队的满意度明显提升。
    通过实施ITSM中的服务台、事件管理、资产与配置管理,使得运维流程更加清晰,责任更明确,面对突发事件有了应急的解决办法,对于经常发生的事件也有了不同等级的团队层层解决,避免了以前各部门和运维人员、设备供应商之间的互相推委,故障处理流程化、规范化,同时也对变化中的IT资产实时掌控。
 

上海泰信科技有限公司 版权所有 | 沪ICP备05079988号