PC桌面项目运维方案.docx
项目实施方案客户名称:XXX签约日期:XX年XX月XX日项目名称:xxx2013-2014年度桌面设备维护XXX公司XX年XX月XX日第一部分:项目概要11. 项目背景12. 项目目标13. 项目服务范围2第二部分:项目人员配备41. 项目团队人员架构42. 项目成员工作职责43. 项目团队工作与运维体系6第三部分:项目资源配备91. 项目硬件资源需求92. 项目软件资源需求9第四部分:项目实施进度安排111. 项目服务进度表112. 项目服务实施内容18第五部分:项目预计成果展示27第六部分:项目服务管理计划2955第七部分:附件第一部分:项目概要1 .项目背景2 .项目目标 提供专业维保服务针对本次维保服务,我们公司会为客户提供专业维保服务:通过日常维护,保证维保范围内设备的正常运行;当设备一旦报障故障时,能及时进行响应,对故障进行诊断、分析,尽快解决系统故障,将故障影响降低到最小程度;定期对维保设备做清洁、保养维护,从而延长此类设备的使用寿命,最大限度的降低运维成本;制定紧急应急措施,做好预防性维护; 建立设备配置管理加强it资产的巡检和普查,委派专职的配置管理员,收集业务系统、硬件、软件、文档、线路、系统环境等信息,建立了各种配置项间的关联关系。通过该配置管理数据库,获得目前IT基础设施状态的准确信息。规范配置信息的识别、管理,使得关键的配置信息准确地记录在管理数据库中,确保配置信息记录与实际环境的一致性。按日、周、月、年对设备基本信息、性能数据、故障信息、安全信息、服务信息进行统计分析,为决策提供支持。 加强问题事件管理问题管理流程的目标就是通过一系列规范的环节,找到问题的根源,并形成解决方案。从问题的检测与记录开始,经过对问题的分类和分派、调查和诊断,直到问题的最终关闭。各环节连续清晰,环节角色分工明确,从而实现在发现问题后,能够迅速地找到问题的根源,形成解决方案,为最终解决问题打下基础。问题管理也是形成交警自身知识库的重要环节,是服务质量持续提高的一个有力保障,此项目中需加大问题管理流程建设的力度,日常维护服务中注重问题管理流程的落实。 完善服务管理体系完善的服务管理体系是运维工作重要的指导,规范了运维工作的流程、操作管理制度、人员考核制度,确保和提高系统设备的使用率,保证运维工作快速有效。 做好应急预案应对突发事件,做好应急预案是项目维保问题管理及持续性管理的重要内容。评估重要资产面临的风险,需要主动做好突发事件的前期预防和预警,制定应急预案,采取相应措施,最大减少事件影响及带来的损失。3 .项目服务范围第二部分:项目人员配备1 .项目团队人员架构项目团队由1名项目经理、1名项目副经理,5名驻场服务人员组成。其架构如下图所示:2 .项目成员工作职责项目经理> 项目经理是项目的指导者,对项目的整体工作负责。> 组织项目各阶段任务的实施,指导项目组成员工作确保项目组成员能够履行各自职责,对项目阶段任务的完成和质量负责。> 审查项目管理计划、项目进度报告和项目进展情况。> 充分了解并确认用户需求,对项目的考核结果是否达到合同需要负责。对维护工作进行紧密跟踪和管理,为项目组调配人力资源和其他资源。与用户方的就重大问题进行协调,定时参加甲方组织的此项目的重要会议。控制项目的风险确保项目有效执行。项目副经理在项目经理不在现场情况下,代表项目经理处理有关事项。负责制订项目计划,分解项目阶段,确定任务优先级,合理利用资源,对项目实施计划的执行负责。对项目信息的及时准确沟通负责,确保项目计划和项目进度和质量能够准确及时传递给用户、项目经理及项目组成员。制定周计划、周报及月计划、月报等相关工作总结,安排项目组内部收集各种服务数据并对其进行分析与发觉,改善服务质量。定期召开项目组内部会议,总结工作成效,安排工作任务;参加月度例会,向用户汇报项目上月工作成效和本月工作计划,接受用户改进建议并落实。组织培训项目组人员的服务意识、技术水平等综合素质满足项目要求。对项目组成员的绩效进行考核、对项目组成员进行日常管理及考核。跟踪、协调、解决用户投诉问题,定期与计算机管理员进行沟通与回访,把维护工作中的处理情况及时进行跟踪。驻场服务工程师接受服务台报障的派发、及时与用户联系,对事件进行查明、记录、归类与初步支持。对用户事件进行电话支持,电话中不能解决的,需在约定时间内到达用户现场,为用户提供专业服务,并将工作相关情况与服务台进行沟通交流。对在约定时限内无法解决问题的及时上报给服务台进行事件升级。负责事件的跟踪、监督、控制和协调解决。事件终止后保留事件的有效记录以便能够权衡并改进处理流程。对某些解决方法来说,向变更管理发送变更请求。3.项目团队工作与运维体系安全管理制度项目组工作描述体系纵向描述了信息沟通的层级横向为职务资料体系,描述了岗位的主要工作信息职务说明书工作规范/操作规程岗位培训教材工作报告标准工作计划标准管理岗位职务资料隐患处理流程如果对于系统中存在的隐患不加以重视,最终极有可能造成严重的后果。为此我们还针对本项目专门涉及了一个隐患处理流程。当发现系统中存在隐患的时候,我公司将组织二线支持人员,甚至是从公司调派专家和联系原厂商进行技术支持,以判明隐患的潜在影响程度。知识库管理流程知识库管理流程用户生成服务需求用户知识库鼠叵斑aM%M工W决.解未®叵斑犍tt%Me咽H出现故障工程师知识库2.项目管理规范L建立完善的管理制度、制定工作流程、人员考核制度(月度考核),确定维护人员的岗位职责(应包括人员的上班时间、休息及备勤时间,上班时间的分配等内容),能够对维护人员的工作进行跟踪及质量监督,有完备的文档资料产生。2 .编制维护手册(建立相应的服务工作指南,规范日常工作步骤),建立完备的维护过程文档资料,统一格式、做好分类,最终建成维护文档库(利用日常积累的故障及解决方案对系统现状进行预先判断),并采用一定的管理软件进行过程管理和维护的状态管理。3 .针对客户计算机设备及系统出现大面积紧急故障或由于其他原因导致服务工程出现人手不够,不能及时完成任务时,维护方公司将给予全力支持提供应急服务分析常见的、关键的薄弱环节,搭建模拟测试环境找出解决方案,指导常驻人员解决问题。4 .确保和提高系统设备的使用率,做好各类设备运行状况的记录工作,保证维修工作快速有效,制定定期检修及所有设备的巡检计划(按单位分类,一年两次,做好登记并形成文档形式递交),提高监控设备的完好率和降低故障发生率。5 .每次更换的所有零配件应同时填写有关保修卡交用户方保管,如部分零配件没有保修卡,也应出具维护方公司的维护期保证书,现统一所有的零配件保修期为一年,以方便用户方日后的维护工作。6 .对所有设备进行分类并登记在册形成文档,做好设备的管理、分配、调拨等工作,协助做好固定资产登记的工作。7 .建立人员知识更新制度。包括能力的持续性培养,建立素质模型,明确岗位设置,全面掌握新产品新设备的特点、性能及维护要领,明确维护工作的任务、责任和质量要求。3.服务响应级别>响应时效等级划分响应时间响应级别评分等级备注说明1至5分钟之间1级非常满意项目合同要求响应时间必须在15分钟之内5至10分钟之间2级满意10至15分钟之间3级及格15分钟之后4级不及格>故障解决时间等级划分故障解决时间解决级别评分等级备注说明30分钟以内1级非常满意项目合同要求故障解决时间必须在2小时之内30至60分钟之间2级满意60至120分钟之间3级及格120分钟之后4级不及格>服务类型与SLA服务级别对应原则服务类型SLA服务级别备注说明标准级银牌级金牌级灾难性故障灾难性故障是指项目中硬件或软件遭受到一种彻底、突然、通常意想不到的崩溃。长时间影响到系统正常运作。如:硬件不可修复的损坏、软件重要的数据丢失或代码崩溃等;严重故障严重故障是指重要的硬件或软件遭受到报错,短时间内影响系统正常运作。如:设备宕机、软件漏洞等;普通故障普通故障是指一般性的报错,对系统正常运作影响比较小。事件分类、安全风险,采取主动预防措施,制定应急预案,把问题管理做落到实处。桌面应急故障的分类一般桌面设备应急事件主要指少量PC设备由于硬件故障及系统软件故障,而影响个人工作的事件,对于此类事件首先是采取合理的方式,尽快解决故障,恢复正常工作,而硬件故障在现场不立即解决的情况下,最快捷的解决方式是备件替换。重大的桌面突发事件主要是指由于由于自然灾害、设备软硬件故障、内部人为失误或破坏、黑客攻击、无线电频率干扰和计算机病毒破坏等原因,出现的业务中断、系统破坏、数据破坏或信息失窃或泄密等现象,即涉及大面积桌面设备的网络与安全突发事件。一般桌面故障处理基本原则令从最简单的事情做起简单的事情,一方面指观察,另一方面是指简捷的环境。A简单的事情就是观察,它包括:1 .设备周围的环境情况位置、电源、连接、其它设备、温度与湿度等;2 .设备所表现的现象、显示的内容,及它们与正常情况下的异同;3 .设备内部的环境情况一一灰尘、连接、器件的颜色、(电源、主板、CPU、内存、显示卡、其它可能的板卡;BIOS中的设置;开关及开关线、复位按钮及复位线本身的形状)、指示灯的状态等;4 .设备的软硬件配置安装了何种硬件,资源的使用情况;使用的是何种操作系统,其上又安装了何种应用软件;硬件的设置驱动程序版本等。1简捷的环境包括:1 .后续将提到的最小系统;2 .在判断的环境中,仅包括基本的运行(电源、主板、CPU、内存、显示卡、其它可能的板卡)/软件,和被怀疑有故障的(电源、主板、CPU、内存、显示卡、其它可能的即在服务前,与用户沟通,了解故障发生前后的情况,进行初步的判断。如果能了解到故障发生前后尽可能详细的情况,将使现场维修效率及判断的准确性得到提高。了解用户的故障与技术标准是否有冲突。向用户了解情况,应借助相关的分析判断方法,与用户交流。这样不仅能初步判断故障部位,也对准备相应的维修备件有帮助。令复现故障即在与用户充分沟通的情况下,确认:1 .用户所报修故障现象是否存在,并对所见现象进行初步的判断,确定下一步的操作;2 .是否还有其它故障存在。令判断、维修即对所见的故障现象进行判断、定位,找出产生故障的原因,并进行修复的过程。令检验L维修后必须进行检验,确认所复现或发现的故障现象解决,目用户的电脑不存在其它可见的故障。3 .必须按照送修单所列内容,进行整机验机,尽可能消除用户未发现的故障,并及时排除之。人员安排对于大面积的桌面故障,我们将第一时间启动应急预案,项目负责人在最短的时间内到达现场,成立现场应急处理工作组,了解情况,组织人员,分析原因,解决故障。由用户方项目经理任小组应急组长,服务提供商项目负责人任小组应急副组长,成员包括:服务