首页 云平台运维与运营服务方案(完整详细版)

云平台运维与运营服务方案(完整详细版)

举报
开通vip

云平台运维与运营服务方案(完整详细版)平台系统基础支撑平台与运维保障平台建设方案《基础支撑平台与运维保障平台建设方案》第PAGE3页共NUMPAGES19页目录TOC\o"1-3"\h\z\uHYPERLINK\l"_Toc421738390"1项目概述PAGEREF_Toc421738390\h2HYPERLINK\l"_Toc421738391"1.1项目背景PAGEREF_Toc421738391\h2HYPERLINK\l"_Toc421738392"1.2项目目标PAGEREF_Toc421738...

云平台运维与运营服务方案(完整详细版)
平台系统基础支撑平台与运维保障平台建设 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 《基础支撑平台与运维保障平台建设方案》第PAGE3页共NUMPAGES19页 目录 工贸企业有限空间作业目录特种设备作业人员作业种类与目录特种设备作业人员目录1类医疗器械目录高值医用耗材参考目录 TOC\o"1-3"\h\z\uHYPERLINK\l"_Toc421738390"1项目概述PAGEREF_Toc421738390\h2HYPERLINK\l"_Toc421738391"1.1项目背景PAGEREF_Toc421738391\h2HYPERLINK\l"_Toc421738392"1.2项目目标PAGEREF_Toc421738392\h2HYPERLINK\l"_Toc421738399"1.3建设内容PAGEREF_Toc421738399\h2HYPERLINK\l"_Toc421738402"2现状及需求分析PAGEREF_Toc421738402\h3HYPERLINK\l"_Toc421738403"2.1信息化现状PAGEREF_Toc421738403\h3HYPERLINK\l"_Toc421738404"2.2存在的问题PAGEREF_Toc421738404\h4HYPERLINK\l"_Toc421738405"2.2.1运维保障面临主要问题PAGEREF_Toc421738405\h4HYPERLINK\l"_Toc421738406"2.2.2现有保障手段不能满足需求PAGEREF_Toc421738406\h4HYPERLINK\l"_Toc421738407"2.2.3管理运维问题PAGEREF_Toc421738407\h5HYPERLINK\l"_Toc421738409"3方案总体设计PAGEREF_Toc421738409\h6HYPERLINK\l"_Toc421738410"3.1设计原则PAGEREF_Toc421738410\h6HYPERLINK\l"_Toc421738411"3.2总体架构设计PAGEREF_Toc421738411\h7HYPERLINK\l"_Toc421738412"3.3实施思路PAGEREF_Toc421738412\h7HYPERLINK\l"_Toc421738414"4虚拟桌面技术方案设计PAGEREF_Toc421738414\h10HYPERLINK\l"_Toc421738416"5服务器虚拟化方案设计PAGEREF_Toc421738416\h11HYPERLINK\l"_Toc421738417"6业务系统运维保障设计PAGEREF_Toc421738417\h13HYPERLINK\l"_Toc421738418"6.1架构设计PAGEREF_Toc421738418\h13HYPERLINK\l"_Toc421738419"6.2业务系统应急PAGEREF_Toc421738419\h14HYPERLINK\l"_Toc421738420"6.3数据保障PAGEREF_Toc421738420\h15HYPERLINK\l"_Toc421738421"6.4运维迁移PAGEREF_Toc421738421\h15HYPERLINK\l"_Toc421738449"7项目实施计划PAGEREF_Toc421738449\h16HYPERLINK\l"_Toc421738450"8项目组织保障PAGEREF_Toc421738450\h17HYPERLINK\l"_Toc421738451"8.1工作领导小组PAGEREF_Toc421738451\h17HYPERLINK\l"_Toc421738452"8.2项目专家小组PAGEREF_Toc421738452\h17HYPERLINK\l"_Toc421738453"8.3项目技术小组PAGEREF_Toc421738453\h17项目概述项目背景国土资源“一张图”和综合监管平台建设(以下简称“一张图”工程)是国土资源信息化“十二五”规划中的一项核心内容。根据《国土资源部关于进一步运用现代科技信息手段规范和创新管理的指导意见》(国土资发〔2010〕81号)、《山东省国土资源系统‘一个平台、两个市场’建设方案的通知》(鲁国土资发〔2011〕33号)和《青岛市国土资源和房屋管理局关于加强信息化建设工作的意见的通知》(青土资房发〔2012〕465号)等一系列文件的要求,青岛市国土房管局xxx分局拟开展xxx区国土资源一张图工程和服务平台系统基础支撑平台及运维保障平台建设,为一张图工程和服务平台系统搭建安全、可靠的基础设施环境,为全局信息化发展奠定坚实的基础。项目目标基础支撑平台及运维保障平台的建设实现以下主要目标:通过加强对业务内网、办公网、互联网的安全管理,实现生产数据和涉密信息的集中存放和管理,保证信息安全;通过为32个乡镇国土所提供云端虚拟桌面服务,保障数据不在国土所用户的终端设备上落地的基础上,实现各项数据及业务应用的便捷接入,有效促进业务协同;通过运维保障平台的建设,为全区国土资源用户提供一致、高度可用、高度可扩展的服务,最大程度地减少系统停机,全面支持国土全系统的业务连续性;通过云平台建设,充分整合已有资源,实现IT基础设施的集约化建设。建设内容基础支撑平台及运维保证体系主要包括以下建设内容:业务网、办公网、互联网网络接入及防火墙设备与交换机设备环境的规划、设计与整合;局机房服务器、存储、光纤网络环境的设计、整合与搭建;局业务网服务器虚拟化与桌面虚拟化资源池的统一建设;局国土政务管理服务系统、OA等业务系统及数据中心的运维保障平台的统一建设现状及需求分析信息化现状xxx国土资源分局是主管xxx区有关土地、矿产等自然资源的规划、管理、保护与合理利用工作的市政府工作部门,负责全市土地、矿产等自然资源的保护与合理利用等重要工作,在现代化新形势发展要求下,配备了一系列提高工作效率和功能的信息化业务系统。具体的信息化现状如下:网络现状:办公网(金宏)、业务内网(涉密)、互联网、互相物理隔离,主要业务信息系统部署在业务内网(涉密)。基础架构:网络通过分网络部署防火墙、交换机实现各网络分离。实现在新的机房中部署一套虚拟化系统,实现物理服务器资源的集中管理与调用。19所分支通过内网专线访问虚拟桌面平台实现办公,应用现状:业务内网主要为一张图工程和服务平台系统,具体包括建设项目用地预审管理系统、土地利用规划管理系统、建设用地审批管理系统、临时用地管理系统、设施农用地管理系统、土地利用规划管理系统、土地储备审批管理系统、土地供应管理系统、建设用地跟踪管理系统、权籍管理系统、土地登记信息动态监管查询系统、采矿权管理系统、测绘成果管理系统、OA、移动办公系统、成果展示系统、综合数据库管理系统、综合监测监管系统、移动辅助决策系统、综合管理服务平台等20个业务系统。存在的问题运维保障面临主要问题业务连续性存在潜在威胁业务系统设备多数使用一机一应用/一机多应用的模式,当前的这种部署模式,如果某台物理服务器因为各种原因计划内停机或者故障停机,都不可避免的会造成其上运行的业务系统停止的问题,这将直接影响到用户业务的正常开展。管理复杂,响应速度滞后每个业务系统的服务器的维护,高可用性和灾难备份没有统一的管理手段,只能因系统而异,管理难度大,无法响应业务系统的要求。数据和应用备份的快速恢复系统现有应用系统由于更新和版本变化。应用系统设备安装业务复杂,管理维护压力增大。当出现硬件和系统错误时候,缺少非常简便和快速备份和恢复系统。现有保障手段不能满足需求国土有些应用数据做了一定传统备份和容灾手段进行保护,但这种传统容灾备份只解决有限问题,与实际需求很大差距。现有备份效率低下,不能快速验证数据完整;缺少对系统应用版本备份;出现故障后,恢复漫长繁琐,可操作性很低。在容灾方案上普遍有很大误区,往往把“容灾”当成一个万能保障系统,而且高指标的容灾系统是需要巨大投入,相对大部分单位,投资回报比不高。传统容灾预防是万分之一小概率事故,但机房真正频繁威胁是单个服务器故障和逻辑错误,这些问题都用不上容灾。不能把任何服务器错误“事件”升级成“事故”,只有极端灾难事故情况下需要动用容灾系统。切换异地容灾需要复杂操作流程和漫长时间,真正能解决问题需要时间很长。从容灾恢复数据远比本地要慢很多。所有本地应急系统才是能快速顶用系统,很实用。管理运维问题PC运维难以为继xxx国土现有约200台PC终端,终端性能参差不齐,设备维护管理复杂,IT运维人员每天需要面对数量众多的零散服务请求(PC故障、系统恢复、软件安装、补丁更新等),由于人数有限,难以为继,矛盾越发突出。PC终端使用周期短客户端硬件难以适应未来的系统升级、更新需求(如Windows7/8等新系统的升级等),每年都有大量的PC终端面临淘汰更新的压力,终端投入成本较高。移动终端的运维管理移动工作方式意味着越来越多的移动设备被用于访问办公环境,如何合理、高效地对这些移动设备进行设备生命周期的管理,成为了IT部门的棘手问题。移动设备的运维管理需要涵盖设备配置、应用置备、安全保护、远程支持、监控报告、设备淘汰等方面,传统的桌面管理软件并不具备对移动设备的管理能力。方案总体设计设计原则本次项目拟使用端到端虚拟化解决方案实现安全隔离、安全加护,构建以信息使用者为核心的信息安全虚拟化管理平台:实现业务内网(涉密)的网络环境建设实现业务内网(涉密)云平台中服务器虚拟化与桌面虚拟化建设实现平台建设后,后期有效的进行容灾、备份恢复等运维工作服务器及生产数据存储均放置在数据中心,真正做到数据中心生产数据不落地另外,通过端到端虚拟化还将带来以下好处:用户体验好用户操作体验平滑过渡,变化小,减少项目推进阻力。优化投入成本采用最新虚拟化技术,最大限度提高资源利用率,降低项目建设成本。功能模块化设计虚拟化平台可拼装,可拆卸,灵活部署,实现全行信息安全管理标准化,构建生产、办公、外网信息安全访问虚拟化统一平台。总体架构设计方案总体架构设计实施思路根据前期需求,考虑项目工作量、用户行为变化及流程设计,建议分期分阶段进行建设,其中分为三个阶段建设:第一阶段,xxx国土基础网络建设阶段统一规划业务网、办公网、互联网,防火墙设备与交换机设备环境搭建统一规划服务器、存储、光纤网络环境搭建重新规划的网络建设架构如下:第二阶段,虚拟化平台建设阶段统一规划业务网服务器虚拟化与桌面虚拟化资源池的环境搭建。虚拟化平台建设架构图如下:第三阶段,xxx国土运维保障平台建设统一规划xxx国土GIS、OA等业务系统的运维保障平台的建设。运维保障架构图如下:虚拟桌面技术方案设计云桌面总体架构设计如下:这种基于服务器运行模式的应用交付架构已经在全球被大量的电信、金融、政府和企业客户所采用,可以在管理维护、投资成本、应用性能、安全和业务连续性各个方面得到提升:首先从管理维护的角度,这种集中管理的优势显而易见:以前的软件部署和管理,工程师们需要对每一台电脑进行安装和维护工作,低级的重复劳动消耗了大量的人力物力。而现在PC机上不再安装复杂的软件,成为标准终端设备,如果一台坏了,换一台备用标准设备就可以继续工作,对工作没有影响。IT管理人员只管理和维护中心服务器,通过应用策略去设定每个用户或用户组的行为,管理人员足不出数据中心,通过服务器上各种数据、策略和信息管理着整个企业用户对应用的使用,达到事半功倍的效果。其次性能同样得到提升,集中发布降低了应用对网络和终端硬件的依赖,使其不再成为性能瓶颈,同时还可以集中对应用进行优化,使得用户访问效率大大提高;从安全性来看,所有的生产数据和监控逻辑全部保留在数据中心内,防止了敏感信息的泄漏,可以精确地控制对各应用程序的安全访问;同时管理人员可以通过审计录像对敏感操作进行记录,以备审计追踪等。从总体成本衡量,传统模式需要不断地对PC机和带宽进行无底洞式地投入,在集中式架构下,xxx国土的应用不再依赖于PC机和客户端网络带宽,只要为每个业务人员配备一台终端和十几K的带宽就可以正常工作;每次系统和软件升级只需对少量服务器升级即可,节省了大量成本。各网段访问虚拟化平台还提供了各种安全和管理功能,可以实现全面的用户接入的安全控制和管理,包括用户行为控制、远程监控、远程培训、行为审计、对各个应用的口令管理,以及整体系统的性能监控管理等等。服务器虚拟化方案设计虚拟化总体架构设计图如下:这种基于服务器运行模式的虚拟化架构已经在全国大量用户采用,可以在管理维护、投资成本、应用性能、安全和业务连续性各个方面得到提升:资源快速部署。通过虚拟化系统,业务部门提交IT需求时,可以在几分钟内部署一台新的服务器环境供使用,大大缩短IT与业务需求落地的时间差。提高利用资源。通过虚拟化的部署,将传统的硬件资源转化为软件资源,提高现有的硬件资源利用率,并且,可以将所有硬件资源通过利旧、整合到新的虚拟化系统平台中。绿色数据中心。虚拟化概念一直是绿色数据中心的倡导者。我行通过虚拟化部署,可以使系统资源高度集中,节约机房空间的同时,更降低了机房用电的开销(包括服务器用电、空调用电等)。降低运维成本。除了对电量和空间使用的降低外,在人力成本方面,也可以通过虚拟化,减轻因为业务成本增长,带来的运维压力,帮助我行的IT人员应对快速的增长业务。业务系统运维保障设计架构设计业务系统运维保障架构设计如下:业务系统应急数据保障运维迁移项目实施计划项目实施计划如下:阶段任务一、分析阶段云平台环境评估对现有的IT环境进行全面的技术评估分析评估结果,定位风险点和成功部署要素和集成商团队共同制定出明确的可执行的项目方案记录并交付评估结果二、设计阶段云平台平台设计集成商团队设计云平台,并与其一起进行设计讨论设计结果包含下面各个方面:网络架构服务器虚拟化桌面虚拟化系统架构存储架构三、构架和测试阶段虚拟化环境架构网络环境架构虚拟桌面环境架构安装并配置下列云平台产品组件,部署服务器虚拟化部署桌面虚拟化创建数据存储授权服务器部署用户配置文件方案集成现有基础架构(目录服务,文件服务等等)四、发布阶段试运行支持确定试运行用户支持试运行部署并解决响应的问题确认接受度投产支持部署可以支持设计用户容量的应用虚拟化环境进行投产上线实现知识转移IT运维服务方案第PAGE2页项目组织保障工作领导小组为保障xxx区基础支撑平台与运维保障平台项目建设顺利推动,建议由局信息化建设领导小组直接负责对本项目的组织领导。领导小组拟设立“基础支撑平台与运维保障平台”建设办公室,具体负责项目建设各项工作的统筹推进,制定建设方案、工作计划和相关标准,明确任务分工。项目专家小组项目专家小组主要负责配合系统建设项目技术小组完成现状分析、平台设计以及平台测试与发布的工作。项目专家小组的主要职责如下:充分发挥在技术以及信息化认识等方面的特长和能力,指导项目技术小组进行现状梳理、分析工作。参与项目技术小组的各个阶段的成果评审活动。对项目实施中有关的业务、技术以及资源配置等可能出现问题,向项目技术小组提出改进意见。在信息系统建设涉及到的业务和技术问题上,对项目领导小组负责。项目技术小组项目技术组的主要工作职责如下:负责通过用户访谈、用户问卷、专题讨论、资料收集等方式获取项目建设的需求,并对调查结果进行整理分析,提交各个部门进行确认,并提交项目领导小组和专家小组进行评审。负责按阶段按时完成项目的分析设计、设计、搭建、测试、试运行、运行工作。负责完成平台的使用及维护培训等集成系统建设的伴随服务,完成项目验收和鉴定的准备工作。在整个项目建设过程中,每周末(月末)向工作领导小组提交本周(本月)的工作总结和下周(下月)工作计划;要在项目计划完成、需求调研中期、需求调研结束、系统设计完成、系统集成中期、系统试运行前以及项目收尾等各个阶段,向项目领导小组进行专题工作汇报。当遇到业务问题或困难时,及时向专家小组进行专门咨询,以保证项目顺利实施。目录TOC\o"1-5"\h\z\uHYPERLINK\l"_Toc270496117"1运维服务内容PAGEREF_Toc270496117\h3HYPERLINK\l"_Toc270496118"1.1服务目标PAGEREF_Toc270496118\h3HYPERLINK\l"_Toc270496119"1.2信息资产统计服务PAGEREF_Toc270496119\h3HYPERLINK\l"_Toc270496120"1.3网络、安全系统运维服务PAGEREF_Toc270496120\h5HYPERLINK\l"_Toc270496121"1.4主机、存储系统运维服务PAGEREF_Toc270496121\h7HYPERLINK\l"_Toc270496122"1.5数据库系统运维服务PAGEREF_Toc270496122\h10HYPERLINK\l"_Toc270496123"1.6中间件运维服务PAGEREF_Toc270496123\h11HYPERLINK\l"_Toc270496124"2运维服务流程PAGEREF_Toc270496124\h12HYPERLINK\l"_Toc270496125"3服务 管理制度 档案管理制度下载食品安全管理制度下载三类维修管理制度下载财务管理制度免费下载安全设施管理制度下载 规范PAGEREF_Toc270496125\h14HYPERLINK\l"_Toc270496126"3.1服务时间PAGEREF_Toc270496126\h14HYPERLINK\l"_Toc270496127"3.2行为规范PAGEREF_Toc270496127\h14HYPERLINK\l"_Toc270496128"3.3现场服务支持规范PAGEREF_Toc270496128\h15HYPERLINK\l"_Toc270496129"3.4问题记录规范PAGEREF_Toc270496129\h15HYPERLINK\l"_Toc270496130"4应急服务响应措施PAGEREF_Toc270496130\h17HYPERLINK\l"_Toc270496131"4.1应急基本流程PAGEREF_Toc270496131\h17HYPERLINK\l"_Toc270496132"4.2预防措施PAGEREF_Toc270496132\h17HYPERLINK\l"_Toc270496133"4.3突发事件应急策略PAGEREF_Toc270496133\h18第PAGE17页服务内容服务目标运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备及其他信息系统的运行维护与安全防范服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量。结合用户现有的环境、组织结构、IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构。将用户的运行目标、业务需求与IT服务的相协调一致。信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映信息系统资源的可用性情况和健康状况,创建一个可知可控的IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行。服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:运行状态、故障情况配置信息可用性情况及健康状况性能指标统计运维数椐、提供信息系统管理和工作报告、归纳总结并提供用户想了解的数椐报告信息资产统计服务此项服务为基本服务,包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务。服务内容包括:硬件设备型号、数量、版本等信息统计记录软件产品型号、版本和补丁等信息统计记录网络结构、网络路由、网络IP地址统计记录综合布线系统结构图的绘制其它附属设备的统计记录硬件设备清单如下表统计:网络、安全系统运维服务从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。网络、安全系统基本服务内容:序号服务模块内容描述提供方1现场备件安装配合用户进行,按备件到达现场时间工程师到达现场2现场软件升级首先分析软件升级的必要性和风险,配合用户进行软件升级3现场故障诊断按服务级别:7×24小时5×8小时4电话远程技术支持7×24小时5问题管理系统对遇到的问题进行汇总和发布网络核心交换机巡视典型作业计划书系统管理单位:维保单位:设备名:设备型号:管理IP:检查内容参考标准检查结果检查结论巡视方法描述巡检周期硬件运行状态电源运行状态□正常□异常风扇运行状态□正常□异常模块运行状态□正常□异常系统运行状态检查VLAN状态□正常□异常配置状态□正常□异常OSPF状态□正常□异常日志检查日志状态□正常□异常其他检查内容□正常□异常□正常□异常□正常□异常用户现场技术人员值守根据用户的需求提供长期的用户现场技术人员值守服务,保证网络的实时连通和可用,保障接入交换机、汇聚交换机和核心交换机的正常运转。现场值守的技术人员每天记录网络交换机的端口是否可以正常使用,网络的转发和路由是否正常进行,交换机的性能检测,进行整体网络性能评估,针对网络的利用率进行优化并提出网络扩容和优化的建议。现场值守人员还进行安全设备的日常运行状态的监控,对各种安全设备的日志检查,对重点事件进行记录,对安全事件的产生原因进行判断和解决,及时发现问题,防患于未然。同时能够对设备的运行数据进行记录,形成报表进行统计分析,便于进行网络系统的分析和故障的提前预知。具体记录的数据包括:配置数据性能数据故障数据现场巡检服务现场巡检服务是对客户的设备及网络进行全面检查的服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障设备稳定运行。同时,将有针对性地提出预警及解决建议,使客户能够提早预防,最大限度降低运营风险。巡检包括的内容如下:编号巡检内容1硬件运行状态检查项目单板状态检查电源模块状态检查风扇状态检查整机指示灯状态检查机框防尘网检查机房温度、湿度检查设备地线检查2软件运行情况检查项目设备运行情况检查网络报文分析设备对接运行状况检查路由运行情况检查3网络整体运行情况调查网络运行问题调查网络变更情况调查网络历史故障调查网络运行分析与管理服务网络运行分析与管理服务是指工程师通过对网络运行状况、网络问题进行周期性检查、分析后,为客户提出指导性建议的一种综合性高级服务,其内容包括:服务内容服务优点向客户提供网络专家电话号码。保证重大问题第一连线至网络专家。网络专家组每周与客户进行不少于2小时的电话技术交流以最小成本保证及时解答客户关心的技术问题,并就某一领域技术问题展开深层次沟通。每月向客户提交CASE汇总分析报告,并可扩展到每年17次(月度、季度、年度)使客户了解网络历史故障情况以及故障预防建议,最大程度减少网络故障隐患,更高效的进行网络管理。重要时刻专人值守服务保证重要时刻设备稳定运行对客户成功尤为关键,因此,可对客户提供重要时刻的专人现场值守支持,包括政府客户的重大会议期间、金融客户的年终结算日、运营商客户的生产网重大割接或其它任何客户认为可能对其业务运营产生重大影响的时刻。如需专人值守,客户需至少提前3周与授权服务商客户服务经理联系。对每位合约客户,授权服务商均需按事先 合同 劳动合同范本免费下载装修合同范本免费下载租赁合同免费下载房屋买卖合同下载劳务合同范本下载 约定提供专人值守服务。客户如需超出合同约定范围的更多值守支持,需额外支付相应人力和差旅费用。主机、存储系统运维服务主机、存储系统的运维服务包括:主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。主机存储系统基本服务内容:序号服务模块内容描述提供方1现场备件安装配合用户进行。按备件到达现场时间工程师到达现场2补丁服务消除软件漏洞给系统带来的安全隐患,并对安装补丁所引起的系统连锁反应进行合理的平衡。3升级服务对系统进行软件或硬件的升级,以改进、完善现有系统或消除现有系统的漏洞。4现场故障诊断按服务级别:7×24小时5×8小时5电话远程技术支持7×24小时6问题管理系统对遇到的问题进行汇总和发布7系统优化对客户系统的括主机、存储设备、操作系统、提供优化服务。现场值守人员可进行监控管理的内容包括:CPU性能管理;内存使用情况管理;硬盘利用情况管理;系统进程管理;主机性能管理;实时监控主机电源、风扇的使用情况及主机机箱内部温度;监控主机硬盘运行状态;监控主机网卡、阵列卡等硬件状态;监控主机HA运行状况;主机系统文件系统管理;监控存储交换机设备状态、端口状态、传输速度;监控备份服务进程、备份情况(起止时间、是否成功、出错告警);监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;对存储的性能(如高速缓存、光纤通道等)进行监控。小型机系统巡检典型作业计划书(HP服务器部分)系统管理单位:设备名:设备型号设备序列号管理IP:检查内容参考标准检查结果状态是否正常巡检方法描述巡检周期硬件运行状态电源指示灯▅正常□异常面板指示灯▅正常□异常内置磁带机▅正常□异常CPU状态▅正常□异常内存状态▅正常□异常磁盘状态▅正常□异常网卡状态▅正常□异常HBA卡运行状态▅正常□异常系统检查系统日志▅正常□异常Mail▅正常□异常文件系统,包括磁盘卷剩余空间▅正常□异常硬件检测▅正常□异常交换分区▅正常□异常固件版本▅正常□异常补丁包版本▅正常□异常系统镜像▅正常□异常存储磁盘▅正常□异常存储驱动▅正常□异常进程状态▅正常□异常系统性能检查CPU利用率▅正常□异常内存利用率▅正常□异常磁盘I/O性能▅正常□异常数据库运行状态数据库安装目录▅正常□异常数据库进程状态▅正常□异常集群检查集群进程状态▅正常□异常集群日志▅正常□异常存储检查存储设备故障灯状态▅正常□异常SAN交换机端口状态▅正常□异常存储交换机环境状态▅正常□异常系统故障报告▅正常□异常数据库系统运维服务数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能发生的问题。数据库运行维护服务还包括快速发现、诊断和解决性能问题,在出现问题时,及时找出性能瓶颈,解决数据库性能问题,维护高效的应用系统。数据库运行维护服务,主要工作是使用技术手段来达到管理的目标,以系统最终的运行维护为目标,提高用户的工作效率。具体数据库运行维护监控的基本服务内容包括:序号服务模块内容描述提供方1Oracle数据库7*24电话支持服务每周7天,每天24小时支持中心电话,电子邮件答询,以满足业务发展的需要。Oracle产品技术专家直接同客户对话,帮助解决客户提出的疑难问题。根据问题的严重程度,将优先解决客户认为是关键而紧急的任务。对客户提出的一般性问题进行技术咨询、指导。定期的客户管理报告,避免问题再度发生。2Oracle数据库产品现场服务响应数据库宕机数据坏块影响业务不能进行的产品问题软件产品的更新及维护。3Oracle数据库产品系统健康检查对系统的配置及运作框架提出建议,以帮助您得到一个更坚强可靠的运作环境降低系统潜在的风险,包括数据丢失、安全漏洞、系统崩溃、性能降低及资源紧张检查并分析系统日志及跟踪文件,发现并排除数据库系统错误隐患检查数据库系统是否需要应用最新的补丁集检查数据库空间的使用情况协助进行数据库空间的规划管理检查数据库备份的完整性监控数据库性能确认系统的资源需求明确您系统的能力及不足优化OracleServer的表现通过改善系统环境的稳定性来降低潜在的系统宕机时间4Oracle数据库产品性能调优分析用户的应用类型和用户行为 评价 LEC评价法下载LEC评价法下载评价量规免费下载学院评价表文档下载学院评价表文档下载 并修改ORACLE数据库的参数设置评价并调整ORACLE数据库的数据分布评价应用对硬件和系统的使用情况,并提出建议利用先进的性能调整工具实施数据库的性能调整培训用户有关性能调整的概念提供用户完整的性能调整报告和解决方法中间件运维服务中间件管理是指对BEAWeblogic、MQ等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行。中间件监控指标包括配置信息管理、故障监控、性能监控。执行线程:监控WebLogic配置执行线程的空闲数量。JVM内存:JVM内存曲线正常,能够及时的进行内存空间回收。JDBC连接池:连接池的初始容量和最大容量应该设置为相等,并且至少等于执行线程的数量,以避免在运行过程中创建数据库连接所带来的性能消耗。检查WEBLOG日志文件是否有异常报错如果有WEBLOG集群配置,需要检查集群的配置是否正常。运维服务流程建议用户采用的服务方式为两种:一种为技术人员现场值守,另一种是定期巡检结合故障现场服务。技术人员现场值守运行维护服务的基本操作流程如下图所示:定期巡检结合故障现场运行维护服务的基本操作流程如下图所示:服务管理制度规范服务时间接收服务请求和咨询:在5*8小时工作时间内设置由专人职守的热线电话,接听内部的服务请求,并记录服务台事件处理结果。在非工作时间设置有专人7*24小时接听的移动电话热线,用于解决内部的技术问题以及接听7*24小时机房监控人员的机房突发情况汇报。服务响应时间:故障级别响应时间故障解决时间I级:属于紧急问题;其具体现象为:系统崩溃导致业务停止、数据丢失。30分钟,2小时内提交故障处理方案12小时以内II级:属于严重问题;其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。30分钟,2小时内提交故障处理方案24小时以内III级:属于较严重问题;其具体现象为:出现系统报错或警告,但业务系统能继续运行且性能不受影响。30分钟,2小时内提交故障处理方案48小时以内IV级:属于普通问题;其具体现象为:系统技术功能、安装或配置咨询,或其他显然不影响业务的预约服务。30分钟,2小时内提交故障处理方案5天内技术支持人员在解决故障时,会最大限度保护好数据,做好故障恢复的文档,力争恢复到故障点前的业务状态。对于“系统瘫痪,业务系统不能运转”的故障级别,如果不能于12小时内解决故障,将在16小时内提出应急方案,确保业务系统的运行。故障解决后24小时内,提交故障处理报告。说明故障种类、故障原因、故障解决中使用的方法及故障损失等情况。行为规范遵守用户的各项规章制度,严格按照用户相应的规章制度办事。与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重。接听电话时要文明礼貌,语言清晰明了,语气和善。遵守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。现场服务支持规范运维服务人员要做到耐心、细心、热心的服务。工作要做到事事有记录、事事有反馈、重大问题及时汇报。严格遵守工作作息时间,严格按照服务工作流程操作。现场支持工程师应着装整洁、言行礼貌大方,技术专业,操作熟练、严谨、规范;现场支持时必须遵守用户单位的相关规章制度。现场支持工程师在进行现场支持工作时必须在保证数据和系统安全的前提下开展工作。现场支持时出现暂时无法解决的故障或其他新的故障时,应告知用户并及时上报负责人,寻找其他解决途径。故障解决后,现场支持工程师要详细记录问题的发生时间、地点、提出人和问题描述,并形成书面文档,必要时应向用户介绍故障出现的原因及预防方法和解决技巧。问题记录规范根据使用人员提出问题的类别,将问题分为咨询类问题和系统缺陷类问题二类:咨询类问题是指通过服务热线或现场解疑等方式能够当场解决用户提出的问题,具有问题解答直接、快速和实时的特点,该问题到现场支持人员处即可中止,对于该类问题的记录可使用咨询类问题记录模版进行记录。系统缺陷类问题是指使用人员提出的问题涉及到系统相应环节的确认修改,需要经过逐级提交、诊断、确认、处理和回复等环节,处理解决需要项目组的分析确认,问题有解决方案后,将解决方案反馈给用户。具体提交流程如下:问题提交。应用信息系统的用户发现属于系统缺陷类的问题时,填写系统缺陷类问题提交单,提交服务支持中心。问题分析。服务中心接到用户提交的问题单,要组织相应人员对问题单中描述的问题进行分析研判,确定问题的类型(技术问题、业务问题或者操作问题)。属于技术问题,提交服务中心技术人员对存在的问题提出具体的处理意见和建议;属于业务问题,提交服务中心业务人员进行处理;属于操作问题,可安排相关人员对问题提出人进行解释,并将系统缺陷类问题提交单转为系统咨询类问题提交单。问题确认、解决。服务中心的技术人员和业务人员收到系统缺陷类问题提交单后,对提交的问题进行归类汇总和分析、确认。可以解决的,明确问题解决的具体处理建议和措施,经主管领导签字同意后,交实施人员进行解决方案的实施。服务人员确认是否解决,并将解决方法附在系统缺陷类问题提交单上反馈给问题提出人员。问题上报。服务人员收到经业务或技术人员确认的系统缺陷类问题提交单后,上报服务中心。问题回复。服务中心根据提交问题的进行分析,制定解决方案并进行实施的解决,同时做好变更记录。将解决方案汇总后及时向问题提交单位或问题交办单位作出回复,并将分析过程和问题产生原因一并提交。应急服务响应措施针对项目制定了详尽的设计、应急处理预案,整个流程严谨而有序。但是,在服务维护过程中,意外情况将难以完全避免。下面,我们将对项目实施的突发风险进行详细分析,并且针对各类突发事件,设计了相应的预防与解决措施,同时提供了完整的应急处理流程。应急基本流程维护服务应急处理流程预防措施针对上门服务过程中可能遇到的各种各样的风险,针对一些可能出现的情况,制定了一系列预防处理措施,举例如下:类型事件预防措施处理应用软件无法启动软件可执行文件上门人员提前准备好各类需维护软件安装程序将应用软件数据文件备份后,重新安装软件打开过程中或运行中异常错误关闭上门人员准备好安装程序,操作系统优化和修补软件,查杀病毒软件判断出错原因,备份数据,采取相关修复措施操作系统使用者本机操作系统异常或系统资源占用严重准备好系统检查程序及修补程序,以及查杀病毒软件告知使用者错误原因可能类型,提出解决方案,经使用者认可后采取相应措施B/S结构系统,IE浏览器异常或无法下载控件准备流氓软件清理程序、修复浏览器软件、查杀病毒软件检查IE浏览器选项设置,分析原因进行修复网络或服务器B/S结构系统网络流量异常或服务器登录异常判断服务器是否异常,否则准备杀毒软件检查网络流量,流量异常小则报修网络服务商,流量异常大则查杀病毒突发事件应急策略系统运维应急方案是对中断或严重影响业务的故障,如宕机、数据丢失、业务中断等,进行快速响应和处理,在最短时间内恢复业务系统,将损失降到最低。在系统维护过程中,突发事件的出现将是很难完全避免的,针对这种情况,设计了完善的突发事件应急策略。系统巡检人员要定期规范检查各硬件设备的运转情况和应用软件运行情况,同时做好日常的数据增量备份和定期全备份。对发现的问题在报各级负责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施,避免造成更大的影响。问题得到稳定或彻底解决后,要形成问题汇报,避免以后类似重大紧急情况的发生。对发现的问题在报负责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施,避免造成更大的影响。问题得到稳定或彻底解决后,要形成问题汇报,避免以后类似重大紧急情况的发生。当获悉出现突发事件时,技术支持人员可以立即从知识库中获取相应的应急策略,并综合用户方的具体情况,给出相关解决方案,然后在第一时间以电话、邮件支持或现场服务的方式帮助用户解决问题,尽最大努力减小突发事件对用户日常应用的影响。紧急情况预防措施应急策略硬件损坏项目单位操作用电脑硬件损坏在磁盘数据未丢失情况下,保证数据安全性,建议项目单位替换相关硬件。操作失误加强培训力度,掌握培训效果,检验操作人员操作水准,提示注意事项。操作失误未造成即成结果或数据未丢失情况下,保障数据安全,反之,协调相关部门,进行补救。对操作人员强调注意事项配置丢失培训时强调使用前配置方法和步骤,并特别提示需在使用前按要求操作派出上门维护、培训人员重新配置,并耐心讲解。数据丢失培训时强调使用过程中注意定期备份重要数据,日常维护过程中,上门服务人员实时备份数据并告知用户协调有关部门,进行补救,无法补救,提交报告说明原因。突发事件应急策略服务流程图如下:
本文档为【云平台运维与运营服务方案(完整详细版)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
行云流水
宁静,思远,意在千里
格式:doc
大小:3MB
软件:Word
页数:45
分类:
上传时间:2023-01-04
浏览量:29