唐山不锈钢1580热轧生产线
基础自动化计算机配置及备份策略
吴建杰
唐山不锈钢有限责任公司
摘要:唐山不锈钢1580热轧生产线基础自动化系统采用了数十台计算机来实现相关工艺功能,这些计算机的可用性则成为生产能否正常进行的关键。本文针对基础自动化相关计算机实际硬件配置及其实现的工艺功能,以及其在生产过程中宕机对生产带来的影响,阐述了基础自动化计算机配置和备份策略,说明了备份策略及其实施对生产带来的价值。
关键词:计算机 备份RTO RPO RAID1 RAID5
1 前言
我公司1580热轧生产线基础自动化系统共配置了28台计算机来实现相关的工艺功能(工艺功能说明见表一),因此其宕机对生产过程产生的影响也各不相同,如果没有采用合适的备份策略进行备份,一旦生产过程中有计算机宕机,则会对生产过程产生影响,处理不当则会使损失扩大化,从而不利于生产的快速恢复。
表一 基础自动化系统计算机工艺功能
区域工艺功能
粗轧区域(台)
精轧区域(台)
卷取区域(台)
2 计算机宕机的原因分析
2.1 工作环境恶劣
基础自动化采用的计算机并非都安放在专用机房,根据不同的工艺要求,有很大一部分布置在生产现场,比如换辊地面站为了方便换辊,均布置在离轧机很近的生产现场,这些计算机长期在高温、粉尘等恶劣和复杂的条件下工作,难免会产生故障而宕机。
2.2 计算机系统自身故障
计算机操作系统以及相关业务软件自身具有一定的不稳定性,在长时间使用后容易出现故障而宕机。
2.3 人为原因
在操作过程中,人为有意或无意对计算机做的破坏性更改,从而使计算机系统或相关工艺功能无法正常使用,从而产生宕机。
上述计算机宕机原因由于客观条件无法从根本上消除,所以根据不同计算机在生产过程中的作用按照不同的备份策略对计算机进行备份,从而在系统宕机后对计算机系统进行恢复操作以降低宕机对生产的影响。
3 计算机业务恢复指标
计算机业务恢复有两个技术指标,RTO和RPO。
(1)RTO,Recovery Time Objective是指宕机发生后,从系统宕机导致业务停顿之刻开始,到系统恢复至可以支持各部门运作,业务恢复运营之时,此两点之间的时间段称为RTO。一般而言,RTO 时间越短,即意味要求在更短的时间内恢复至可使用状态。对于1580热轧生产线基础自动化计算机来说,其RTO 目标根据不同计算机在工艺过程中发挥的作用不同其RTO也不相同。
(2)RPO,Recover Point Object,恢复点指标,是指宕机发生后,备份策略能把数据恢复到宕机发生前的哪一个时间点的数据,它是衡量企业在宕机发生后会丢失多少生产数据的指标。理想状态下,我们希望RTO=0,RPO=0,即宕机发生对轧钢生产过程毫无影响,既不会导致生产停顿,也不会导致生产数据丢失。尽管无法达到理想状态,但我们可以采用不同的备份策略尽量减低RTO和RPO的时间,从而有效保证生产过程顺利进行。
4 计算机备份策略构成
计算机备份策略的构成与计算机所实现的不同工艺功能有密切关系,同时也与计算机系统硬件配置有直接关系。
4.1工艺功能影响程度分类
根据计算机业务宕机对轧钢生产过程产生的影响程度,将宕机类型分为三类,一类影响是计算机业务宕机后,生产过程无法正常进行,此类影响范围最广,生产遭受的损失也最大,此类宕机如果能够得到快速恢复,则能有效的为公司挽回损失;二类影响是计算机业务宕机后,生产过程能继续进行,但一旦生产现场出现异常将无法得到及时处理,生产过程中自动化信号采集的数据将无法保存,影响事故的处理和分析,影响后续的轧钢过程;三类影响是计算机业务宕机后,生产过程能继续进行,但如果由于进一步生产需要而对HMI画面进行修改的过程无法进行,从而影响生产过程的优化。
根据上述分类,将基础自动化系统配置的计算机宕机对生产带来的影响程度归类并说明其影响原因,见表二
表二 基础自动化系统计算机影响程度归类
描述
影响程度
影响原因
HMI 服务器
一类
宕机后所有HMI画面无法显示,操作工无法根据HMI正常操作
操作员站
一类
宕机后相关区域HMI画面无法显示,操作工无法根据HMI进行正常操作
换辊地面站
一类
宕机后相关区域HMI画面无法显示,换辊操作无法进行
SIMATIC S7/TDC开发站
二类
宕机后S7/TDC开发软件无法使用,程序在线、编译下装无法进行,无法在线监控TDC系统
SIMATIC Win CC开发站
三类
宕机后Win CC开发程序无法使用,HMI画面无法进行优化修改
文件服务器
二类
宕机后基础自动化系统所有计算机杀毒程序无法正常进行,现场信息采集无法保存
PDA 服务器
二类
宕机后TDC及现场自动化设备数据采集无法进行
4.2 硬件配置分类
基础自动化系统所采用的计算机硬盘配置有三种,第一种是单硬盘配置,第二种采用RAID1配置,第三种采用RAID5配置。
RAID 的英文全称为Redundant Array of Independent Disks,翻译成中文即为独立磁盘冗余阵列,或简称磁盘阵列。
1580热轧基础自动化系统计算机采用的硬盘配置见表三。
表三 基础自动化系统计算机硬盘系统配置见表
描述
硬盘系统配置
HMI 服务器
RAID 1系统
操作员站
单硬盘系统
换辊地面站
单硬盘系统
SIMATIC S7/TDC开发站
RAID 1系统
SIMATIC Win CC开发站
RAID 1系统
文件服务器
RAID 1系统
PDA 服务器
RAID 5系统
5 计算机备份策略实施
根据以上硬盘系统配置和计算机宕机后对生产的影响程度,对计算机备份策略的具体说明如下:
5.1 HMI 服务器
由于HMI 服务器在生产中的作用非常重要,尽管其采用了RAID1系统,但是如果发生两块硬盘同时出错的情况,没有合适的备份,生产仍会受到损失。因此需要对HMI服务器做全盘备份,备份数量最少两份,这样一旦系统发生故障,将HMI服务器停机,然后换上备份的硬盘,则可以在较短时间内回复生产。不过要注意,在对HMI画面进行修改后,一定要更新以前做的备份
内容
财务内部控制制度的内容财务内部控制制度的内容人员招聘与配置的内容项目成本控制的内容消防安全演练内容
,这样保证系统的恢复点为最新恢复点,从而有利于生产的顺利进行。
5.2 操作员站
操作员站分布在粗轧、精轧、卷取三个区域,如果其在生产过程中宕机,则会导致相关区域操作人员无法使用HMI画面,从而导致无法观察生产过程状态,进而无法正常操作现场设备,对生产的影响比HMI服务器要小,但如果不能及时恢复仍会导致停产。在硬件配置上,其只采用了单硬盘配置,一旦硬盘出现故障,则HMI画面无法使用,因此也需要对操作员站的计算机做好全盘备份,备份的数量最少要两份,这样可以保证在系统无法使用时快速换上硬盘,可以降低生产过程的停止时间。
5.3 换辊地面站
换辊地面站虽然仅在换辊过程中使用,但由于其工作环境恶劣,一旦宕机,则导致换辊过程无法进行,也会导致后续生产过程无法继续进行。 因此,也需要对换辊地面站做全盘备份,备份数量最少两份,在出现宕机后,及时换上硬盘,从而保证换辊过程的顺利进行。
5.4 SIMATIC S7/TDC开发站
SIMATIC S7/TDC开发站是连接基础自动化开发、维护人员和TDC的纽带,生产过程中对关键数据的监控都是通过TDC开发站进行的。如果开发站宕机,尽管其不会影响正在进行的生产过程,但是一旦轧钢过程中现场出现异常,维护人员将无法通过TDC程序在线的方法及时查找异常发生的原因,所以TDC开发站宕机也会影响生产的顺利进行,由于其采用了RAID 1系统,容错性明显增强。开发站在正常生产后,同样需要做全盘备份,备份数量最少两份。
5.5 SIMATIC Win CC开发站
SIMATIC Win CC开发站用于修改HMI画面,如果其发生宕机,不会影响轧钢生产的进行,但将影响HMI画面的维护、开发。SIMATIC Win CC开发站硬盘也采用了RAID 1系统,其备份只需要做全盘备份,备份数量最少两份。
5.6 文件服务器
文件服务器为其它计算机提供杀毒服务,同时也记录了生产过程中TDC接收和发送报文内容,如果其宕机,不会影响正在进行的轧钢生产过程,但相关的记录数据将丢失。因此针对文件服务器,要采取两种备份方法,一是全盘备份,备份数量最少两份,其只需要做一次;另外需要在固定时间对新增的记录做增量备份,这样可以保证计算机宕机后能恢复到宕机前的状态。
5.7 PDA 服务器
PDA服务器对设定的TDC程序信号进行监控并记录,其宕机不会影响生产的顺利进行,但设定的TDC程序信号将无法记录下来,因此将会影响对轧钢生产过程的监控和分析。由于其采用了RAID 5系统,计算机的容错性得到很大提高,因此对其采用两种备份方法,一是仅对操作系统自身做备份,备份数量最少两份,其次需要对新增的记录做增量备份。
6 备份介质的放置
备份介质对放置地点与环境要求很高,放置备份介质的场所除了要保证符合介质要求的温度和湿度条件之外,也要考虑防灰尘和静电干扰。备份介质要分开存放,防止诸如火灾等事故发生后损害所有备份。
7 备份策略的应用
在我公司1580热轧生产线调试过程中,粗轧和精轧操作员站就曾经出现宕机,正是由于有采取了合适的备份策略才及时恢复了计算机,从而未能影响轧钢生产调试的顺利进行,体现了备份策略实施的巨大价值。
8 结论
通过上述分析,阐述了基础自动化系统计算机配置和备份策略,备份本身就是一项工程,而决非简单的拷出、拷入。备份在正常生产过程中是无法体现出其价值的,只有在出现计算机宕机情况后才能发挥其作用,备份的价值体现在计算机系统及相关系统出现故障后,能够有效缩短事故时间,减少因轧钢生产过程无法顺利进行带来的损失。
联系方式:唐山不锈钢 设备部 计控科 吴建杰 159********
继续阅读