——黑龙江空管分局技术保障部排除运行协同决策系统故障
1月27日凌晨,严守运行运行黑龙江空管分局技术保障部排除了运行协同决策系统(CDM)服务器故障。安全
CDM系统是标准管制部门在用的重要系统。技术保障部网络信息室值班员在巡视时发现CDM系统虚拟服务器一故障灯亮起,确保立即将该服务器上的春运重要服务及时转移到其它运行正常的服务器上,保障管制部门使用。平稳经测试和厂家分析判断故障为该服务器的严守运行运行4块CPU其中1块CPU故障引起。由于此型号CPU已停产,安全网络信息室与CDM厂家、标准服务器生产厂家、确保各级代理商及网上供货商联系,春运最终购买到匹配的平稳CPU。排故前,严守运行运行网络通信室组织制定方案,安全对操作步骤、标准突发应急处置、回退步骤等做了详细分析研讨,并请厂家工程师24小时待命以防出现极端情况。经与管制部门协商,27日0时开始排故,按程序操作更换了故障CPU。在对相关服务加载和多次验证后,至2时完成此次排故。
技术保障部网络信息室秉持对职责的敬畏之心,严格做好防疫管控,克服困难,分工协作完成排故任务,保障春运期间网络设备安全平稳运行。
作者:边远、明红旭