首页综合资讯

上下齐心排故障 专业攻坚除隐患

发布时间:2024-11-15 20:51:15

2021年1月7日凌晨,上下厦门空管站完成主用自动化系统补丁升级,齐心消除了SPS、排故SDD进程以及清库机制的障专隐患,提高了空管主用自动化系统的业攻隐患稳定性和可靠性。

1月1日清晨05:04,坚除技术保障部终端运行室突迎一场重大挑战——主用自动化系统所有席位SDD进程前后两次发生退出并自动重新运行恢复。上下异情就是齐心命令,空管站分管站领导、排故技术保障部领导、障专科室管理人员立即赶赴现场,业攻隐患终端运行室技术人员迅速展开故障排查,坚除监控席前、上下机柜前、齐心管制现场都有他们的排故身影,查软件脚本、看系统日志、播景象回放、排硬件检测、强现场保障……一切都在紧张而有条不紊地进行着。

FDP2服务器微小的状态变化引起了技术人员的注意,经过深度排查,确定因其内存条故障导致服务器降级运行且自动重启。一个疑问闯入了技术人员的脑海之中,FDP2服务器故障时,系统由FDP1服务器保障,从配置规范来讲不应对系统运行造成影响,但时间上的契合却是“元凶”的最强佐证。本着“宁可错杀一千,不可放过一个”的严谨态度,技术人员随即将FDP2服务器实施断网处理。经与厂家工程师反复探讨论证,终于揪出了“元凶”:FDP2服务器重启上线后,其SPS进程响应FDE进程发出了存在数值越界错误的消息,主用自动化系统的席位SDD进程因缺乏异常保护机制,收到该错误信息后自动退出。

恢复的FDP2服务器并不能马上上线使用。看着满屏的飞机和繁忙的管制现场,为确保系统的运行稳定,通过现场评估,大家顶住单FDP服务器运行的压力,协调管制随时做好切换使用备用自动化系统的准备,同时,继续与厂家协商解决方案……

1月2日凌晨00:30,经与管制协商,技术人员采取了迂回战术,在规避了FDP2服务器上线的风险的同时,成功恢复双FDP服务器冗余运行的模式。经过技术人员与厂家工程师的共同努力,相应软件补丁通过测试验证,并于1月7日凌晨完成SPS和SDD进程补丁升级,系统运行正常。

新年伊始,面对突如其来的挑战,设备保障队伍坚守为空管安全服务为己任,用行动再次践行了“敬畏生命、敬畏规章、敬畏职责”的理念,为即将到来的春运筑牢设备保障服务基础。

      厦门空管站 文/图陈蓉/郭东元 林丽惠

 

友情链接:

外链: