CCS故障处理和应急研究

(整期优先)网络出版时间:2021-04-01
/ 2

CCS故障处理和应急研究

李彬熔 张晓锋

西安高铁基础设施段 陕西省西安市 710000

摘 要:本文通过对动车段(所)集中控制系统设备故障进行原因调查分析,提出建立远程诊断平台方案,达到了快速准确处理动车段(所)集中控制系统设备故障的目的。

关键字:动车段(所)集中控制系统;组成;故障处理;远程诊断平台

动车段(所)集中控制系统(Centralized Control System,缩写为“CCS”)是作业人员对动车段(所)的信号设备进行集中控制、对列车作业和调车作业直接指挥、管理的技术装备。CCS系统综合协调动车组运用、日常作业、检查、检修等各个方面的作业需求,实现动车基地内作业计划动态管理、作业过程自动控制、现存动车追踪管理、人机界面统一管理等主要功能,提高动车段(所)作业效率和综合自动化水平,达到预先准备,优化作业流程,提高动车段(所)作业效率。

随着动车段(所)入库整修动车数量的提高,CCS设备的高效作业尤为重要,为最大力度满足铁路生产需求,更高效地配合厂家查找CCS系统故障原因并予以解决,本文对CCS系统的组成进行阐述,并对维护过程中遇到的典型CCS故障进行分析处理,提出建立远程诊断平台方案,达到了降低动车段(所)集中控制系统设备故障率的目的。

1 CCS设备的组成

CCS系统设置有数据库服务器、应用服务器、接口服务器、位置追踪服务器、网管服务器等服务器设备;包括大屏幕综合表示工作站、电务维护终端、操作终端等终端设备;另外还包括网络通信等设备以及根据需要设置的绘图、打印设备。系统设备运行有系统软件及各功能应用软件。系统核心识别采用双机热备、双网络通道,通过“双机热备”软件形成冗余结构,确保系统可靠、安全运行。系统结构见图1。

60651ec99b372_html_73f3a4b1e8f2695.gif

2 CCS系统故障处理

我们对近半年发生的CCS故障进行了一次统计,发现进路无法触发、CCS接口服务器故障、三种属于高发故障,其中进路无法触发、CCS接口服务器两种故障影响时间长,范围大。下面我们就对这两种故障进行分析处理。

2.1 进路无法触发

2.1.1 故障描述

XX动车段(所)出现“CCS码位中断”,弹出对话框:“自动执行模式需要处于自律模式恢复正常状态后,请重新启动自动执行或手动开放进路”。

2.1.2 故障分析与处理

出现报警信息后,CCS控制台检查发现,弹出对话框:“自动执行模式需要I、II区处于自律模式恢复正常状态后,请重新启动自动执行或手动开放进路”。调阅CCS电务维修机发现,CTC接口服务器A机、B机故障。进一步调看CCS接口机日志,发现15:54分接口机报队列操作出错,并导致接口机自动退出。如图2所示:

60651ec99b372_html_9a38643a20ba8206.png

查看日志中的其他异常情况,发现CCS接口机处理过0DXXXX添加车次号消息,但接口机在正常解析完接口数据后,再次进入车次号操作解析进程,并错误的解析为删除超长车次号。

[5-25 15:50:03]----[ACSComm]:向自律机发送添加车次号消息成功 车次号=0D6876 electric=128(1) label=43973[5-25 15:50:03]----[ACSComm]:删除车次号失败 车次号超长(>9),车次号= label=43973

2.1.3 故障原因

CCS接口队列操作错误334,表明队列已写满。

2.2 CCS接口服务器故障

2.2.1 故障描述

XX动车段(所)CCS终端“自动执行”显示黄灯(正常应显示绿灯),检查发现CCS接口服务器发生自动切机现象。

2.2.2 故障分析与处理

CCS对CTC系统接口服务器双机上部署有接口软件iGate、通信服务软件InfoMan。通信服务软件InfoMan负责监视其他软件运行情况并根据其运行状态完成双机运行管理。经日志分析,CCS接口服务器A机InfoMan软件监测到接口服务器B机故障,将接口服务器 A 机由备用状态升为主用状态。接口服务器B机的iGate和InfoMan软件均无相关日志记录,之后均有软件重启的记录。其中InfoMan软件不会自动重启(只在人工退出重启或者服务器重启发生,即使软件运行崩溃也不会自动重启),经与现场人员核实,并未人工重启过接口服务器,判断为操作系统由于某些异常原因死机并发生了自行重启。

2.2.3 故障原因

接口服务器B机故障系为操作系统未知原因自行发生重启,从而导致了接口服务器的自动切机现象。

2.3 控制台显示失去表示

2.3.1 故障描述

XX动车段(所)出现“CCS控制台显示失去表示”报警信息,控制台显示CCS控制台所有道岔无表示,站场图上站场信息闪烁,调阅联锁和CTC设备无报警,均显示正常。

2.3.2 故障分析与处理

出现报警信息后,CCS控制台所有道岔无表示,站场图上站场信息闪烁,初步判断为CCS收到信息中断造成。分别调阅CCS、联锁、CTC电务维修机状态,CCS电务维修机网络图显示CCS与CTC接口服务器通信中断,CTC侧接口服务器A机、B机脱机;联锁、CTC电务维修机状态正常,无报警信息。调看CTC接口服务器查询终端,发现CTC接口服务器软件异常退出,进一步检查系统日志发现,接口服务器程序的STPC进程停止运行,随后CCS系统维护终端显示CTC侧接口服务器异常报警。基本可以判断出CTC接口服务器程序异常,造成CTC向CCS传递信息中断,导致CCS控制台显示异常。对CTC接口服务器A机、B机分别重启后,故障现象消失。

2.2.2 故障原因

CCS接口队列操作错误334,表明队列已写满。

3 搭建远程维护平台

CCS设备一旦故障后,现场人员一般不能准确定位问题故障点,第一时间跟厂家人员电话沟通描述现象寻求解决办法,厂家进行问题指导,现场人员具体操作时存在理解偏差进而操作失误,造成二次故障,严重影响生产效率。目前CCS系统自己组建了局域网没有对外的网络端口,只能现场人工维护,且拷贝数据发给厂家时,需要在电务终端上将各个软件的数据拷贝在U盘上,通过互联网发给厂家,并需要在Linxu系统中输入指令命令才能拷贝,专业技术较强且操作繁琐,现场人员无法掌握相关技能。

综上所述,搭建远程维护平台是CCS系统中的设备、设施、软件和数据受到破坏和攻击时,尽快恢复工作的重要方案。

3.1 搭建远程维护平台的目标及作用

(1)远程诊断,实现7*24小时全程服务。

(2)日常维护,定期提取系统日志分析系统运用情况。

(3)故障应急,发生故障后通过平台,启动应急配置,快速找到故障点。

3.2 具体方案

搭建远程维护平台需要增设远程维护笔记本和远程维护防火墙,结合现场设备情况,现场考察具体放置地点。

远程维护平台综合采用计算机网络通信、数据加密、防火墙安全隔离等先进技术,实现对远程计算机进行实时查看、文件传输、软件分布、系统故障恢复以及安全性控制等功能。通过新设置的远程维护笔记本和远程维护防火墙,建立CCS系统远程维护通道。

CCS维护人员利用Internet网络,使用Teamviewer或向日葵远程软件,连接到信号机房的远程终端。其中远程维护笔记本安装无线网卡,实现与Internet网络的连接。

远程维护笔记本预装Radmin远程软件,使用时将网线接入防火墙端口。故障诊断结束后,断开远程维护笔记本网线。

4 结束语

动车段(所)集中控制系统提高了动车组的检修、养护工作的效率,但是由于其自身没有对外的网络端口,导致了CCS设备故障频发的问题一直存在,严重影响着动车段(所)的安全生产。本文结合现场实际情况,分析了二种故障现象,提出了搭建远程维护平台,达到了快速准确处理动车段(所)集中控制系统设备故障的目的。