摘 要:上海浦東國際機(jī)場一期于 1999 年正式建成通航。機(jī)場方通過國際招標(biāo)引進(jìn)了由澳大利亞Intersystem 公司開發(fā),配以IBM 小型機(jī)及 SAN 存儲組成機(jī)場航班信息顯示系統(tǒng)(以下簡稱航顯系統(tǒng))的基本后臺架構(gòu)。后經(jīng)過二期建設(shè)、虛擬化技術(shù)的引入以及衛(wèi)星廳的擴(kuò)容,目前的航顯系統(tǒng)已經(jīng)足夠強(qiáng)大和穩(wěn)定。作為浦東機(jī)場的核心信息系統(tǒng),其強(qiáng)大的續(xù)航能力只是基礎(chǔ),還需要通過科學(xué)、完善、契合的維護(hù)方式對其進(jìn)行養(yǎng)護(hù),以維持其一貫的穩(wěn)定性。
關(guān)鍵詞:航顯系統(tǒng);信息安全:設(shè)備運維:人機(jī)結(jié)合
中圖法分類號:V351文獻(xiàn)標(biāo)識碼:A
1 系統(tǒng)簡介
1.1 概述
作為國內(nèi)最大的國際機(jī)場、航空樞紐港,浦東機(jī)場航班信息顯示系統(tǒng)是浦東機(jī)場的核心系統(tǒng)。其通過與集成系統(tǒng)的接口連接獲取當(dāng)日乃至次日的航班信息,通過外圍顯示設(shè)備為旅客及工作人員提供實時準(zhǔn)確的航班動態(tài)信息。
自1999 年浦東機(jī)場開航至今,航顯系統(tǒng)的后臺構(gòu)成模式從IBM 小型機(jī)逐漸演化成以VMware 虛擬化為主,共有24 臺虛擬服務(wù)器組成,其中12 臺作為主服務(wù)器,12 臺作為備用服務(wù)器。其兼?zhèn)淞颂摂M化層面的實時切換技術(shù),同時也具備軟件層面的熱備技術(shù)。其外圍顯示由2 200 臺設(shè)備組成,包括7 種不同的顯示設(shè)備。
隨著浦東機(jī)場衛(wèi)星廳的開航,后臺又進(jìn)行了大量的擴(kuò)容,目前其后臺由3 個主機(jī)房組成,形成3 地(T1、T2 航站樓和衛(wèi)星廳)異地互備,同時2018 年建成了航顯系統(tǒng)的備份系統(tǒng),在極端情況下備份系統(tǒng)能完全替代主運營系統(tǒng),并在不影響現(xiàn)場業(yè)務(wù)的情況下接管主運行系統(tǒng)。
1.2 機(jī)房設(shè)備
機(jī)房設(shè)備主要包括服務(wù)器、光纖交換機(jī)、存儲,通過雙機(jī)房備份、虛擬化共享技術(shù)實現(xiàn)系統(tǒng)的強(qiáng)大冗余能力。網(wǎng)絡(luò)拓?fù)鋱D如圖1 所示。
2 系統(tǒng)維護(hù)中的難點及解決方案
作為浦東機(jī)場的核心業(yè)務(wù)系統(tǒng),航顯系統(tǒng)應(yīng)具備7?24 小時的運行能力,任何的例行維護(hù)、系統(tǒng)升級都不應(yīng)對其業(yè)務(wù)工作產(chǎn)生影響[1] 。因此,合理、科學(xué)、完善的運維方式必不可少,本文將從以下幾方面對其進(jìn)行研究。
2.1 信息安全
作為近期國家和公司大力推進(jìn)和強(qiáng)化的一項基礎(chǔ)工作,信息安全在系統(tǒng)運維的過程中需要做到規(guī)范、合理化,以保證系統(tǒng)免受網(wǎng)絡(luò)攻擊和非法外部入侵,以下是本文在信息安全方面的思路和解決方案。
2.1.1 建立主機(jī)root 用戶口令的管理制度
(1)嚴(yán)格控制知曉口令的人員。
(2)制定root password 規(guī)則,有條件可定期更改此規(guī)則。
(3)如有條件口令,可由2 位系統(tǒng)管理員產(chǎn)生,每一位制定口令的一半。
(4)使用passwd 命令定期修改root 口令,更改頻率為至少1 年1 次,并填寫口令修改記錄。
2.1.2 建立應(yīng)用系統(tǒng)管理員admin 用戶口令的管理制度
(1)嚴(yán)格控制知曉口令的人員。
(2)如有條件口令,可由2 位系統(tǒng)管理員產(chǎn)生,每一位制定口令的一半。
(3)使用passwd 命令定期修改sadmin 口令,更改頻率為至少1 年1 次,并填寫口令修改記錄。
2.1.3 建立操作員的安全管理制度
(1)利用安全管理工具來控制對Rapid Fids 的所有應(yīng)用工具和數(shù)據(jù)的存取權(quán)限。
2.1.4 建立航顯系統(tǒng)備份策略
(2)對所有服務(wù)器虛機(jī)每年備份1 次。
(3)在系統(tǒng)的操作系統(tǒng)和數(shù)據(jù)庫升級前,對系統(tǒng)進(jìn)行備份。
2.1.5 建立航顯系統(tǒng)賬戶管理制度
(1)每年度對用戶的賬號進(jìn)行整理與清除無效賬號,并對活動的賬號進(jìn)行口令的更改,由用戶提出申請,系統(tǒng)管理員更改口令。
(2)若有人員變動不再擔(dān)任系統(tǒng)管理員,則必須將該賬戶禁用或刪除。
(3)管理員賬號每年度更改一次密碼,由各管理員自行更改。
(4)航顯系統(tǒng)工作站的密碼每年度更改一次,由系統(tǒng)管理員自行更改。
2.1.6 建立航顯系統(tǒng)密碼管理制度
(1)若只有口令密碼,則管理員有將口令密碼告知他人的權(quán)利,其他口令密碼知情人不得將口令密碼告知他人。服務(wù)器密碼和終端管理員權(quán)限密碼由系統(tǒng)管理員掌握。終端受限賬號密碼和應(yīng)用軟件密碼由用戶掌握,并設(shè)專人負(fù)責(zé)保密和維護(hù)工作。
(2)嚴(yán)格限制服務(wù)器、終端、應(yīng)用軟件口令密碼的知情人員范圍。
(3)密碼長度必須不小于8位,密碼為數(shù)字、字母大寫、小寫和特殊字符中至少2 種的組合,所有密碼都不能為連續(xù)或重復(fù)的字母與數(shù)字;密碼不能具有某種規(guī)律性。
2.1.7 建立航顯系統(tǒng)日志檢查記錄制度
管理員每周對服務(wù)器上的系統(tǒng)日志進(jìn)行檢查,并對除以下情況外的記錄做進(jìn)一步記錄和分析。
(1)定期出現(xiàn)、原因已知且對系統(tǒng)沒有重大影響的報錯。
(2)曾經(jīng)出現(xiàn)、原因已知且對系統(tǒng)沒有重大影響的報錯。
(3)非系統(tǒng)核心區(qū)域出現(xiàn)的報錯,如某一終端報錯,確認(rèn)不會對系統(tǒng)造成影響的報錯。
2.2 系統(tǒng)日常維護(hù)
為保持系統(tǒng)的穩(wěn)定,需要持續(xù)地對系統(tǒng)進(jìn)行健康性檢查,依據(jù)歷年來的經(jīng)驗做實時地調(diào)整和優(yōu)化,包括以下部分。
2.2.1 航顯系統(tǒng)例行檢查日維護(hù)
每日對系統(tǒng)中的服務(wù)器資源使用情況進(jìn)行巡檢:其中包括磁盤空間和CPU 檢查、資源組online 情況、JBoss 進(jìn)程運行情況等內(nèi)容,并對其進(jìn)行記錄。
2.2.2 航顯系統(tǒng)例行檢查季度維護(hù)
每個季度需對系統(tǒng)進(jìn)行重啟HA 操作:手動關(guān)閉和開啟HA,并對重啟后的運行狀態(tài)進(jìn)行確認(rèn),并進(jìn)行記錄。
2.2.3 航顯系統(tǒng)例行檢查節(jié)日維護(hù)
重大節(jié)日前需對系統(tǒng)進(jìn)行檢查,其中包括所有服務(wù)器的工作狀態(tài)檢查,航顯工作站檢查等。
2.2.4 航顯系統(tǒng)例行檢查年度維護(hù)
每年度需對系統(tǒng)進(jìn)行一次清理AQ 操作。
2.3 應(yīng)急預(yù)案制定
作為系統(tǒng)維護(hù)中必不可少的部分,應(yīng)急預(yù)案在系統(tǒng)發(fā)生故障時有很大的參考價值,也可作為對新同事新員工的培訓(xùn)內(nèi)容。應(yīng)急預(yù)案若做得好就能很快地找到故障原因并對其排除,大量減少處置時間和縮小對生產(chǎn)運行的影響范圍。因此,根據(jù)以往的維護(hù)經(jīng)驗,總結(jié)出典型的重大故障的應(yīng)急處置方案,并制定流程圖。
2.3.1 航顯數(shù)據(jù)庫服務(wù)器故障應(yīng)急預(yù)案
(1)故障現(xiàn)象。
本故障可能導(dǎo)致航顯系統(tǒng)以下故障現(xiàn)象:
①所有航顯顯示設(shè)備無法更新顯示;
②現(xiàn)場航顯設(shè)備(行李小鍵盤、FCS)無法操作;
③TOC 操作人員無法使用客戶端軟件;
④所有離港操作終端與柜臺航顯設(shè)備無聯(lián)動。
(2)故障判斷。
根據(jù)服務(wù)器日志和故障現(xiàn)象判斷。
(3)風(fēng)險分析。
級別:嚴(yán)重影響航班運營。
后果:航顯系統(tǒng)癱瘓,各終端設(shè)備保留故障前顯
示內(nèi)容,無法顯示航班動態(tài)信息,操作終端無法操作。
風(fēng)險概率:待定(依據(jù)實際穩(wěn)定情況)。
(4)故障處理。
用root 用戶登錄10.28.170.11 pvgrs6db01 運行
#ha_standby.sh pvgrs6db01
#ha_mon.sh 檢查pvgrs6db02 是否正常運行
#ha_online.sh pvgrs6db01 保持節(jié)點pvgrs6db01 啟動
2.3.2 航顯應(yīng)用服務(wù)器故障應(yīng)急預(yù)案
(1)故障現(xiàn)象。
本故障可能導(dǎo)致航顯系統(tǒng)以下故障現(xiàn)象:
①航顯顯示設(shè)備無法更新顯示;
②DMU 中無法連接現(xiàn)場設(shè)備;
③離港操作終端與柜臺航顯設(shè)備無聯(lián)動。
(2)故障判斷。
根據(jù)服務(wù)器日志和故障現(xiàn)象判斷。
(3)風(fēng)險分析。
級別:影響航班運營。
后果:根據(jù)不同應(yīng)用服務(wù)器功能,導(dǎo)致無法顯示
航班動態(tài)信息,操作終端無法操作等故障。
風(fēng)險概率:待定(依據(jù)實際穩(wěn)定情況)。
(4)故障處理。
用root 用戶登錄10.28.170.51 pvgrs6isa01 運行
#ha_standby.sh pvgrs6isa01
#ha_mon.sh 檢查pvgrs6isa02 上是否正常運行
#ha_online.sh pvgrs6isa01 保持節(jié)點pvgrs6isa01啟動
2.3.3 航顯核心進(jìn)程故障應(yīng)急預(yù)案
(2)故障現(xiàn)象。
本故障可能導(dǎo)致航顯系統(tǒng)以下故障現(xiàn)象:
①航顯顯示設(shè)備無法更新;
②部分航顯功能無法正常使用。
(3)故障判斷。
根據(jù)服務(wù)器日志和故障現(xiàn)象判斷。
(4)風(fēng)險分析。
級別:影響航班運營。
后果:航顯部分功能無法使用。
風(fēng)險概率:待定(依據(jù)實際穩(wěn)定情況)。
(5)故障處理。
連接CS 服務(wù)器10.28.170.102,進(jìn)入u/ fids/ lbin運行核心進(jìn)程重啟腳本。
2.4 航顯系統(tǒng)上下屏規(guī)則制定
由于航顯系統(tǒng)的實時性及需求的多變性,需要根據(jù)旅客、工作人員、服務(wù)部門的一些要求做臨時或?qū)崟r調(diào)整[2] ,對此要制定各個區(qū)域的航班顯示規(guī)則,并根據(jù)多方要求評估規(guī)則的可行性和調(diào)整范圍,為此制定如下航班顯示規(guī)則。上屏規(guī)則如表1 所列。
以下是特殊情況下的顯示規(guī)則。
航班狀態(tài)“NOP”需TOC 座席人員手工操作。值機(jī)柜臺FCS 操作:柜臺計劃開始辦票前60 分鐘,計劃結(jié)束辦票后120 分鐘。
登機(jī)口FCS 操作:計劃開始登機(jī)前10 小時,計劃結(jié)束登機(jī)后10 小時。
登機(jī)口更改顯示規(guī)則,國際國內(nèi)均顯示3 小時內(nèi)更改信息。
2.5 人機(jī)結(jié)合的維護(hù)模式
除上文例行維護(hù)內(nèi)容外,建立監(jiān)控平臺并實行實時監(jiān)控,用短信、聲光的方式對發(fā)生的故障進(jìn)行通告,以達(dá)到預(yù)防、預(yù)警、預(yù)控的目的,保持系統(tǒng)的持續(xù)穩(wěn)定運行。
3 結(jié)束語
作為浦東機(jī)場的重要信息系統(tǒng),航班信息顯示系統(tǒng)的覆蓋范圍涉及全部旅客及現(xiàn)場工作人員,所以保障航顯系統(tǒng)及其他重要信息系統(tǒng)的持續(xù)穩(wěn)定運行是運維部門的首要職責(zé),本文對航顯系統(tǒng)的運維研究及方案制定,可作為其他信息系統(tǒng)的參考標(biāo)準(zhǔn),并逐步推廣、落實,以及持續(xù)改進(jìn)。
參考文獻(xiàn):
[1] 褚瑞娟.航顯系統(tǒng)顯示方案設(shè)計與實現(xiàn)[D].北京:北京郵電大學(xué),2014.
[2] 金輝,石敏. 成都雙流國際機(jī)場航顯系統(tǒng)的設(shè)計實現(xiàn)[J].計算機(jī)系統(tǒng)應(yīng)用,2003(3):8?11.
作者簡介:
唐源源(1981—),本科,工程師,研究方向:工業(yè)自動化系統(tǒng)、人工智能在機(jī)場運行和管理中的功能與運行保障。