主頁(http://www.130131.com):移動BOSS接口監(jiān)控及應急分析 BOSS作為移動運營商業(yè)務支撐的最核心系統(tǒng),在提高運營能力、控制成本、分析市場等方面都發(fā)揮關鍵作用。隨著數(shù)據(jù)業(yè)務的快速發(fā)展,外圍系統(tǒng)不斷增加,系統(tǒng)之間的數(shù)據(jù)傳遞與功能交互也呈劇增趨勢。 由于歷史與公司發(fā)展策略等多種因素,佛山移動的BOSS系統(tǒng)中存在著多種系統(tǒng)并存的情況。而多數(shù)系統(tǒng)由不同公司開發(fā),也導致數(shù)據(jù)格式、消息機制等不盡相同。其中的惟一相同點,是外圍系統(tǒng)都必須通過“接口”才能與BOSS產(chǎn)生交互,接口有效地保證了數(shù)據(jù)安全與模塊獨立,同時也意味接口中斷將割裂內(nèi)外部系統(tǒng)的連接。 根據(jù)規(guī)范,所有功能與業(yè)務的設置都必須由BOSS發(fā)起,一旦發(fā)生接口故障,涉及外圍系統(tǒng)的一切操作都將失敗。以目前的用戶基數(shù),即便是短時間內(nèi)發(fā)生異常,所造成的影響也是不可估量。因此,研究如何保障接口的高穩(wěn)定性與可靠性意義重大。 BOSS2.0接口系統(tǒng)框架 BOSS接口系統(tǒng)并非獨立存在,圖1描述了接口系統(tǒng)的技術框架,如圖中所示,在整個技術架構(gòu)中,BOSS接口所處的位置、與關聯(lián)模塊的對接方式、內(nèi)部實現(xiàn)原理等因素,都是能有效維護BOSS系統(tǒng)的基本前提。
圖1 BOSS2.0接口系統(tǒng)框架 由圖1可知,從調(diào)用方向的角度看,接口可分為主動接口和被動接口,分別表示BOSS調(diào)用外圍系統(tǒng)服務,以及外圍系統(tǒng)調(diào)用BOSS服務。主動接口由BOSS應用服務器驅(qū)動,即BOSS應用服務器上的主動服務接口進程,是調(diào)用CICS對相關待處理表進行輪詢,并將每一條記錄封裝為一條消息放入MQ隊列(該隊列均由消息組成),接口機上的主動接口再從隊列中取出消息進行解析,進而根據(jù)控制信息發(fā)送到指定系統(tǒng)執(zhí)行。被動接口則是由外圍系統(tǒng)驅(qū)動,通過接口機上的CICS客戶端調(diào)用BOSS應用服務器上的業(yè)務層服務操作數(shù)據(jù)庫。 值得一提的是,作為BOSS與外圍系統(tǒng)的承接點,接口的功能最終可歸結(jié)為對BOSS與外圍系統(tǒng)數(shù)據(jù)庫的操作。其中,主動接口的實現(xiàn)邏輯對BOSS2.0接口監(jiān)控措施的實現(xiàn)至關重要。 接口監(jiān)控措施 監(jiān)控接口是避免故障突發(fā)的重要措施。通過分析運行情況,監(jiān)控接口能實現(xiàn)異常情況的提前預警,有效地縮短故障持續(xù)時間。 從分析方法的角度看,監(jiān)控可分為定性和定量兩種,前者關注受監(jiān)控體相關因素本質(zhì)是否發(fā)生變化,是常用手段,而后者則深入到相關因素變化的數(shù)量,使分析更為徹底。 1.接口定性監(jiān)控 接口的本質(zhì)是進程,監(jiān)控進程一般采用查看進程狀態(tài)以及日志分析。作為有具體應用的進程,接口還有其特殊性,因而接口的定性分析至少覆蓋以下4個層次。 1)系統(tǒng)環(huán)境 指操作系統(tǒng)及硬件環(huán)境穩(wěn)定,提供進程足夠的信息資源,不存在非兼容應用等情況,這些是接口賴以生存的基本條件。 2)進程狀態(tài) 在系統(tǒng)環(huán)境滿足的情況下,檢測進程狀態(tài)是最重要的方法,但必須注意進程活躍并不等同于進程正常工作,在Linux系統(tǒng)中,其進程可能因異常而停止工作,但仍能在活躍列表中查詢到,此時需配合日志做進一步定位。發(fā)生后這種現(xiàn)象的原因是,在正常情況下,所有的進程動作都會被寫入log文件。 3)日志分析 在日志分析環(huán)節(jié),主要包括寫入狀態(tài)與日志內(nèi)容,如果檢測到日志處于寫狀態(tài),則說明對應進程是活躍的,但進程正常與否尚需進一步判斷日志內(nèi)容。異常操作時,在日志中會有失敗代碼關鍵字返回,如failed、error等。 4)進程時態(tài) 進程時態(tài)指從業(yè)務角度看進程活躍的時間段。并非所有進程都是24小時處于工作狀態(tài),正如銀行劃扣接口一般只允許在夜間啟動,因此白天期間檢測日志是無法判斷該進程是否正常,若不考慮該特性,則可基本判斷該進程結(jié)果是否有可能出錯。
(中國集群通信網(wǎng) | 責任編輯:陳曉亮) |




