LTE核心網(wǎng)常見故障和投訴案例分析
時間:2015-06-20 來源:網(wǎng)絡(luò) 作者:秩名 點擊:
次
主頁(http://www.130131.com):LTE核心網(wǎng)常見故障和投訴案例分析
案例一:臨時方案用戶預(yù)換卡不能使用2、3G業(yè)務(wù)
【故障現(xiàn)象】
臨時方案的用戶,在更換USIM卡但未開通4G業(yè)務(wù)的情況下,在4G網(wǎng)絡(luò)的覆蓋下,用4G手機終端可能無法正常使用2,3G業(yè)務(wù)。只能在4G手機上設(shè)置“2,3G only”,才能恢復(fù)正常使用。
【故障分析】
臨時方案的用戶,在更換USIM卡但未開通4G業(yè)務(wù)的情況下,當(dāng)前BOSS系統(tǒng)只是將用戶的IMSI鑒權(quán)信息通過BOSS指令存儲到HSS,并未建立IMSI和MSISDN的關(guān)聯(lián),即未放號為簽約用戶的任何2、3G的分組域、電路域和4G業(yè)務(wù)的簽約信息。這種場景下HSS給MME返回DIAMETER_ERROR_USER_UNKNOWN的錯誤碼,MME收到HSS的DIAMETER_ERROR_USER_UNKNOWN碼后,給終端返回#8 “EPS services and non-EPS services not allowed”的NAS原因值。終端收到“EPS services and non-EPS services not allowed”的NAS值后,不再嘗試重新選網(wǎng)。
【故障解決】
針對這種臨時方案的用戶,如果只更換USIM卡不簽約4G業(yè)務(wù),根據(jù)測試,MME給終端返回#7 “EPS services not allowed”的NAS值能夠使終端較快地重選到2、3G網(wǎng)絡(luò)。根據(jù)協(xié)議中定義的映射規(guī)則,HSS需要給MME返回DIAMETER_ERROR_UNKNOWN_EPS_SUBSCRIPTION (5420) with Error Diagnostic of NO_GPRS_DATA_SUBSCRIBED的錯誤原因值,對應(yīng)到HSS上,需要BOSS在用戶進行更換USIM卡時,不管用戶簽不簽約4G業(yè)務(wù)時,都要向HSS發(fā)送放號的BOSS指令,如果用戶不簽約4G業(yè)務(wù),則通過設(shè)置4G-APN模板為0來關(guān)閉用戶的4G功能。
啟示:網(wǎng)絡(luò)側(cè)把問題歸類后,通過NAS值反饋給終端,終端針對不同的NAS值會有不同的響應(yīng)行為,在定位此類問題的時候,需要抓取信令,觀察S1-MME接口上附著失敗或者TAU失敗的原因值。
案例二:國際漫游用戶漫入到國內(nèi)MME下無法使用
【故障現(xiàn)象】
韓國、香港等國際漫游用戶在國內(nèi)某市中興MME下無法附著使用4G業(yè)務(wù),而國內(nèi)用戶在同一地點正常使用4G業(yè)務(wù)。
【故障分析】
進行信令跟蹤,發(fā)現(xiàn)國際漫游用戶附著時,MME回了PDN connectivity reject,原因值為網(wǎng)絡(luò)失。

MME失敗觀察報TAC的DNS解析失敗:

MME上檢查對TAC的域名解析緩存,發(fā)現(xiàn)只有x-s5-gtp服務(wù),而國際漫游用戶需要使用x-s8-gtp服務(wù):

【故障解決】
在DNS上修改TAC域名解析數(shù)據(jù),增加對X-S8-GTP的解析結(jié)果。增加完畢后,再次檢查MME上收到的DNS返回結(jié)果,發(fā)現(xiàn)支持X-X8-GTP,再次測試,國際漫游用戶使用4G業(yè)務(wù)正常。

案例三:過渡方案4G用戶終端有4G信號但附著失敗,駐留2,3G
【故障現(xiàn)象】
過渡方案4G用戶終端有4G信號,但是附著失敗,只能駐留在2、3G網(wǎng)絡(luò),更換位置后重新有4G標(biāo)志,嘗試附著仍然失敗。
【故障分析】
進行信令跟蹤,發(fā)現(xiàn)用戶在2、3G下無附著4G的請求上來,要求4G用戶更換位置,能觸發(fā)附著請求,查看信令發(fā)現(xiàn)拒絕原因值是#15 No Suitable Cells In tracking area,同時在中興MME上抓包發(fā)現(xiàn)HSS返回的鑒權(quán)有錯誤,錯誤碼是DIAMETER_AUTHORIZATION_REJECTED,檢查HLR該用戶簽約數(shù)據(jù),發(fā)現(xiàn)有2,3G簽約,但4G被關(guān)閉(OBEPC-1),因此愛立信HSS返回DIAMETER_AUTHORIZATION_REJECTED,根據(jù)規(guī)范,MME會回復(fù)#15:No Suitable Cells In tracking area,導(dǎo)致終端不斷重復(fù)4G附著,最后因失敗該TA被終端記錄下來作為不被允許的TA,不再嘗試附著,但是更換了位置后,不同的TA下可以重新附著4G網(wǎng)絡(luò),但是因為HLR中停止了4G功能,附著4G網(wǎng)絡(luò)仍然失敗。
【故障解決】
查看NAS值規(guī)范,針對4G被停機的情況,建議愛立信HSS返回UNKNOWN_EPS_SUBSCRIPTION,這樣MME回復(fù)#7 EPS not allowed,只影響4G業(yè)務(wù),不影響2,3G。
案例四:愛立信MME到中興MME切換出現(xiàn)4G業(yè)務(wù)斷流
【故障現(xiàn)象】
在測試4G用戶從中興MME覆蓋下切換到愛立信MME覆蓋范圍,發(fā)現(xiàn)4G用戶切換失敗,出現(xiàn)4G業(yè)務(wù)中斷的情況。
【故障分析】
經(jīng)過在MME側(cè)抓包分析,從愛立信MME覆蓋范圍移動到中興MME覆蓋范圍內(nèi),會由原MME發(fā)起Forward Relocation Request,并NAS層加密算法選定EEA2。
.... 0010 = Used NAS Cipher: 128-EEA2 (0x02)
但是在其后對中興MME發(fā)起的TAU中,中興MME發(fā)起了到HSS的鑒權(quán)請求,并選定
000 .... = Type of ciphering algorithm: EPS encryption algorithm 128-EEA0 (ciphering not used) (0x00)
EEA0作為加密算法,并向基站發(fā)起UE CONTEXT MODIFICATION REQEUST,要求基站修改NAS層加密算法,但是被基站拒絕。究其原因,是因為愛立信基站不支持TAU過程中的UE上下文修改。
【故障解決】
通過愛立信MME的加密算法優(yōu)先級,選定EEA0作為最高優(yōu)先級,使得切換過程無需修改UE上下文,規(guī)避此問題,但是最終需要愛立信基站增強該部分功能。
案例五:某市CSFB呼叫失敗原因
【故障現(xiàn)象】
某市5s用戶可以上4G進行數(shù)據(jù)業(yè)務(wù),但是進行CSFB呼叫失敗。
【故障分析】
經(jīng)過MME以及MSC的聯(lián)合調(diào)測發(fā)現(xiàn),該用戶在聯(lián)合附著中,PS域附著成功,但CS域附著失敗,初步懷疑是TA-LA映射表的MSC指向錯誤,核查該MSC pool中開了SGS口的MSC正確。最后在SGS口抓取信令,發(fā)現(xiàn)原因是MME通過SGS口發(fā)向MSC的Location update的過程中,MSC拒絕了,因為MME上配置的mme id和MSC上配置的mme id不一樣 ,因此MSC拒絕了CS域的附著請求。
【故障解決】
究其原因,是因為愛立信設(shè)備的一個限制,在MME上未能按照mmegi的規(guī)劃,因此造成這個差別。在MSC上將mme id改為與MME上配置一致后,用戶撥測CSFB呼叫正常,短信發(fā)送接收正常,問題解決。
案例六:某市公司5s用戶開啟無法附著到4G
【故障現(xiàn)象】
某市用IPHONE 5S在關(guān)閉4G功能的情況下附著在3G網(wǎng)絡(luò),正常發(fā)起業(yè)務(wù),但是打開4G開關(guān),出現(xiàn)20多秒無服務(wù),最后附著在3G,只能通過重啟終端附著上4G。
【故障分析】
5s關(guān)閉4G網(wǎng)絡(luò),PDP激活到GGSN(5s關(guān)閉4G網(wǎng)絡(luò)后,終端不上報4G能力,SGSN的UE能力識別為非4G終端,引導(dǎo)選用到GGSN。當(dāng)5s開啟4G網(wǎng)絡(luò),會發(fā)起combined TAU到MME,此時返回TAU reject,原因值為CC=17 (network failure);原因是MME上有PGW 選擇的校驗,發(fā)現(xiàn)SGSN回復(fù)的SGS CONTEXT RESPONSE消息中攜帶了GGSN的地址,包含在Private Extension部分。終端收到#17的網(wǎng)絡(luò)故障原因值后,會重復(fù)以上TAU過程5次,都被拒絕,所以就出現(xiàn)了 十幾秒后重選回3G網(wǎng)絡(luò)的現(xiàn)象。只有重啟手機,才能正常返回4G。
究其原因,蘋果5s的關(guān)閉4G功能,不上報終端4G能力,導(dǎo)致網(wǎng)絡(luò)側(cè)沒有正常引導(dǎo)業(yè)務(wù)到PGW上,導(dǎo)致互操作失敗。
【故障解決】
通過關(guān)閉SGSN的Private Extension消息體的回復(fù),規(guī)避MME的PGW校驗,使得TAU流程能在MME繼續(xù)進行,最后因為創(chuàng)建承載失敗而TAU拒絕,此時返回的NAS原因值不再是#17,因此蘋果5s可以重新發(fā)起一次附著,從而返回4G網(wǎng)絡(luò)。
案例七:排除用戶原因的附著成功率低
【故障現(xiàn)象】
某天某省的排除用戶原因的附著成功率從90%以上,下降到60%左右。
【故障分析】
從該指標(biāo)的算法看,排除用戶原因的附著成功率= EPS附著成功次數(shù) / (EPS附著請求次數(shù) -非法用戶的EPS附著失敗次數(shù) -非法ME的EPS附著失敗次數(shù) -EPS服務(wù)不允許的EPS附著失敗次數(shù) -EPS和非EPS服務(wù)不允許的EPS附著失敗次數(shù)),也就是附著請求次數(shù) - #3 - #6 - #7 - #8的錯誤請求(減去屬于用戶原因部分),但是通過廠家網(wǎng)管查看15分鐘顆粒度性能指標(biāo)發(fā)現(xiàn),在某個時刻開始,#15的錯誤請求次數(shù)增加明顯,詢問發(fā)現(xiàn)市場部推行用戶開戶模板默認關(guān)閉4G功能,導(dǎo)致全省大量用戶出現(xiàn)4G停機現(xiàn)象, 2、3G正常的情況下,HSS返回DIAMETER_AUTHORIZATION_REJECTED (5003),MME將其映射的NAS原因值為#15:No Suitable Cells In tracking area;從而影響了排除用戶原因的附著成功率。
【故障解決】
可知,上述原因是用戶停機原因?qū)е,因此對于NAS值#15的返回值,實際上包含部分用戶原因的問題在里面,目前的確存在這樣的情況。只能通過廠家MME上的NAS值映射功能,把這種HSS錯誤映射到其他原因值,從而在不影響用戶感知的情況下,保證指標(biāo)的客觀準(zhǔn)確性。
案例八:無4G信號投訴的解決
目前最常見的投訴是用戶反饋4G無信號或不能使用4G業(yè)務(wù)。
首先確認故障的范圍,是個別用戶問題、還是號段用戶都有問題、還是一大片區(qū)域都存著此故障。
個別用戶問題的嘗試解決辦法:
1)可以先在HSS上查詢該用戶的簽約數(shù)據(jù)是否正常。
2)通過MME/SGW/PGW/HSS信令跟蹤來確定具體原因。如果MME上跟蹤不到任何S1口信令,一般是由于終端或USIM卡原因造出。如果MME上跟蹤到了用戶信令,需要查看各接口的信令來確定具體原因,比如有可能是用戶鑒權(quán)流程中失敗、用戶使用了非法的APN等。TIPS:信令跟蹤時建議通過IMSI來跟蹤用戶以便跟蹤較全的信令。
3)如果不方便進行用戶信令跟蹤,可在HSS/MME上查看用戶信息來進行簡單判斷。
如果能查到MME信息,說明至少用戶曾經(jīng)在4G網(wǎng)絡(luò)成功附著過,現(xiàn)在不能使用的原因有待進一步分析,如果沒有MME位置信息,說明用戶可能從未在4G網(wǎng)絡(luò)附著過。
(中國集群通信網(wǎng) | 責(zé)任編輯:陳曉亮) |