1 接入問題定位優(yōu)化方法
1.1 接入流程及問題表現(xiàn)
1.1.1 接入流程
接入流程可以分為四個步驟:
1)隨機接入
2)RRC連接建立
3)鑒權(quán)
4)E-RAB建立
接入問題的主要表現(xiàn)也體現(xiàn)在這四個步驟上。
1.1.2 隨機接入失敗
隨機接入失敗的常見原因
1)ENB側(cè)參數(shù)配置問題
2)UE側(cè)參數(shù)配置問題
3)信道環(huán)境影響
4)核心網(wǎng)側(cè)配置問題
備注:由于隨機接入是L2的過程,在ENB側(cè)沒有明顯的特征表現(xiàn),需要結(jié)合UE側(cè)的log來進行觀察與判斷
1.1.3 RRC連接建立失敗
RRC連接建立的話統(tǒng)統(tǒng)計
1)【A點】
指標L.RRC.ConnReq.Att加1,不統(tǒng)計重發(fā)的次數(shù)
2)【C點】
指標L.RRC.ConnReq.Succ加1,不統(tǒng)計重發(fā)的次數(shù)
RRC建立連接失敗在ENB側(cè)的表現(xiàn)如下:
1)RRC_CONNECTION_CMP沒有收到
2)ENB回復RRC_CONNECTION_REJECT
1.1.4 鑒權(quán)流程失敗
這里所說的鑒權(quán)流程指的是在S1口上,ENB發(fā)起UE_INITIAL_MESSAGE到收到核心網(wǎng)側(cè)發(fā)送的INITIAL_UE_context_Setup_REQ這之間的所有流程交互:
該流程存在問題導致接入失敗的幾個現(xiàn)象
1)UE與核心網(wǎng)直傳消息空口交互丟失(ENB側(cè)來看是對應的上行直傳消息沒有收到)
2)核心網(wǎng)直接發(fā)送釋放命令
3)核心網(wǎng)不響應或者響應過慢
1.1.4 E-RAB建立失敗
E-RAB建立的話統(tǒng)統(tǒng)計
1)【A點】
如圖中A點所示,當eNodeB收到來自MME的E-RAB SETUP REQUEST或者INITIAL CONTEXT SETUP REQUEST消息時E-RAB建立嘗試次數(shù)累加
2)【B點】
如圖中B點所示,當eNodeB收到來自MME的E-RAB SETUP RESPONSE或者INITIAL CONTEXT SETUP RESPONSE消息時E-RAB建立成功次數(shù)累加
E-RAB建立失敗在空口信令的表現(xiàn)
1)空口安全交互,UE回復FAIL
2)空口安全交互,UE未回復CMP
3)空口DRB建立重配,UE未回復CMP
4)空口UE能力查詢,UE未回復
E-RAB建立失敗S1口信令表現(xiàn)(空口信令交互正常)
1)核心網(wǎng)異常
2)無線資源申請失敗
3)GTPU資源申請失敗
1.2 問題定位、解決方法
接入失敗問題定位規(guī)定動作
1.2.1 問題定位:第一板斧
話統(tǒng)分析
1)通過話統(tǒng)分析可以區(qū)分RRC建立失敗或者E-RAB建立失敗的TOP小區(qū)和統(tǒng)計TOP時間段
2)通過話統(tǒng)分析可以區(qū)分RRC建立失敗是因為空口原因?qū)е逻€是由于小區(qū)資源問題導致。
3)通過話統(tǒng)分析可以統(tǒng)計E-RAB建立過程,由于空口安全交互,UE回復FAIL導致建立失敗的次數(shù),該現(xiàn)象為UE和核心網(wǎng)交互失敗導致,需要聯(lián)合UE和CN共同定位。
1.2.2 問題定位:第二板斧
CHR日志分析
通過CHR日志分析可以獲取RRC建立失敗或者是E-RAB建立失敗的top用戶的TMSI。
1.2.3 問題定位:第三板斧
跟蹤
1)標口跟蹤:通過話統(tǒng)統(tǒng)計出top小區(qū)和top時間段后,在對應的小區(qū)和時間段開啟標口跟蹤,查看接入流程走到哪一步失敗。
2)IFTS跟蹤:在對應的小區(qū)和時間段開啟IFTS跟蹤,確認接入失敗用戶的鏈路質(zhì)量狀況。
3)啟動單用戶全網(wǎng)跟蹤:通過TOP用戶的TMSI在核心網(wǎng)側(cè)獲取其IMSI,然后啟動該用戶的全網(wǎng)跟蹤。
1.2.4 問題解決方法
傳輸及核心網(wǎng)問題
從跟蹤分析流程,如果屬于核心網(wǎng)問題,需要聯(lián)合核心網(wǎng)側(cè)人員共同定位解決
ERAN側(cè)異常
1)空口異常:上行受限、下行受限、覆蓋空洞、干擾過大
2)基站異常:一般屬于產(chǎn)品問題,需要相關(guān)產(chǎn)品日志進行分析定位
UE側(cè)問題
如果統(tǒng)計顯示一直是某個用戶接入有問題,而該小區(qū)其他用戶一直正常,該終端異常的可能性較大,需要通過獲取的IMSI信息回溯,實地復現(xiàn)定位解決。
問題解決方法:上下行不平衡和覆蓋空洞
無論是上下行不平衡還是覆蓋空洞,均表現(xiàn)為鏈路質(zhì)量較差
1)上行鏈路較差的表現(xiàn)就是RB縮到最小,上行MCS選擇0階,PHR已經(jīng)在0db以下,而且上行BLER較大不收斂,CRC校驗解錯的概率較高。
2)下行鏈路較差的表現(xiàn)為UE上報CQI較差或者網(wǎng)絡側(cè)HARQ收到大量來自UE側(cè)反饋的DTX和NACK
3)上行受限指的是上行較差而下行還可以;下行受限指的是上行還可以而下行較差;覆蓋空洞指的是上下行鏈路均已較差。
對于上行受限可采用如下辦法解決:
1)增加基站,減小下行小區(qū)覆蓋距離
2)增加塔放,增加上行信號補償
3)減小導頻功率,減小下行小區(qū)覆蓋距離
4)增加天線數(shù),增強上行信號增益
對于下行受限可采用如下辦法解決:
1)增加基站,減小下行小區(qū)覆蓋距離
2)增大導頻功率,增加下行小區(qū)覆蓋距離
3)天線拉遠,增強邊緣覆蓋
對于覆蓋空洞
增加基站,增強覆蓋。
2 切換問題定位優(yōu)化方法
2.1 切換流程及問題表現(xiàn)
2.1.1 切換原理及信令流程
切換的過程就是終端在移動過程中與網(wǎng)絡連接交互發(fā)生變化的過程:
LTE系統(tǒng)的整個切換過程完全由網(wǎng)絡側(cè)(eNB)控制,所以eNB需要監(jiān)測UE所處的無線質(zhì)量環(huán)境,這個過程是通過eNB下發(fā)測量控制讓UE在滿足一定條件時上報測量報告來實現(xiàn)的:
1)觸發(fā):當前我司eNB是采用A3事件觸發(fā)同頻切換,通過A2、A4事件來觸發(fā)異頻切換
2)切換:eNB下發(fā)切換命令給UE,UE收到切換命令后,中斷與源小區(qū)的交互,按命令切換
2.1.2 切換失敗
判斷是否切換,通常以信令為判斷依據(jù),在終端側(cè),以發(fā)出觸發(fā)切換的測量報告為開始,以切換完成消息為結(jié)束;
切換成功時,從UE側(cè)觀察表現(xiàn)為UE從一個源小區(qū)到一個新的小區(qū)(可從PCI變化來觀察)進行正常業(yè)務交互;
Q1:測量報告丟失現(xiàn)象
UE側(cè)發(fā)出測量報告后,但沒有收到切換命令,在UE側(cè)和eNB的現(xiàn)象分別如下:
Q2:切換命令丟失現(xiàn)象:
UE側(cè)發(fā)出測量報告后,eNB收到測量報告,并下發(fā)切換命令,但UE側(cè)沒有收到;
UE側(cè)看到的現(xiàn)象與切換測量報告丟失一樣;從eNB側(cè)看,則是收到測量報告下發(fā)切換命令后,在目標小區(qū)沒有收到切換完成消息;
Q3:目標小區(qū)接入失敗現(xiàn)象:
UE側(cè)發(fā)出測量報告后,eNB收到測量報告,并下發(fā)切換命令,UE收到切換命令后,在目標小區(qū)發(fā)起接入,但目標側(cè)沒有收到切換完成消息,在UE側(cè)和eNB的現(xiàn)象分別如下:
2.2 問題定位、解決方法
2.2.1 切換問題定位規(guī)定動作
設備狀態(tài)檢查
1)查詢基站、小區(qū)告警,保證沒有與切換相關(guān)的嚴重告警(如X2配置鏈路斷開、RRU告警等)
2)檢查測試終端是否能正常使用,是否支持異頻、異系統(tǒng)重選、切換功能
參數(shù)核查
1)確認切換開關(guān)狀態(tài)
2)確認鄰區(qū)配置,確認鄰區(qū)關(guān)系、X2接口配置、傳輸配置
3)確認切換參數(shù),比如切換門限,幅度遲滯,時間遲滯等
4)確認是否存在PCI沖突告警
切換失敗TOP站鄰區(qū)漏配檢查
地理位置、網(wǎng)絡規(guī)劃角度,確認是否鄰區(qū)漏配,并實施相應操作
2.2.2 切換問題的定位、解決方法
TOP1:鄰區(qū)漏配核查:
從網(wǎng)絡側(cè)跟蹤UU口和終端側(cè)Uu口跟蹤結(jié)合判斷:
1)網(wǎng)絡側(cè):同一用戶(CALL ID)連續(xù)上報測量報告但沒有下發(fā)切換命令,檢查X2或S1跟蹤中分別也沒有HANDOVER REQUST及S1AP_HANDOVER_REQUIRED,則很可能是漏配的小區(qū)(通過查詢配置確認);
2)終端側(cè):隨著UE移動服務小區(qū)RSRP越來越差,SINR越來越差,而鄰區(qū)RSRP越來越好,上報測量報告,沒有收到切換命令;
TOP2:切換不及時:
當鄰區(qū)無線質(zhì)量滿足切換門限時,服務小區(qū)的RSRP突然陡降:
1)修改服務小區(qū)與鄰區(qū)的偏置CellIndividualOffset來提前切換
2)修改服務小區(qū)的延遲觸發(fā)時間IntraFreqHoA3TimeToTrig來提前切換(建議配置為40ms到200ms之間的一個值,如80ms)
3)調(diào)整切換門限參數(shù)IntraFreqHoA3Hyst、 IntraFreqHoA3Offset來提前切換(此操作用得很少)
TOP2:弱覆蓋:
從終端側(cè)判斷:
當鄰區(qū)無線質(zhì)量滿足切換門限時,服務小區(qū)和鄰區(qū)的RSRP都十分弱;
從網(wǎng)絡側(cè)判斷:
從網(wǎng)絡側(cè)跟蹤的UU口消息中,觸發(fā)切換的A3測量報告記錄的源小區(qū)、目標小區(qū)RSRP都很低,當測量報告中攜帶的服務小區(qū)RSRP值小于-110dBm時,可以認為處于信號質(zhì)量微弱的區(qū)域,此時容易出現(xiàn)切換失敗,需要調(diào)整覆蓋;
弱覆蓋的解決方法:
1)調(diào)整天線方向角、傾角:當下行先受限時,可以通過調(diào)整天線(如減小下傾角)補充遠點的下行覆蓋;
2)增加塔放、基站:當上行先受限時,可以通過增加塔放、增加小區(qū)(基站或接遠RRU)的方式增強上行覆蓋;
TOP3:乒乓切換:
乒乓切換的解決方法
1)相對調(diào)整兩小區(qū)的CIO值,抵制乒乓切換;
2)當前默認使用同頻切換門限為2dB,從前面整理出來的乒乓區(qū)域RSRP相對值來看,最大RSRP差距為4dB,所以設置CIO為-3dB,可以防止乒乓;
TOP3:干擾
干擾的表現(xiàn)
在RSRP比較好的情況下,吞吐率不如預期、容易出現(xiàn)切換失敗甚至掉話等多種現(xiàn)象;
干擾的解決方法
找出干擾原因,去除干擾源
3 掉話問題定位優(yōu)化方法
3.1 掉話流程及問題表現(xiàn)
3.1.1 LTE網(wǎng)絡掉話定義
話統(tǒng)掉話定義
當eNodeB收到來自MME的E-RAB RELEASE COMMAND( UE CONTEXT RELEASE COMMAND)消息,或eNodeB向MME發(fā)送E-RAB RELEASE INDICATION( UE CONTEXT RELEASE REQUEST )消息,且釋放原因不為“Normal Release”,“User Inactivity”,“Partial Handover”,“Handover triggered”,“successful-handover”,“cs-fallback-triggered”時統(tǒng)計該指標。如果E-RAB RELEASE COMMAND消息中要求同時釋放多個E-RAB,則相應指標按各個業(yè)務的QCI分別進行累加。
3.2 問題定位、解決方法
3.2.1 掉話排查基本步驟
首先需要在話統(tǒng)側(cè)獲取全網(wǎng)的掉話率指標以及趨勢,掉話率趨勢分析至少需要1~2周左右的數(shù)據(jù),如果全網(wǎng)掉話率指標突然偏高,一般執(zhí)行步驟:
1)是否全網(wǎng)問題:
對MME及eNB側(cè)進行告警排查(傳輸,設備等告警)、觀察期間是否實施版本升級
2)是否存在Top小區(qū):
●小區(qū)級的掉話率指標和掉話絕對次數(shù)按從高到低的順序進行排序,優(yōu)先分析掉話絕對次數(shù)多而且掉話率高的Top小區(qū)
●對Top小區(qū)進行參數(shù)核查、告警檢查等
●對引起掉話的Top原因進行定位分析
3)若是共性問題,將優(yōu)化結(jié)果復制到全網(wǎng)
3.2.1 掉話問題定位、解決方法
Top1:參數(shù)對比
隨機抽取部分站點的腳本與基線參數(shù)進行核對,對不一致的參數(shù)進行分析;
Top2:告警核查
1)是否存在傳輸告警:觀察S1傳輸是否出現(xiàn)問題;
2)是否存在設備告警:觀察eNB側(cè)是否存在告警;
3)檢查系統(tǒng)是否升級、打補丁等動作;
Top3:Top小區(qū)篩查
1)將小區(qū)級的掉話率指標和掉話絕對次數(shù)按從高到低的順序進行排序,優(yōu)先分析掉話絕對次數(shù)多且掉話率高的Top小區(qū);
2)通常取每天掉話率高于平均指標的Top5小區(qū)進行分析,確定掉話的主要原因;
3.2.2 Top小區(qū)分析流程
1)獲取小區(qū)級話統(tǒng)的掉話率指標及趨勢,掉話率趨勢分析至少1~2周左右的數(shù)據(jù):
●如果小區(qū)的掉話率指標突然偏高,需要檢查eNB側(cè)是否存在該小區(qū)相關(guān)的告警信息,檢測該小區(qū)所屬eNB的告警,確認該小區(qū)是否出現(xiàn)故障等信息;
●常見的告警如RRU相關(guān)的告警,通道相關(guān)的告警,傳輸相關(guān)的告警,基帶板相關(guān)的告警等;
2)分析CHR數(shù)據(jù),獲取導致掉話的各種原因的比例,按照比例從高到低的順序分別針對不同的原因進行定位,并對各Top原因進行分析處理;
3)判斷是否存在OM操作導致的站點復位,重啟等導致的掉話;
4)檢測是否有Top用戶存在,如果有,需要對Top用戶的log進行詳細分析;
5)如果無法通過CHR數(shù)據(jù)定位解決的問題,需要通過抓取該Top小區(qū)內(nèi)eNB側(cè)的IFTS跟蹤;
6)如果無法進一步深入分析,在需要使用測試終端進行復現(xiàn),并抓取UE側(cè)的log及內(nèi)部打印信息進一步定位;
3.2.3 CHR原因統(tǒng)計
取每天的Top5站點通過InsightSharp對CHR數(shù)據(jù)進行分析,找到影響每個Top小區(qū)掉話率的主要原因:
3.2.4 CHR常見釋放原因
3.2.5 Top用戶排查
Top用戶的確定
1)Top用戶的判斷主要是依據(jù)終端接入時上報的TMSI進行判定,華為核心網(wǎng)TMSI分配的機制是對于同一個IMSI用戶,TMSI的右起第5位進行隨機賦值,即某用戶的TMSI中只有*指示的8bits位置發(fā)生變化,就是同一個用戶,C0 6* 00 05;
2)TMSI可以通過CHR數(shù)據(jù)分析獲取:
3.2.6 Top用戶log分析
Step1:分析是否存在同頻鄰小區(qū)漏配或者錯配導致的掉話;
Step2:分析是否存在弱覆蓋導致的掉話;
Step3:分析是否由于切換來不及導致的掉話;
Step4:分析是否導頻污染引起的掉話:
Step5:分析是否存在上行干擾導致的掉話:
如果掉話原因不是步驟1~5所述的原因,則很有可能是非RF原因?qū)е碌牡粼?,需要結(jié)合IFTS信息進一步定位;
如果是異常導致的掉話,則需要結(jié)合一鍵式日志、TTI跟蹤等信息進行異常定位。
3.2.7 Top用戶隔離定位
輸入數(shù)據(jù)
1)eNB IFTS跟蹤
2)UE TTI跟蹤
3)UE側(cè)路測log
4)eNB表口log
6)一鍵式日志
7)CHR日志
3.2.8 Top用戶掉話分析四步曲
Step1:標口流程分析誰主動發(fā)起釋放
1)eNB主動發(fā)起釋放
eNB主動向核心網(wǎng)發(fā)起釋放請求,收到核心網(wǎng)下發(fā)的釋放命令后釋放用戶RRCConnRel、并向核心網(wǎng)反饋釋放完成
2)核心網(wǎng)主動發(fā)起釋放
eNB收到核心網(wǎng)下發(fā)的釋放命令,釋放用戶RRCConnRel、并向核心網(wǎng)反饋釋放完成
Step2:通過S1釋放請求/命令中的釋放原因值隔離掉話原因
1)無線側(cè)原因觸發(fā)釋放
2)傳輸原因觸發(fā)釋放
3)NAS原因觸發(fā)釋放
4)協(xié)議原因觸發(fā)釋放
5)其他混合原因觸發(fā)釋放
Step3:CHR分析詳細釋放原因
Step4:復現(xiàn)問題抓取IFTS跟蹤、UE側(cè)Log,深度定位掉話根因
4 相關(guān)工具和信息獲取方式
消息跟蹤工具:
數(shù)據(jù)分析工具:
“切換測量控制”及“切換測量報告”消息的確認:
切換命令”消息的確認:
用消息查看軟件,打開UU接口“切換測量報告”消息后面的一條RRCConnectionReconfiguration消息,便可打開消息查看其詳細內(nèi)容,以UE側(cè)跟蹤的消息為例:
重建請求消息發(fā)送“小區(qū)”的確認:
重建請求消息是發(fā)往哪個小區(qū)的,在網(wǎng)絡側(cè)通過跟蹤文件比較容易確認,在UE側(cè)可用消息查看軟件查看UE側(cè)UU接口“RRC_CONN_REESTAB_REQ”消息前的RRC_SIB_TYPE1消息,雙擊打開消息查看其詳細內(nèi)容
聯(lián)系客服