用户
 找回密码
 注册会员
搜索

5G KPI性能分析思路

[复制链接]
发表于 2020-8-3 22:57:26
与传统LTE网络一样,5G需要从“接入性”、“移动性”、“保持性”以及“小区数传能力”几个维度进行性能问题分析定位。
接入性:SCG添加成功率;
移动性:SCG修改成功率、SCG变更成功率、锚点切换成功率;
保持性:SCG异常释放率;
小区数传能力:小区下上下行感知速率。
一、 小区接入性能问题
NSA组网小区,终端接入5G网络的情况主要从“SCG添加成功率”来体现,主要涉及流程如下(LTE打点以及NR侧打点):
Ffueu2.png
umeMV3.png
涉及指标:SCG添加成功率
计算公式:
LTE侧:上图1
L.NsaDc.SgNB.Add.Succ / L.NsaDc.SgNB.Add.Att*100%
NR侧:上图2
N.NsaDc.SgNB.Add.Succ/N.NsaDc.SgNB.Add.Att*100%

1、NR小区接入涉及相关信令流程
qaIfIj.png

2、接入问题处理
2.1 版本排查
排查NR、LTE、TUE(CPE)、U2020、核心网使用版本与推荐版本策略版本一致。
2.2 操作日志&告警故障
基站的操作,告警和故障日志可以在U2020和一键式日志内获取,使用FMA可以直接打开,对于操作日志主要排查是否存在影响接入的操作,主要判断问题时间点与操作时间点是否存在相关性;对于告警及故障主要查看问题时间点,是否存在相关未恢复的告警,如小区不可用、X2接口故障等。
2.3 参数核查
  • NSA DC相关配置,包括NR外部小区、频点,邻区关系是否正确,DC开关是否打开。
  • X2链路配置是否正确、X2链路数量是否满规格。
  • 同一LTE小区是否存在NR邻区PCI冲突、同一NR站点下是否存在PCI冲突。
  • NSA终端识别开关、PDCP参数组核查等。

2.4 射频通道(发功&上行干扰)排查
上行干扰会影响SRS和PUSCH解调性能,严重影响吞吐率性能。正常情况下底噪在-116dbm左右,干扰跟踪位于M2000 Tracing Monitor->NR->Cell Performance Monitoring.
YJfQvm.png

3、接入问题处理思路
NR接入问题涉及4G、5G以及45G接口问题,可见如下思维导图:
auy2ai.png

3.1 用户无法接入LTE(锚点)
问题现象:
用户在LTE接入失败有以下两种场景:
1. 用户在LTE不发起接入,从L3 Message窗口看到没有任何UE接入的消息
2. 用户在LTE发起Attach被核心网拒绝,从L3 Message可以看到接入LTE后收到NAS消息Attach Reject。
ueQBjq.png
定位方法:
用户接入LTE后,要满足以下条件LTE才可以正常下发5G B1测量控制:
UE能力上报中包含R15的UE能力
核心网未禁止该用户的NSA能力
UE的默认承载QCI未占用LTE的专用QCI(QCI 1-5,QCI 65/66)
LTE侧NSA开关、NR邻频点配置正确
LTE小区本身具备NSA能力,部分LTE单板硬件不支持NSA

3.2 UE不上报B1测量报告
NSA用户正常上报B1测量时,会通过RRC_MEAS_RPRT消息中携带5G的measResultCell-r15来告知LTE。用户不上报5G的B1测量结果可能有以下可能原因:
1、B1测量控制中下发的频点错误。
2、5G小区状态异常或者AAU发功异常导致用户无法测量到5G。
3、5G SSB受干扰严重导致用户测量不到5G。

3.3 LTE收到B1事件后没有发起SgNB_ADD
此类问题需要跟踪基站侧UU口和X2信令联合排查,Uu接口找到5G B1测量上报对应的CallId,再到X2接口看是否有该CallId对应的SgNB_Add_Req消息,LTE不发起SgNB Add可能有以下可能原因:
1、LTE邻区配置异常(漏配或PCI冲突)
2、到目标站点的X2链路异常

3.4 SgNB_ADD被5G拒绝
同样的该问题如1.3.3节所述问题现象也需要基站侧跟踪信令方可发现,X2接口看到5G收到SgNB_Add_Req后回复SgNB_Add_Reject。
SgNB_Add_Reject消息中会携带原因值,根据原因值可以初步判断可能的问题原因:
1、Transport resource not available: 5G侧传输故障导致接入拒绝,可能的链路为当前UE所在的LTE基站到5G基站的X2-U链路或者5G到核心网的S1-U链路
2、No radio resource available:5G小区用户数License不足,或者5G其他资源异常(比如无可用的SRS资源等)

3.5 UE未发起空口随机接入
Uu接口看到用户收到携带5G SCG配置的RRC重配置消息后,立刻回复SCG_RAIL_INFO消息给LTE,携带的原因值为scg-reconfigFailure:
导致重配置失败的可能原因有:
1、5G小区搜索失败,这种多半是由于接入的小区并非最强小区或者该区域小区间干扰严重导致。
SCG重配置消息中的参数在UE侧校验失败,这种情况建议终端的工程师共同定位。

3.6 空口接入RAR超时(较为常见)
Uu接口看到用户收到携带5G SCG配置的RRC重配置消息后,隔一段时间(时间间隔与T304配置有关)回复SCG_RAIL_INFO消息给LTE,携带的原因值为ScgAccessFailure或者scg-ChangeFailure;主要排查如下:
1、接入的5G小区并非最强小区或者该区域小区间干扰严重导致
2、Prach参数等配置异常或者物理层原因导致接入失败

3.7 空口接入Msg3失败(较常见)
X2接口看到5G发送SGNB_ADD_REQ_ACK之后一段时间(与Msg3基站侧等待定时器有关,默认是2.1s)发送SGNB_REL_REQUIRED消息,携带的原因值为radio-connection-with-UE-lost:
导致Msg3失败的可能原因有:
1、上行TA值异常或者上行有干扰导致Msg3解调失败。
2、UE或者基站侧参数配置异常导致Msg3失败。
二、移动性问题
NSA架构切换过程涉及gNB和eNB交互,且切换过程涉及LTE小区的切换,和5G小区的变更,因此在做移动性问题排查时需要关注下面几个概念:
1、Pcell:MeNB的主小区,是NSA DC终端驻留的小区。
2、PSCell:SgNB的主小区,是MeNB通过RRC连接信令配置给NSA DC终端在SgNB上的一个主小区,PSCell一旦配置成功即保持激活态。
3、MeNB:主基站(锚点),是NSA DC终端驻留小区所属的LTE基站。
4、SgNB:辅基站(NR),是MeNB通过RRC连接信令配置给NSA DC终端的NR基站。
BFv2uu.png
由于gNB/eNB并不知道UE所处的位置和无线质量情况,需要控制UE上报相关的无线质量信息来判断,UE上报无线质量信息的方式有周期上报和事件上报两种方式,当eNB收到测量或切换的事件上报时,会下发切换命令给UE,UE收到切换命令后,中断与源小区的交互,按切换命令要求切换到新的目标小区,并通过信令交互通知目标小区,以完成整个切换过程。
涉及指标:SCG修改成功率(4G侧发起+5G侧发起)、SCG变更成功率(changge)、锚点切换成功率(NR终端带SN切换成功率)
对应counter计算及打点:
1、NSA PCell用户SCG变更成功率:L.NsaDc.SCG.Change.Succ / L.NsaDc.SCG.Change.Att*100%
A点所示,当eNodeB收到gNodeB发送的SgNB Change Required 消息时,L.NsaDc.SCG.Change.Att累加。B点所示,当eNodeB向gNodeB发送SgNB Change Confirm 消息时,L.NsaDc.SCG.Change.Succ累加
aAvm2a.png
2、NSA PCell用户SCG修改成功率(4G发起):L.NsaDc.SCG.Mod.Req.Succ / L.NsaDc.SCG.Mod.Req.Att*100%
如图下中A点和图2中B点所示,当eNodeB向gNodeB发送SgNB Modification Request消息时,则L.NsaDc.SCG.Mod.Req.Att累加;如下图中B点所示,当eNodeB向gNodeB发送SgNB Reconfiguration Complete消息时, L.NsaDc.SCG.Mod.Req.Succ累加;如下图2中C点所示,当eNodeB向gNodeB发送SgNB Modification Confirm消息时,L.NsaDc.SCG.Mod.Req.Succ累加。
ayuimi.png
YrUFFf.png
3、NSA PCell用户SCG修改成功率(5G发起):L.NsaDc.SCG.Mod.Required.Succ / L.NsaDc.SCG.Mod.Required.Att
A点所示,当eNodeB收到gNodeB发送的SgNB Modification Required消息时,则L.NsaDc.SCG.Mod.Required.Att累加。如图中B点所示,当eNodeB向gNodeB发送SgNB Modification Confirm消息时,L.NsaDc.SCG.Mod.Required.Succ累加。
YNF3Ej.png
4、SgNB Pscell更换成功率(站内+站间):当前未采用该指标,SCG更换成功率使用4G侧统计的SCG变更成功率
站内:
N.NsaDc.IntraSgNB.PSCell.Change.Succ/N.NsaDc.IntraSgNB.PSCell.Change.Att*100
yyaaQr.png
站间:
N.NsaDc.InterSgNB.PSCell.Change.Succ/N.NsaDc.InterSgNB.PSCell.Change.Att*100%
77nmYz.png
5、锚点切换成功率:L.NsaDc.HHO.ExecSuccOut/L.NsaDc.HHO.PrepAttOut*100%
涉及站内、X2和S1三个部分对应指标counter求和做分子分母
站内:
6jiyei.png
站间:X2
FFFJVb.png
站间:S1
iaIzMf.png

三、NSA组网下的切换流程
1、NSA组网下的切换流程
1.1 NR站内切换
5G空口覆盖或干扰较差导致的MSG2没有响应,导致的接入失败。如以下案例:
Ena6Fr.png
1、UE把测量报告发给源eNB:在UU接口体现为RRC MEASUREMENT REPORT信令,源eNB收到测量报告后,进行相关条件判断,如果决定切换,网络侧将准备的相关切换资源(这个过程对UE侧不可见)
2、eNB 将测量报告发给gNB:在X2接口体现为RRC Transfer信令
2、源gNB收到测量报告后,进行相关条件判断,如果决定切换,网络侧将准备的相关切换资源(这个过程对UE侧不可见)
3、gNB准备切换相关资源发给eNB,X2口体现为SgNB Modification Required信令
4、源eNB下发切换命令:在UU接口体现为RRC CONNECT RECONFIG信令,包括NR RRC配置消息(NR切换命令)。
5、UE接收到RRC重配置消息后完成重配置,并向MeNB反馈RRCConnectionReconfigurationComplete 消息,包括NR RRC响应消息。若UE未能完成包括在RRCConnectionReconfiguration 消息中的配置,则启动重配置失败流程。
5、UE成功完成重配后,MeNB向SgNB发送SgNB Modification Confirm 消息
6、UE收到切换命令后,中断与源gNB(小区)的交互,并尝试接入目标gNB(小区),这个过程称为随机接入过程。

1.2 NR站间切换
iyQRvi.png
1、UE把测量报告发给源eNB:在UU接口体现为RRC MEASUREMENT REPORT信令
2、eNB 将测量报告发给gNB:在X2接口体现为RRC Transfer信令
2、源eNB收到测量报告后,进行相关条件判断,如果决定切换,网络侧将准备的相关切换资源(这个过程对UE侧不可见)
3、源gNB判断是站间切换,SgNB收到MR后进行切换目标小区选择、准入和资源准备后如果允许切换,会给LTE发送SgNB Change Required消息,包含目标SgNB ID信息,SCG配置信息(支持增量配置)和目标SN的测量结果。
4、MN通过SgNB添加流程请求目标SN为UE分配资源,包括与从源SN接收到的目标SN相关的测量结果。如果需要转发,则目标SN向MN提供转发地址。
5、MN触发UE应用新的配置:MN向UE发送重配置消息RRCConnectionReconfiguration,包含目标SN生成的RRC配置信息。UE跟新配置后向MN回复消息RRCConnectionReconfigurationComplete,包括对目标SN的RRC响应消息。若UE未能完成包括在RRCConnectionReconfiguration 消息中的配置,则启动重配置失败流程。
5、如果目标SN资源的分配成功,则MN释放源SN资源。如果需要数据转发,则MN向源SN提供数据转发地址。源SN接收到SgNB Change Confirm消息后停止向UE发送数据,并向目标SN开始转发数据。
6、如果UE回复重配置完成,则MN通过SgNB Reconfiguration Complete消息通知目的SN UE重配完成,包括NR RRC响应消息。
7、UE在目的SN随机接入。
8、数据转发开始。数据转发最早可以在SN收到SgNB Change Confirm消息的时候。
9、MN发起承载修改流程。源SN在收到UE Context Release消息后可以释放空口资源及控制面相关资源,数据转发不受影响。

1.3 LTE(锚点)切换(站内&站间)
NSA场景下的4G小区的切换完全遵循4G only的处理。NSA下的4G小区站内切换前,下发切换命令前需要先进行SgNB Mod流程。
NSA下的4G小区的站间切换,4G目标站会先请求添加gNB,然后回复Ho Req ACK给4G源站。
qArumu.png

2、切换问题排查规定动作2.1操作、故障和告警排查
基站的操作,告警和故障日志可以在U2020和一键式日志内获取查看。
2.2 参数核查
按照统一下发的NR性能小区基线参数进行基础参数配置核查站点基线参数是否正常。
2.3 干扰排查
上行干扰会影响PRACH和PUSCH解调性能,从而影响切换。建议排查一下上行干扰情况,干扰跟踪位于U2020 Tracing Monitor->NR->Cell Performance Monitoring:
2.4 核心网异常排查
与核心网侧确认,排查问题时间点附近核心网侧是否有操作。
当切换小区处于核心网辖区边界场景,站间切换准备失败问题场景,站间切换执行成功率比站内切换执行成功率差时要重点关注。(站内切换不涉及核心网,只有站间切换涉及到核心网)
分析方法:
1、站间切换准备存在FailOut.AMF原因的失败。
2、Ng切换场景,如果切换入准备请求话统小于切换出准备请求话统,或者切换出准备失败大于切换入准备失败,很可能是核心网没有转发切换准备相关消息或者回复失败。
3、X2和Xn切换存在PATH SWITCH流程失败。
以上三种场景都怀疑核心网存在问题,然后通过跟踪TOP站点标口信令进一步明确问题的具体场景(例如核心网没有回复目标站PATH_SWICHT_ACK或者回复PATH_SWICHT_FAIL)。

3、切换问题定位思路
NSA切换信令流程,包括NR站内,NR站间,LTE切换,整理切换过程中出现在UU口,X2口,S1口的异常流程定位思路。
UnEFby.png
3.1 UU口信令异常原因分析与优化3.1.1测量控制丢失
一般在UE接入并添加NR辅小区后,或者NR辅小区切换后会下发测量控制。NR的测量控制信源结构与LTE类似,分为测量对象、上报配置以及测量ID配置。NR测量控制通过LTE空口的重配置消息带给UE,基本机制与LTE相同。
1)邻区问题:未配置任何5G邻区
//查询NR外部邻区(NR站内切换时不需要查询),确认有没有配置。
LST NREXTERNALNCELL:
//查询NR邻区关系,确认有没有配置。
LST NRCELLRELATION:
2)外部小区配置SSB频点错误:
可通过:MO NREXTERNALNCELL进行查询修正,查看是否与规划数据一致。
3)信道受限:
下行DCI资源分配失败,基站无法调度给UE下发测量控制消息。
PDSCH信道拥塞,基站无法及时发送测量控制消息。
4)信道质量:
根据SSB RSRP/SINR判断下行信号质量差(比如SSB SINR在0dB以下),可能导致UE无法接收到测量控制消息。

3.1.2测量报告丢失
每个NR的MR有两条,一条显示Direction为Ms->gNodeB,一条显示Direction为Ms->eNodeB。NSA场景下UE不会直接与gNodeB进行RRC连接,第一条MR(Direction为Ms->gNodeB)实际是工具自己解析的结果,实际表示的是UE内部的消息传递(5G UE将MR发送给4G UE),第二条MR(Direction为Ms->eNodeB)才是LTE空口实际发送的MR,可以跟网络侧进行比对。出现测量报告丢失的问题一般如下:
1)信道受限:
下行DCI资源分配失败,基站无法调度给UE下发测量控制消息。
PDSCH信道拥塞,基站无法及时发送测量控制消息。
2)覆盖较差:
服务小区和邻区的信号RSRP差值
排查NRCELLRELATION,小区偏移量,Ocn
排查GNBMEASCOMMPARAMGRP,RSRP偏置和幅度迟滞,RsrpOffset和Hys
根据A3事件计算是否满足门限
3)终端异常:
如果终端侧log查看到有测量到服务小区和邻区信号已经满足切换门限,但是未上报MR,则怀疑终端侧可能存在内部异常。需要联系终端侧排查。

3.1.3切换命令RRC Conn Recfg消息丢失
当基站侧判决满足切换条件后会下发切换命令,通过LTE空口发给UE,空口就是一条RRC重配消息。
1)信道受限,包括PDCCH/PDSCH
2)覆盖较差
3)eNB或gNB切换判决失败,或内部异常
此类问题一般为外部配置错误导致,当外部小区NREXTERNALNCELL中PhysicalCellId配置错误,导致测量报告上报后源侧找不到外部邻区,不会发起切换。

3.1.4切换完成RRC Conn Recfg Cmp消息丢失
此类问题除了PDCCH/PUSCH信道受限及覆盖质差以外因素,还可能为终端未响应发送重配完成消息。

3.1.5 gNB随机接入失败
该部分问题排查思路可参考章节(一)小区接入性能问题。

3.2 X2口或Xn口信令异常原因分析3.2.1 锚点基站内部异常
通过MML命令或告警查询,查看锚点自身站点是否存在告警异常。

3.2.2 X2口传输异常
可以通过告警和故障日志判断,也可以查看话统L.X2.Unavail.Dur.Sys(系统原因导致的X2链路不可用时长,指标ID=1526728766)是否存在异常。通过网管查询锚点与目标GNB站点之间的X2配置是否正常。

3.3  S1口或Ng口信令异常原因分析3.3.1 SgNB切换判决失败(漏配邻区或PCI冲突)
//查询NR外部邻区,确认有没有到目标小区的gNBId,CellId和PCI。
LST NREXTERNALNCELL:;
//查询NR邻区关系,确认有没有到目标小区的gNBId和CellId。
LST NRCELLRELATION:;
如果查询到SgNB配置的NR外部邻区中存在相同PCI,则需要找网规人员确认是否规划或开站脚本配置错误。

3.3.2 Ng口传输异常&SgNB内部异常
可以通过告警和故障日志判断是否存在异常。


四、保持性
当前5G组网方式下5G掉线触发机制有两种,终端触发与基站触发。终端侧掉话有两类,第一类是直接收到网络侧释放5G的命令(RRCConnectionReconfiguration里nr-Config-r15下面携带release)。第二类是终端先上报SCGFailureInformationNR,然后再收到基站下发的释放指示。这种场景是UE检侧到某种异常后主动申请释放。SCGFailureInformationNR消息里会携带原因值,例如下面示例表示上行RLC达到最大重传次数:
fuANfy.png
网络侧触发可能是5G侧发起释放(5G在X2口给4G发SGNB_REL_REQUIRED),也可能是4G发起释放(4G在X2口给5G发SGNB_REL_REQ)。
1、排查思路
1.1 告警与操作排查
告警排查:
排查掉线时间前后是否存在如下告警。需要注意,因为告警有平滑机制,告警出现时间可能在掉话时间点之后。
1.2 参数核查
参数排查:常见影响掉话,实际操作时参考进行全面检查。1.3 高误码排查
如果掉话是5G基站发起释放,且携带原因是UE LOST;或是由于UE上报SCGFailure,携带原因值是rlc-MaxNumRetx或randomAccessProblem。
排查方法:
需要排查空口信号质量和干扰;如果误码不高,则需要通过CHR或cellDT进一步分析是否RLC层的窗口滑动有问题,或者是上层信令解码失败,或者完整性校验失败。
1.4 覆盖和干扰排查
1、如果是RSRP较差,确认测试点和天线距离,是否有遮挡等。尝试更换到更好的点位确认是否仍然有掉话。
2、如果发现干扰较大,排查是否存在邻区信号强于服务小区而没有切换的情况。如果邻区信号不满足切换条件,但是强度和服务小区相当,则排查邻区是否做了模拟加载。如果条件允许,尝试关闭周边小区观察干扰是否改善。
3、如果排查干扰来自外部,则启动FFT扫频,观察干扰特征,进行排查处理。
4、如果排除了弱覆盖和干扰,并且掉话是在特定位置点,很可能是该位置点无线环境存在超CP导致符号间干扰等情况,从而导致信令和数据解调失败。可以尝试修改波束模式或数字下倾观察是否可以改善。
1.5 内部释放原因排查
5G侧发起的释放,或终端上报SCGFailure导致的释放:
通过呼叫日志分析,明确是空口问题,资源分配问题,还是其它产品内部异常(该内容需要求助厂家使用特定工具解析)。

2、掉线问题排查思路
aY3Mr2.png

五、 小区数传性能问题
网管面上的感知速率影响因素同DT测试问题排查思路基本一致,在网管进行用户感知提升或提升体验速率时需要核查和关注调度类参数问题。
1 数传E2E影响因素示意图
理解5G数传“E2E”影响因素是数传问题定位的基础,以下流程示意不同因素是如何影响“5G上下行速率计算”中的各变量的(Grant、RB、MCS、Rank、BLER)。
aMVRF3.png
其中因素1)2)3)6)7)9)10)11)12)影响Grant和RB,4)5)6)7)8)影响MCS、BLER、Rank
2、下行速率优化思路
除去关注的覆盖,干扰因素,本周主要讲从网管后台发现和优化,吞吐速率指标,DT部分还请查阅DT测试分析指导书。
2.1 传输带宽排查
可通过MML脚本在U2000上进行站点带宽查询:需要确保NR站点传输接入环为10GE传输环。
RJvE7v.png
2.2 DL Grant不足分析
除去多用户影响,5G站点的参数配置同样会导致DL调度不足,需要重点核查如下参数设置,确保参数场景化最优设置。
qQbm6z.png
2.3 下行MCS和BLER
按以下参数列表排查当前参数设置,确保参数场景化最优设置。
2AnYZr.png
2.4 下行Rank低分析
按以下参数列表排查当前参数设置,确保参数场景化最优设置
iuimEf.png

3 上行速率优化思路
由于上行由预调度功能,会导致“假上行满调度”,为了识别真实的上行调度次数,建议暂时关闭上行预调度( NRDUCellRsvdOptParam Param1WithParamId73-0 ),峰值情况下,上行调度次数应该为400次。
3.1 UL Grant不足分析
对一下参数进行重点排查,排除参数影响。
z2uIJ3.png
3.2 PUSCH RB不足分析
峰值情况下,对于TUE来说,100M带宽上行RB最大极限值为269个,80M带宽为213个。
要满足上行RB数最优,受限排查如下参数是否符合推荐配置。
ZZzYnm.png
3.3 上行MCS和IBLER分析
影响上行MCS的参数如下,建议先排查参数是否最优设置。
EZBZRn.png
其次关注上行干扰情况,通过上行干扰跟踪定位排查:
QJNfUb.png
3.4 上行Rank分析
影响上行rank的参数如下,建议先排查参数是否最优设置。
bmM77n.jpeg
SRS功率过高,会导致AAU接收饱和,反而导致SRS SINR下降,核查切换参数设置门限,观察用户分布情况,近点用户不宜过多。

您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

返回顶部