故障现象
某运营商VIP用户反馈在通话2分钟后,有掉话的现象发生。
故障分析
1.分析业务流程:UE发起CMNET的会话释放,如下图所示。
2.CMNET的会话释放流程,收到PFCP_SESSION_DELETION_RES后,会给OCS发送释放消息,如下图所示。
3.IMS会话的retrieve流程处理完成,准备5G切4G。
4.CMNET会话的retrieve流程与CMNET会话的释放流程冲突,返回了504,如下图所示。
5.CMNET会话的释放流程处理结束,如下图所示。
6.IMS会话5G切4G完成后,2分钟后被释放,如下图所示。
7.梳理信令流程,如下图所示。
a.SMF在用户通话2分钟时释放会话,是因为SMF的定时器误删IMS会话导致。
b.SMF的定时器误删IMS会话是由于CMNET会话的释放流程与IMS会话的切换处于冲突中,SMF维护用户上下文状态错误,导致定时器误判断此时用户仍在5G。
c.CMNET会话的释放流程与IMS会话的切换处于冲突,是因为OCS响应慢导致。
8.根据对信令流程的梳理,该问题出现的概率很低,小于万分之0.5。
问题概率 = 2分钟定时器超时删除4G会话次数 ÷ EPSFALLBACK流程的次数
分2个场景:
a.正常场景:4G切5G后,定时器删4G会话。
b.异常场景:5G切4G后,定时器误删4G会话。
9.该现象必须要满足下面5个条件才会发生。
a.用户的2个会话必须在同一个SMF。
b.CMNET数据会话在语音呼叫前,在5G侧发起释放。
c.CMNET数据会话释放流程中OCS响应比较慢,CMNET数据会话释放流程未结束。
d.CMNET数据会话释放结束前,用户IMS会话5G切4G完成。
e.用户通话时长超过2分钟。
10.SMF启动2分钟定时器是根据协议针对异常的保护。在5G切4G时,未收到AMF释放5G会话;或者4G切5G时,未收到MME释放4G会话,SMF通过启动定时器删除资源。
11.SMF释放会话时间短,正常释放会话的流程只用了20毫秒,如下图所示。
故障处理
1.综上分析:用户的CMNET数据会话在5G侧发起释放,由于OCS响应慢,所以释放流程未结束。同时用户又发起了IMS语音呼叫。在IMS语音会话切换到4G后,SMF会启动定时器以保证用户协议一致。由于CMNET会话的释放流程与IMS会话的切换处于冲突中,SMF维护用户上下文状态错误,导致定时器误判断此时用户仍在5G,2分钟后删除了IMS语音会话。
2.在后续版本中解决该问题。
审核编辑:汤梓红
全部0条评论
快来发表一下你的评论吧 !