EVS技术,全称为Enhanced Voice Services,是一种增强型的语音服务技术。随着LTE技术的发展,各大运营商都在积极部署和升级已有的基站,来完善LTE网络,从而为用户提供更优质的服务,满足用户对通信业务的需求。在这些技术中,VoLTE(Voice over LTE)利用LTE网络高带宽、低时延的特点,可以实现高品质语音及视频通话,受到广泛关注。
这种高品质的通话是如何实现的呢?实验数据表明,人类讲话的频率范围是50Hz到12,000Hz,而人耳的听力范围为20Hz到20,000Hz。在2G网络时代,传统的通话技术AMR传输的音频范围较窄,约为300Hz到3,400Hz,一般在12.65kbps的比特率下运行,因此语音传输的质量有限,高频部分在传输过程中被压缩。在LTE网络中,VoLTE采用了AMR-WB编码,将通话的频率范围扩大到50Hz-7,000Hz,可以使用23.85kbps的比特率,扩展出的频率范围使得在通话中传输的语音质量得到了很大的改善。在2012年8月,首个VoLTE网络开始部署,至今已经有多个国家的运营商部署了VoLTE网络。
而随着新技术的发展,人们希望能够实现完全真实的通话传输,EVS技术应运而生。与传统的AMR-WB相比,其采样速率和编码的比特率有所不同,编码器可以在全带宽(FB)、超宽带(SWB)、宽带(WB)和窄带(NB)分别以48kHz、32kHz、16kHz、8kHz的频率进行采样。而解码器也分别以相应的速率进行解码。对于信号带宽低于输入采样频率的一半的情况,信号被抽取到(8,16,32 kHz)组中最可能的情况进行采样,该采样率大于信号带宽的两倍。编码的比特流的速率可在5.9/7.2/8.0/9.6/13.2/16.4/24.4/32.0/48.0/96.0/ 128.0kbit/s这些速率中灵活选择(对应方式如表1)。
同时还提供了与AMR-WB的互操作模式,共有9种速率:6.6/8.85/12.65/14.25/15.85/18.25/19.85 /23.05/23.85 kbit/s。
表1 编码比特速率与信号带宽是否支持的对应表格
在这样的采样速率下,时延变得十分重要。编解码器的时延主要由输出信号的采样速率决定。输入信号使用20ms帧进行处理,对于宽带、超宽带和全带宽的输出,整体算法延迟为32ms。它由一个20ms的帧,编码器侧的输入重采样滤波器延迟0.9375 ms,编码器预读为8.75 ms,解码器侧的时域带宽扩展为2.3125 ms。对于窄带解码器的输出,使用复杂的低延迟滤波器组,解码器延迟减少到重采样所需的1.25 ms,导致总算法延迟为30.9375 ms。
EVS编码器概述
EVS编解码器采用混合编码方案,它结合了基于ACELP(代数码激励线性预处理)的线性预处理(LP)编码技术,对于主要的语音信号,会采用变换编码的方式,而对于其他通用内容以及无效信号,使用VAD / DTX / CNG(语音活动检测/不连续传输/柔和噪音生成)等技术进行操作。 EVS编解码器能够在这些不同的编码模式之间进行切换,而不会产生人工影响。EVS编解支持基于ACELP编码规范的5.9kbps窄带和宽带可变比特率(VBR)操作,还提供了用于AMR-WB可互操作的编码和解码。除了感知优化的波形匹配之外,编解码器还为某些频率范围的设立了参数表示。这些参数的表达构成了编码带宽扩展或噪声填充策略。
图(1)编码器的简易模块图
输入信号和信号带宽命令行参数一起输入到信号重采样模块,用于校正两者之间的不匹配。处理过的信号进入到信号分析模块,在这里系统会决定采用何种编码策略。这三种策略分别是基于ACELP的线性预处理策略,频域编码策略,非活动信号编码(无效信号编码及柔和噪音生成)策略。在一些操作模式中,信号分析步骤包括一个闭环决定,以确定哪个编码方法导致的失真程度最低。在每个编码块中,进一步细化信号分析以获得与特定编码块相关的参数。对于每个20ms帧,编码模式的信号分析和子序列决定是独立执行的,并且在每一帧的基础上可以进行不同模式之间的切换。在切换实例中,在编码模式之间交换参数以确保切换尽可能无缝,并且在这种情况下有时采用闭环方法。此外,在帧的边界上的信号可以在不同带宽或比特率之间进行切换。信号分析和其他所有模块可以得到命令行参数,如比特率,采样率,信号带宽,DTX是否激活等。
基于线性预测的操作,输入信号被分为高频带和低频带路径。两者之间的截止频率由编解码器的操作模式(带宽和比特率)确定。每20ms帧执行线性预测系数估计。在一个帧内,根据比特率建立几个内插点,并将最佳内插发送到解码器。使用不同的量化方案进一步分析和量化线性预测残差,这取决于残差的性质。对于5.9kbps VBR操作,采用符合设计约束的附加低速率编码模式。信号的高频部分用几个不同的参数表示来表示。用于该表示的参数作为比特率和剩余量化策略的函数而变化。传输的参数包括一些或全部频谱包络,能量信息和时间演进信息。可以配置基于LP的内核,使得线性预测系数和残余量化都可以与AMR-WB解码器互操作。为此,LP系数估计,参数HF表示和残余量化的配置与AMR-WB的配置相似。对于AMR-WB可互操作的操作模式,则使用与AMR-WB量化器相同的码本。
执行频域编码时,可以将编码块设想为分为控制层和信号处理层。控制层执行信号分析以获得信号处理层的几个控制和配置参数。时频变换基于修正离散余弦变换(MDCT),并提供自适应时频分辨率。控制层导出帧中信号能量的时间分布的度量,并控制变换。根据比特率信号类型和操作模式,使用各种直接和参数表示量化MDCT系数。
对于非活跃信号的编码。当编解码器在不连续传输(DTX)模式下操作时,信号分类器被系统确定为背景噪声组成的帧选择DTX模式。对于这些帧,信号的低速率参数指示不会比每8帧(160ms)更频繁地发送。在解码器中使用低速率参数表示用于舒适噪声生成(CNG),并且包括描述背景信号的频率包络的参数,描述总能量的能量参数及其时间演化。
EVS解码器概述
解码器接收所有量化参数并产生合成信号。因此,对于大多数EVS编码器所进行的操作,它是一个由量化值到索引的逆操作。而对于AMR-WB互操作的解码,使用AMR-WB码本执行索引查找,并且解码器会被配置为从AMR-WB比特流生成改进的合成信号。
对于带宽扩展和噪声填充区域,除了解码的参数数据之外还使用来自编码区域的估计,以产生这些频率区域的信号。EVS编解码器包括帧丢失隐藏算法。对于所有编码模式,外推算法就是估计丢失帧中的信号。对于基于LP操作的解码,其主要操作是对最后接收的残差和LP系数进行评估。对于频域解码的主要操作,是在某些情况下,把最后接收的MDCT系数外推,并且另外产生的时域信号。这种时频信号是从最后接收到的有效帧到丢失帧的平滑演进时间来确保。通过这两种方式,一旦帧丢的失被恢复,即接收到第一个有效帧,则编解码器存储器被更新,并且把有效帧到丢失帧的边界的不匹配降到最低。而对于持续丢帧的情况,信号会被归为背景噪声或将能量减小,而当不能执行这些合理的外推操作时将最终被静音。
EVS编解码器还包括“信道感知”模式,其可以用于在VoIP系统中的分组丢失状况下改善性能。在信道识别模式中,当前语音帧的部分副本(辅助帧)在未来的语音帧(主帧)上搭载,而不会增加主帧和辅助帧的总比特率。如果当前帧丢失,则可以通过轮询去抖动缓冲区来检索其部分副本,以实现更快且更好地从丢包恢复。
测试需求
通过前文对于EVS使用的各项技术的简单介绍,为了从多方面考察EVS终端的能力,需要从以下的几个方面对终端进行测试。与使用AMR-WB的VoLTE高清语音相似,我们需要对终端的编解码、切换以及一些特定场景下的音质进行评估。
基本通话功能测试
EVS编码不同速率测试
EVS与AMR-WB互操作性测试
网络损伤测试
EVS语音与数据业务并存测试
EVS不同速率切换测试
衰落(Fading)测试
对于通过这些测试的终端,在各个场景下的通话音质将得到保障。用户使用语音通话时,会感受到通话音质的提升。对于终端厂商来说,具备EVS通话能力将成为终端的一个新的卖点,增强产品在市场上的竞争力。对于运营商来说,EVS技术将会使用户更愿意使用语音通话,提升服务方案的竞争力。
罗德与施瓦茨(R&S)公司的EVS测试方案
为了满足前文提到的所有测试需求,罗德与施瓦茨公司在现有的CMW500综合测试仪上,推出了KS104选件。它将在已有的VoLTE MOS评价方案之上添加EVS编解码器,来支持EVS通话功能。测试人员可以在CMW500上通过LTE Signaling界面按照需要的网络参数和射频信号建立LTE小区,使被测终端进行LTE网络附着。而在CMW500的Data Application Unit数据应用单元,测试人员可以对IMS网络的参数进行设置,从而完成VoLTE通话的发起与建立。在图(2)中,可以看到激活了KS104选件之后,EVS的编解码模式可以被选择,可以建立EVS编码的通话。
图(2) DAU中EVS编码的相关设置选项
图(3) 罗德与施瓦茨EVS测试方案图 CMW500和UPV
CMW500和被测终端分别通过线缆将上下行的音频信号送到UPV音频分析仪中进行评估。在人工测试中,我们UPV上看到测试结果。而由于EVS测试涉及的编码比特率、互操作性及切换场景众多,人工测试的测试量极大,测试人员可以通过CMWRun测试软件对测试项目进行自动化测试,整个方案如图(3)所示。罗德与施瓦茨公司的EVS测试方案,将对被测终端提供全面有效的测试,保证终端在市场上的竞争力。
全部0条评论
快来发表一下你的评论吧 !