一种语音信号差错掩盖方法-品牌商务网

专利名称：一种语音信号差错掩盖方法
技术领域：
本发明涉及一种数字通信领域的方法，尤其涉及一种音频信号差错掩盖的方法。
背景技术：
基于IP的语音通信业务量几年来一直呈上升趋势，同时，传统公共电话网正在逐步向以IP技术为核心的下一代网络演进。然而，基于IP的压缩语音数据包在网络中传输时，会不可避免地由于网络拥塞或传输信道误码等引起丢包，特别是在无线网络中传输时丢包问题更加严重。为了减小丢包对接收端语音质量的影响，已有许多差错控制技术用来对抗丢包的影响，其中，差错掩盖技术便是在接收端中广泛采用的一种改善语音主观听觉效果的方法。从已有的研究成果来看，语音信号差错掩盖技术主要包括基于插入的方法、基于再生的方法和基于内插的方法三大类。基于插入的方法是通过插入填充包来实现差错掩盖，而填充包通常是非常简单的静默或噪音替代以及前面收到的包的简单重复。这类方法容易实现，但是掩盖性能较差。基于再生的方法利用语音编码算法的相关知识估计出丢包部分语音的解码参数，进而通过解码或合成恢复丢失的语音信号。这类方法依赖于语音编码算法，不同的语音编码器要采用对应的掩盖方法，通常这类掩盖方法的复杂度也比较高。基于内插的方法是利用某种形式的模式匹配和内插来得到和丢包语音信号相似的可替换包，这类算法比基于插入的方法复杂，但可以获得较好的恢复效果，同时方法的通用性比基于再生的方法好。经过对现有技术的文献检索发现，David J. Goodman等人在1986年《IEEE声学、语音与ilf号处理期干 Ι》(IEEE Transactions on acoustics, speech and signal processing) 第 34 卷 1440 页到 1448 页发表的 “Waveform Substitution Techniques for Recovering Missing Speech Segments in Packet Voice Communications，，(分组语音通信中恢复丢失语音段的波形替代技术)一文中提出的基于模式匹配的波形替代方法和基于音高检测的波形替代方法，是两种较好的基于内插的语音信号差错掩盖方法。基于模式匹配的波形替代方法将丢失语音包(含L个采样的语音段)前面的语音信号中紧邻丢包语音段的部分语音(含M个采样的语音子段，M <L，通常M取L的二分之一)看作“模板”(template)，然后在丢包语音段更前面或后面的语音信号中搜索和该模板最匹配的语音子段，找到后将含有该语音子段的L个采样的语音段作为丢失语音包的替代，从而实现丢包语音信号的差错掩盖。基于音高检测的波形替代方法同基于模式匹配的波形替代方法类似，只是采用音高检测代替模版匹配在丢包语音段前面或后面的语音信号中搜索能够替代丢包语音段的波形信号。上述基于波形替代的方法是利用丢包语音段的前面或后面语音信号中具有和丢包语音段相似的波形这一特征，因此当语音信号波形不具有重复性时这种方法就得不到理想的掩盖结果。

发明内容
本发明的目的是针对现有技术的不足，提供一种用于语音信号差错掩盖的方法，使接收端能够恢复出高质量的掩盖语音信号。本发明是通过以下技术方案实现的一种语音信号的差错掩盖方法，其特征在于，包括以下步骤第一步根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数，并
设该丢失部分的语音采样点数为L ；设丢失帧的帧序号为队且^^ > 2，语音信号的采样率为 fs；第二步选取丢包语音前面接收到的已解码语音信号采样点L个，并设该语音信号为X(t)；同时，选取丢包语音后面接收到的已解码语音信号采样点L个，并设该语音信号为 y (s)；第三步采用多项式拟合x(t)；第四步采用多项式拟合y (S)；第五步利用X(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式ζ Cr)；第六步利用丢包部分语音信号的多项式表达式ζ (r)，计算出丢包部分语音信号的预测值；第七步根据上述步骤获得的预测值，对丢包部分语音值进行替代。所述第二步采用的多项式拟合x(t)，设该多项式为X (t)，具体如下X(t) = ao+Bit+a^2+. · · +an_!tn_1+antn其中，a0, ai; ... , an为多项式的系数，η为多项式的阶数，t = (N-2) · L/fs, ((N-2) · L+l)/fs, . . .，((N-I) · L-l)/fs。所述第三步采用的多项式拟合y (s)，设该多项式为Y (s)，具体如下Y(s) = bo+biS+b^2+. · · +b^s^+bps1'其中，Iv b1; . . .，bp为多项式的系数，ρ为多项式的阶数，S = N- L/fs，(N · L+1)/ fs，· · ·，((N+1) · L-l)/fs。所述利用χ (t)和y (s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式ζ (r)，具体如下c.若η彡ρ，则将y(s)的拟合多项式Y (s)扩展为η阶，那么Y(s) = b0+bis+b2s2+. · · +bp_isp_1+bpsp+bp+1sp+1+. · · +bnsn其中，bp+1，...，bn均为 0生成丢包部分语音信号的多项式表达式ζ (r)，则ζ (r) = co+qr+c,2+· . . +Clri产WclrTn其中，C0 = a0-b0, C1 = afb” . . . , cn = an_bn,且有，r = (N-I) · L/fs, ((N-I) · L+l)/fs, · · ·，(N · L_l)/fs ；d.若η < p，则将x(t)的拟合多项式X (t)扩展为ρ阶，那么X(t) = ao+Bit+a^2+. . . +Bn^1 tn_1+antn+an+1 tn+1+. . . +aptp其中，an+1，·· ·，ap 均为 0生成丢包部分语音信号的多项式表达式ζ (r)，则
ζ (r) = Co+Cir+C^2+. . . +Cp^r^^Cpr15其中，C0 = a0-b0, C1 = afb” ...,Cp = ap_bp,且有，r = (N-I) · L/fs, ((N-I) · L+l)/fs, · · ·，(N · L_l)/fs。本发明的有益效果本发明与现有技术，如基于模式匹配的波形替代方法和前帧替代方法相比，信号的信噪比(SNR)平均要提高IdB以上，且具有更好的主观听觉效果。

图1为本发明方法对比基于模式匹配的波形替代方法和前帧替代方法的实验结^ ο
具体实施例方式下面对本发明的实施例作详细说明本实施例在以本发明技术方案为前提下进行，给出了详细的实施方式和过程，但本发明的保护范围不限于下述的实施例。设解码端对音频流解码后定位到丢失帧的位置，设丢失帧的帧序号为N(N > 2)，已经将丢失帧前面的第N-I帧和丢失帧后面的第N+1帧正确解码，丢失帧的采样点数为 160，语音的采样率fs为8000Hz。本发明实施例的具体实施步骤为(1)选取丢包语音前面第N-I帧已正确解码的语音信号采样点L个，并设该语音信号为X(t)；同时，选取丢包语音后面第N+1帧已正确解码的语音信号采样点L个，并设该语音信号为y (S)；(2)采用多项式拟合χ (t)，设此多项式为X (t)，X(t) = ao+Bit+a^2+. · · +an_!tn_1+antn其中，a0, ai; ... , an为多项式的系数，η为多项式的阶数，t = (N-2) · L/fs, ((N-2) · L+l)/fs, . . .，((N-I) · L-l)/fs。(3)由最小二乘法确定多项式χ (t)的拟合系数，假设各数据点的权值为1，令，
LL2
φ{α0,αι,...,αη) = ^ =J](a。+α/, + …+ α/1=最小
/=0 i=0则有
=+ …+ ("-x(0) = 0’ j=0，l,2，...,n即ΣΜ 十印/+1 +…+ "CO = Σ"雄)
/=0 /=0解此方程组就可以得到多项式系数向量A = a0, B1,..., an。(4)采用多项式拟合y(s)，设此多项式为Y(s)，如公式Y(s) = bo+biS+b^2+. · · +Iv1Sr^kbpSp其中，Iv b1; . . .，bp为多项式的系数，ρ为多项式的阶数，S = N- L/fs，(N · L+1)/ fs，· · ·，((N+1) · L-l)/fs。
5
(5)由最小二乘法确定多项式y(s)的拟合系数，假设各数据点的权值为1，令，
权利要求
一种语音信号的差错掩盖方法，其特征在于，包括以下步骤第一步根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数，并设该丢失部分的语音采样点数为L；设丢失帧的帧序号为N，且N≥2，语音信号的采样率为fs；第二步选取丢包语音前面接收到的已解码语音信号采样点L个，并设该语音信号为x(t)；同时，选取丢包语音后面接收到的已解码语音信号采样点L个，并设该语音信号为y(s)；第三步采用多项式拟合x(t)；第四步采用多项式拟合y(s)；第五步利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r)；第六步利用丢包部分语音信号的多项式表达式z(r)，计算出丢包部分语音信号的预测值；第七步根据上述步骤获得的预测值，对丢包部分语音值进行替代。
2.根据权利要求1所述的一种语音信号的差错掩盖方法，其特征在于所述第二步采用的多项式拟合χ (t)，设该多项式为X (t)，具体如下X(t) = a0+a1t+a2t2+. . . +an—Jn ^anIn其中，aQ，· · ·，an为多项式的系数，η为多项式的阶数，t = (N-2) · L/fs， ((N-2) · L+l)/fs, . . .，((N-I) · L-l)/fs。
3.根据权利要求1所述的一种语音信号的差错掩盖方法，其特征在于，所述第三步采用的多项式拟合y (s)，设该多项式为Y (s)，具体如下Y(s) = b0+bis+b2s2+. · · +bp_lSp_1+bpSp其中，IVb1,...，bp为多项式的系数，ρ为多项式的阶数，s = N .L/f；，(N*L+l)/fs，...， ((N+1) · L-l)/fs。
4.根据权利要求1所述的一种语音信号的差错掩盖方法，其特征是，所述利用x(t)和 y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式ζ (r)，具体如下a.若11> ，则将7(8)的拟合多项式Y(S)扩展为η阶，那么 Y(s) = b0+bis+b2s2+. . . +bp_isp_1+bpsp+bp+1sp+1+. . . +bnsn其中，bp+1，...，bn 均为 0生成丢包部分语音信号的多项式表达式ζ (r)，则z (r) = Cq+c^+^t2+. . . +Cr^rn ^clrTn其中，C0 = a0_b0，C1 = afbp ...,Cn = an_bn，且有，r = (N-I) · L/fs, ((N-I) · L+l)/fs, . . . , (N · L-l)/fs ；b.若11< ，则将1(0的拟合多项式X(t)扩展为ρ阶，那么 X (t) = a0+a1t+a2t2+. . . +a^jt" l+aDtTi+aD+ltTi+l+. . . +aptp其中，an+1, · · ·，ap 均为 0 生成丢包部分语音信号的多项式表达式ζ (r)，则 z (r) =· · +cp—；^—^crrTp其中，C0 = a0_b0，C1 = afbp ...,Cp = ap_bp，且有， r = (N-I) · L/fs，((N-I) · L+l)/fs，. · ·，(N · L-l)/fs。
全文摘要
一种语音信号的差错掩盖方法，涉及一种数字通信领域的方法，尤其涉及一种音频信号差错掩盖的方法。包括以下步骤为根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数，并设该丢失部分的语音采样点数为L；设丢失帧的帧序号为N(N≥2)，语音信号的采样率为fs；选取丢包语音前面接收到的已解码语音信号采样点L个，并设该语音信号为x(t)；同时，选取丢包语音后面接收到的已解码语音信号采样点L个，并设该语音信号为y(s)；采用多项式拟合x(t)；采用多项式拟合y(s)；利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r)；利用丢包部分语音信号的多项式表达式z(r)，计算出丢包部分语音信号的预测值；根据上述步骤获得的预测值，对丢包部分语音值进行替代。
文档编号G10L21/02GK101976567SQ20101052177
公开日2011年2月16日申请日期2010年10月28日优先权日2010年10月28日
发明者肖菲, 赵岩, 陈贺新申请人:吉林大学

本文推荐一种语音信号差错掩盖方法仅代表作者观点，不代表本网站立场。本站对作者上传的所有内容将尽可能审核来源及出处，但对内容不作任何保证或承诺。请读者仅作参考并自行核实其真实性及合法性。如您发现图文视频内容来源标注有误或侵犯了您的权益请告知，本站将及时予以修改或删除。未经允许不得转载：http://www.pinpai35.com/1656418578.html

当前位置：网站首页>专利 >正文

一种语音信号差错掩盖方法

相关推荐