专利名称:一种语音信号差错掩盖方法
技术领域:
本发明涉及一种数字通信领域的方法,尤其涉及一种音频信号差错掩盖的方法。
背景技术:
基于IP的语音通信业务量几年来一直呈上升趋势,同时,传统公共电话网正在逐 步向以IP技术为核心的下一代网络演进。然而,基于IP的压缩语音数据包在网络中传输 时,会不可避免地由于网络拥塞或传输信道误码等引起丢包,特别是在无线网络中传输时 丢包问题更加严重。为了减小丢包对接收端语音质量的影响,已有许多差错控制技术用来 对抗丢包的影响,其中,差错掩盖技术便是在接收端中广泛采用的一种改善语音主观听觉 效果的方法。从已有的研究成果来看,语音信号差错掩盖技术主要包括基于插入的方法、基于 再生的方法和基于内插的方法三大类。基于插入的方法是通过插入填充包来实现差错掩 盖,而填充包通常是非常简单的静默或噪音替代以及前面收到的包的简单重复。这类方法 容易实现,但是掩盖性能较差。基于再生的方法利用语音编码算法的相关知识估计出丢包 部分语音的解码参数,进而通过解码或合成恢复丢失的语音信号。这类方法依赖于语音编 码算法,不同的语音编码器要采用对应的掩盖方法,通常这类掩盖方法的复杂度也比较高。 基于内插的方法是利用某种形式的模式匹配和内插来得到和丢包语音信号相似的可替换 包,这类算法比基于插入的方法复杂,但可以获得较好的恢复效果,同时方法的通用性比基 于再生的方法好。经过对现有技术的文献检索发现,David J. Goodman等人在1986年《IEEE声学、语 音与ilf号处理期干 Ι》(IEEE Transactions on acoustics, speech and signal processing) 第 34 卷 1440 页到 1448 页发表的 “Waveform Substitution Techniques for Recovering Missing Speech Segments in Packet Voice Communications,,(分组语音通信中恢复丢 失语音段的波形替代技术)一文中提出的基于模式匹配的波形替代方法和基于音高检测 的波形替代方法,是两种较好的基于内插的语音信号差错掩盖方法。基于模式匹配的波形 替代方法将丢失语音包(含L个采样的语音段)前面的语音信号中紧邻丢包语音段的部分 语音(含M个采样的语音子段,M <L,通常M取L的二分之一)看作“模板”(template), 然后在丢包语音段更前面或后面的语音信号中搜索和该模板最匹配的语音子段,找到后将 含有该语音子段的L个采样的语音段作为丢失语音包的替代,从而实现丢包语音信号的差 错掩盖。基于音高检测的波形替代方法同基于模式匹配的波形替代方法类似,只是采用音 高检测代替模版匹配在丢包语音段前面或后面的语音信号中搜索能够替代丢包语音段的 波形信号。上述基于波形替代的方法是利用丢包语音段的前面或后面语音信号中具有和丢 包语音段相似的波形这一特征,因此当语音信号波形不具有重复性时这种方法就得不到理 想的掩盖结果。
发明内容
本发明的目的是针对现有技术的不足,提供一种用于语音信号差错掩盖的方法, 使接收端能够恢复出高质量的掩盖语音信号。本发明是通过以下技术方案实现的一种语音信号的差错掩盖方法,其特征在于,包括以下步骤第一步根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数,并
设该丢失部分的语音采样点数为L ;设丢失帧的帧序号为队且^^ > 2,语音信号的采样率为 fs;第二步选取丢包语音前面接收到的已解码语音信号采样点L个,并设该语音信 号为X(t);同时,选取丢包语音后面接收到的已解码语音信号采样点L个,并设该语音信号 为 y (s);第三步采用多项式拟合x(t);第四步采用多项式拟合y (S);第五步利用X(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式 表达式ζ Cr);第六步利用丢包部分语音信号的多项式表达式ζ (r),计算出丢包部分语音信号 的预测值;第七步根据上述步骤获得的预测值,对丢包部分语音值进行替代。所述第二步采用的多项式拟合x(t),设该多项式为X (t),具体如下X(t) = ao+Bit+a^2+. · · +an_!tn_1+antn其中,a0, ai; ... , an为多项式的系数,η为多项式的阶数,t = (N-2) · L/fs, ((N-2) · L+l)/fs, . . .,((N-I) · L-l)/fs。所述第三步采用的多项式拟合y (s),设该多项式为Y (s),具体如下Y(s) = bo+biS+b^2+. · · +b^s^+bps1'其中,Iv b1; . . .,bp为多项式的系数,ρ为多项式的阶数,S = N- L/fs,(N · L+1)/ fs,· · ·,((N+1) · L-l)/fs。所述利用χ (t)和y (s)的拟合多项式表达式生成丢包部分语音信号的多项式表达 式ζ (r),具体如下c.若η彡ρ,则将y(s)的拟合多项式Y (s)扩展为η阶,那么Y(s) = b0+bis+b2s2+. · · +bp_isp_1+bpsp+bp+1sp+1+. · · +bnsn其中,bp+1,...,bn均为 0生成丢包部分语音信号的多项式表达式ζ (r),则ζ (r) = co+qr+c,2+· . . +Clri产WclrTn其中,C0 = a0-b0, C1 = afb” . . . , cn = an_bn,且有,r = (N-I) · L/fs, ((N-I) · L+l)/fs, · · ·,(N · L_l)/fs ;d.若η < p,则将x(t)的拟合多项式X (t)扩展为ρ阶,那么X(t) = ao+Bit+a^2+. . . +Bn^1 tn_1+antn+an+1 tn+1+. . . +aptp其中,an+1,·· ·,ap 均为 0生成丢包部分语音信号的多项式表达式ζ (r),则
ζ (r) = Co+Cir+C^2+. . . +Cp^r^^Cpr15其中,C0 = a0-b0, C1 = afb” ...,Cp = ap_bp,且有,r = (N-I) · L/fs, ((N-I) · L+l)/fs, · · ·,(N · L_l)/fs。本发明的有益效果本发明与现有技术,如基于模式匹配的波形替代方法和前帧 替代方法相比,信号的信噪比(SNR)平均要提高IdB以上,且具有更好的主观听觉效果。
图1为本发明方法对比基于模式匹配的波形替代方法和前帧替代方法的实验结^ ο
具体实施例方式下面对本发明的实施例作详细说明本实施例在以本发明技术方案为前提下进 行,给出了详细的实施方式和过程,但本发明的保护范围不限于下述的实施例。设解码端对音频流解码后定位到丢失帧的位置,设丢失帧的帧序号为N(N > 2), 已经将丢失帧前面的第N-I帧和丢失帧后面的第N+1帧正确解码,丢失帧的采样点数为 160,语音的采样率fs为8000Hz。本发明实施例的具体实施步骤为(1)选取丢包语音前面第N-I帧已正确解码的语音信号采样点L个,并设该语音信 号为X(t);同时,选取丢包语音后面第N+1帧已正确解码的语音信号采样点L个,并设该语 音信号为y (S);(2)采用多项式拟合χ (t),设此多项式为X (t),X(t) = ao+Bit+a^2+. · · +an_!tn_1+antn其中,a0, ai; ... , an为多项式的系数,η为多项式的阶数,t = (N-2) · L/fs, ((N-2) · L+l)/fs, . . .,((N-I) · L-l)/fs。(3)由最小二乘法确定多项式χ (t)的拟合系数,假设各数据点的权值为1,令,
LL2
φ{α0,αι,...,αη) = ^ =J](a。+α/, + …+ α/1=最小
/=0 i=0则有
=+ …+ ("-x(0) = 0’ j=0,l,2,...,n即ΣΜ 十印/+1 +…+ "CO = Σ"雄)
/=0 /=0解此方程组就可以得到多项式系数向量A = a0, B1,..., an。(4)采用多项式拟合y(s),设此多项式为Y(s),如公式Y(s) = bo+biS+b^2+. · · +Iv1Sr^kbpSp其中,Iv b1; . . .,bp为多项式的系数,ρ为多项式的阶数,S = N- L/fs,(N · L+1)/ fs,· · ·,((N+1) · L-l)/fs。
5
(5)由最小二乘法确定多项式y(s)的拟合系数,假设各数据点的权值为1,令,
权利要求
一种语音信号的差错掩盖方法,其特征在于,包括以下步骤第一步根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数,并设该丢失部分的语音采样点数为L;设丢失帧的帧序号为N,且N≥2,语音信号的采样率为fs;第二步选取丢包语音前面接收到的已解码语音信号采样点L个,并设该语音信号为x(t);同时,选取丢包语音后面接收到的已解码语音信号采样点L个,并设该语音信号为y(s);第三步采用多项式拟合x(t);第四步采用多项式拟合y(s);第五步利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r);第六步利用丢包部分语音信号的多项式表达式z(r),计算出丢包部分语音信号的预测值;第七步根据上述步骤获得的预测值,对丢包部分语音值进行替代。
2.根据权利要求1所述的一种语音信号的差错掩盖方法,其特征在于所述第二步采 用的多项式拟合χ (t),设该多项式为X (t),具体如下X(t) = a0+a1t+a2t2+. . . +an—Jn ^anIn其中,aQ,· · ·,an为多项式的系数,η为多项式的阶数,t = (N-2) · L/fs, ((N-2) · L+l)/fs, . . .,((N-I) · L-l)/fs。
3.根据权利要求1所述的一种语音信号的差错掩盖方法,其特征在于,所述第三步采 用的多项式拟合y (s),设该多项式为Y (s),具体如下Y(s) = b0+bis+b2s2+. · · +bp_lSp_1+bpSp其中,IVb1,...,bp为多项式的系数,ρ为多项式的阶数,s = N .L/f;,(N*L+l)/fs,..., ((N+1) · L-l)/fs。
4.根据权利要求1所述的一种语音信号的差错掩盖方法,其特征是,所述利用x(t)和 y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式ζ (r),具体如下a.若11> ,则将7(8)的拟合多项式Y(S)扩展为η阶,那么 Y(s) = b0+bis+b2s2+. . . +bp_isp_1+bpsp+bp+1sp+1+. . . +bnsn其中,bp+1,...,bn 均为 0生成丢包部分语音信号的多项式表达式ζ (r),则z (r) = Cq+c^+^t2+. . . +Cr^rn ^clrTn其中,C0 = a0_b0,C1 = afbp ...,Cn = an_bn,且有,r = (N-I) · L/fs, ((N-I) · L+l)/fs, . . . , (N · L-l)/fs ;b.若11< ,则将1(0的拟合多项式X(t)扩展为ρ阶,那么 X (t) = a0+a1t+a2t2+. . . +a^jt" l+aDtTi+aD+ltTi+l+. . . +aptp其中,an+1, · · ·,ap 均为 0 生成丢包部分语音信号的多项式表达式ζ (r),则 z (r) =· · +cp—;^—^crrTp其中,C0 = a0_b0,C1 = afbp ...,Cp = ap_bp,且有, r = (N-I) · L/fs,((N-I) · L+l)/fs,. · ·,(N · L-l)/fs。
全文摘要
一种语音信号的差错掩盖方法,涉及一种数字通信领域的方法,尤其涉及一种音频信号差错掩盖的方法。包括以下步骤为根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数,并设该丢失部分的语音采样点数为L;设丢失帧的帧序号为N(N≥2),语音信号的采样率为fs;选取丢包语音前面接收到的已解码语音信号采样点L个,并设该语音信号为x(t);同时,选取丢包语音后面接收到的已解码语音信号采样点L个,并设该语音信号为y(s);采用多项式拟合x(t);采用多项式拟合y(s);利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r);利用丢包部分语音信号的多项式表达式z(r),计算出丢包部分语音信号的预测值;根据上述步骤获得的预测值,对丢包部分语音值进行替代。
文档编号G10L21/02GK101976567SQ20101052177
公开日2011年2月16日 申请日期2010年10月28日 优先权日2010年10月28日
发明者肖菲, 赵岩, 陈贺新 申请人:吉林大学
一种语音信号差错掩盖方法
相关推荐
专利名称:一种led照明装置的制作方法技术领域:—种LED照明装置技术领域[0001]本实用新型涉及照明装置,尤其涉及一种LED照明装置。背景技术:[0002]目前,由于LED具有明显优势,导致大批场所的照明装置需要更换为LED照明装置,但
专利名称:光敏树脂、制备该树脂的方法、光敏树脂组合物和该树脂组合物的固化产品的制作方法技术领域:本发明涉及一种光敏树脂、制备该光敏树脂的方法、光敏树脂组合物和 该光敏树脂组合物的固化产品。背景技术:光聚合负型光敏树脂组合物用于各种用途,包括
专利名称:有源矩阵用扫描线驱动电路以及图像显示装置的制作方法技术领域:本发明为涉及有源矩阵用扫描线驱动电路以及图像显示装置,特别 是适于在具有接触孔的扫描线驱动电路中采用了非晶硅薄膜晶体管的 液晶显示装置。背景技术:具有有源矩阵用扫描线驱动
专利名称:一体化堆叠式结构的太阳能电池板的户外造型艺术像灯的制作方法技术领域:本实用新型涉及一种一体化堆叠式结构太阳能电池板及内置光源的户外造型艺术像灯,具体来说,涉及一种一体化堆叠式结构,可以满足不同体积大小造型艺术像,可依外型需求做到一
专利名称:液晶显示器支架的卷片式铰链机构的制作方法技术领域:本实用新型涉及一种液晶显示器支架的巻片式铰链机构。技术背景液晶显示器由于具有质轻、体薄、辐射低等优点,已经逐步取代传统的 荧光显示器。 一般液晶显示器支架包括底座、下端与底座固定的
专利名称:光源装置和液晶显示装置的制作方法技术领域:本发明涉及具有可彼此独立地控制的多个局部发光部分的光源装置和使 用这种光源装置的液晶显示单元。背景技术:当前,如由液晶TV和等离子显示面板(PDP)代表的,存在显示器更 薄的趋势。特别地,