专利名称:一种语音信号差错掩盖方法
技术领域:
本发明涉及一种数字通信领域的方法,尤其涉及一种音频信号差错掩盖的方法。
背景技术:
基于IP的语音通信业务量几年来一直呈上升趋势,同时,传统公共电话网正在逐 步向以IP技术为核心的下一代网络演进。然而,基于IP的压缩语音数据包在网络中传输 时,会不可避免地由于网络拥塞或传输信道误码等引起丢包,特别是在无线网络中传输时 丢包问题更加严重。为了减小丢包对接收端语音质量的影响,已有许多差错控制技术用来 对抗丢包的影响,其中,差错掩盖技术便是在接收端中广泛采用的一种改善语音主观听觉 效果的方法。从已有的研究成果来看,语音信号差错掩盖技术主要包括基于插入的方法、基于 再生的方法和基于内插的方法三大类。基于插入的方法是通过插入填充包来实现差错掩 盖,而填充包通常是非常简单的静默或噪音替代以及前面收到的包的简单重复。这类方法 容易实现,但是掩盖性能较差。基于再生的方法利用语音编码算法的相关知识估计出丢包 部分语音的解码参数,进而通过解码或合成恢复丢失的语音信号。这类方法依赖于语音编 码算法,不同的语音编码器要采用对应的掩盖方法,通常这类掩盖方法的复杂度也比较高。 基于内插的方法是利用某种形式的模式匹配和内插来得到和丢包语音信号相似的可替换 包,这类算法比基于插入的方法复杂,但可以获得较好的恢复效果,同时方法的通用性比基 于再生的方法好。经过对现有技术的文献检索发现,David J. Goodman等人在1986年《IEEE声学、语 音与ilf号处理期干 Ι》(IEEE Transactions on acoustics, speech and signal processing) 第 34 卷 1440 页到 1448 页发表的 “Waveform Substitution Techniques for Recovering Missing Speech Segments in Packet Voice Communications,,(分组语音通信中恢复丢 失语音段的波形替代技术)一文中提出的基于模式匹配的波形替代方法和基于音高检测 的波形替代方法,是两种较好的基于内插的语音信号差错掩盖方法。基于模式匹配的波形 替代方法将丢失语音包(含L个采样的语音段)前面的语音信号中紧邻丢包语音段的部分 语音(含M个采样的语音子段,M <L,通常M取L的二分之一)看作“模板”(template), 然后在丢包语音段更前面或后面的语音信号中搜索和该模板最匹配的语音子段,找到后将 含有该语音子段的L个采样的语音段作为丢失语音包的替代,从而实现丢包语音信号的差 错掩盖。基于音高检测的波形替代方法同基于模式匹配的波形替代方法类似,只是采用音 高检测代替模版匹配在丢包语音段前面或后面的语音信号中搜索能够替代丢包语音段的 波形信号。上述基于波形替代的方法是利用丢包语音段的前面或后面语音信号中具有和丢 包语音段相似的波形这一特征,因此当语音信号波形不具有重复性时这种方法就得不到理 想的掩盖结果。
发明内容
本发明的目的是针对现有技术的不足,提供一种用于语音信号差错掩盖的方法, 使接收端能够恢复出高质量的掩盖语音信号。本发明是通过以下技术方案实现的一种语音信号的差错掩盖方法,其特征在于,包括以下步骤第一步根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数,并
设该丢失部分的语音采样点数为L ;设丢失帧的帧序号为队且^^ > 2,语音信号的采样率为 fs;第二步选取丢包语音前面接收到的已解码语音信号采样点L个,并设该语音信 号为X(t);同时,选取丢包语音后面接收到的已解码语音信号采样点L个,并设该语音信号 为 y (s);第三步采用多项式拟合x(t);第四步采用多项式拟合y (S);第五步利用X(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式 表达式ζ Cr);第六步利用丢包部分语音信号的多项式表达式ζ (r),计算出丢包部分语音信号 的预测值;第七步根据上述步骤获得的预测值,对丢包部分语音值进行替代。所述第二步采用的多项式拟合x(t),设该多项式为X (t),具体如下X(t) = ao+Bit+a^2+. · · +an_!tn_1+antn其中,a0, ai; ... , an为多项式的系数,η为多项式的阶数,t = (N-2) · L/fs, ((N-2) · L+l)/fs, . . .,((N-I) · L-l)/fs。所述第三步采用的多项式拟合y (s),设该多项式为Y (s),具体如下Y(s) = bo+biS+b^2+. · · +b^s^+bps1'其中,Iv b1; . . .,bp为多项式的系数,ρ为多项式的阶数,S = N- L/fs,(N · L+1)/ fs,· · ·,((N+1) · L-l)/fs。所述利用χ (t)和y (s)的拟合多项式表达式生成丢包部分语音信号的多项式表达 式ζ (r),具体如下c.若η彡ρ,则将y(s)的拟合多项式Y (s)扩展为η阶,那么Y(s) = b0+bis+b2s2+. · · +bp_isp_1+bpsp+bp+1sp+1+. · · +bnsn其中,bp+1,...,bn均为 0生成丢包部分语音信号的多项式表达式ζ (r),则ζ (r) = co+qr+c,2+· . . +Clri产WclrTn其中,C0 = a0-b0, C1 = afb” . . . , cn = an_bn,且有,r = (N-I) · L/fs, ((N-I) · L+l)/fs, · · ·,(N · L_l)/fs ;d.若η < p,则将x(t)的拟合多项式X (t)扩展为ρ阶,那么X(t) = ao+Bit+a^2+. . . +Bn^1 tn_1+antn+an+1 tn+1+. . . +aptp其中,an+1,·· ·,ap 均为 0生成丢包部分语音信号的多项式表达式ζ (r),则
ζ (r) = Co+Cir+C^2+. . . +Cp^r^^Cpr15其中,C0 = a0-b0, C1 = afb” ...,Cp = ap_bp,且有,r = (N-I) · L/fs, ((N-I) · L+l)/fs, · · ·,(N · L_l)/fs。本发明的有益效果本发明与现有技术,如基于模式匹配的波形替代方法和前帧 替代方法相比,信号的信噪比(SNR)平均要提高IdB以上,且具有更好的主观听觉效果。
图1为本发明方法对比基于模式匹配的波形替代方法和前帧替代方法的实验结^ ο
具体实施例方式下面对本发明的实施例作详细说明本实施例在以本发明技术方案为前提下进 行,给出了详细的实施方式和过程,但本发明的保护范围不限于下述的实施例。设解码端对音频流解码后定位到丢失帧的位置,设丢失帧的帧序号为N(N > 2), 已经将丢失帧前面的第N-I帧和丢失帧后面的第N+1帧正确解码,丢失帧的采样点数为 160,语音的采样率fs为8000Hz。本发明实施例的具体实施步骤为(1)选取丢包语音前面第N-I帧已正确解码的语音信号采样点L个,并设该语音信 号为X(t);同时,选取丢包语音后面第N+1帧已正确解码的语音信号采样点L个,并设该语 音信号为y (S);(2)采用多项式拟合χ (t),设此多项式为X (t),X(t) = ao+Bit+a^2+. · · +an_!tn_1+antn其中,a0, ai; ... , an为多项式的系数,η为多项式的阶数,t = (N-2) · L/fs, ((N-2) · L+l)/fs, . . .,((N-I) · L-l)/fs。(3)由最小二乘法确定多项式χ (t)的拟合系数,假设各数据点的权值为1,令,
LL2
φ{α0,αι,...,αη) = ^ =J](a。+α/, + …+ α/1=最小
/=0 i=0则有
=+ …+ ("-x(0) = 0’ j=0,l,2,...,n即ΣΜ 十印/+1 +…+ "CO = Σ"雄)
/=0 /=0解此方程组就可以得到多项式系数向量A = a0, B1,..., an。(4)采用多项式拟合y(s),设此多项式为Y(s),如公式Y(s) = bo+biS+b^2+. · · +Iv1Sr^kbpSp其中,Iv b1; . . .,bp为多项式的系数,ρ为多项式的阶数,S = N- L/fs,(N · L+1)/ fs,· · ·,((N+1) · L-l)/fs。
5
(5)由最小二乘法确定多项式y(s)的拟合系数,假设各数据点的权值为1,令,
权利要求
一种语音信号的差错掩盖方法,其特征在于,包括以下步骤第一步根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数,并设该丢失部分的语音采样点数为L;设丢失帧的帧序号为N,且N≥2,语音信号的采样率为fs;第二步选取丢包语音前面接收到的已解码语音信号采样点L个,并设该语音信号为x(t);同时,选取丢包语音后面接收到的已解码语音信号采样点L个,并设该语音信号为y(s);第三步采用多项式拟合x(t);第四步采用多项式拟合y(s);第五步利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r);第六步利用丢包部分语音信号的多项式表达式z(r),计算出丢包部分语音信号的预测值;第七步根据上述步骤获得的预测值,对丢包部分语音值进行替代。
2.根据权利要求1所述的一种语音信号的差错掩盖方法,其特征在于所述第二步采 用的多项式拟合χ (t),设该多项式为X (t),具体如下X(t) = a0+a1t+a2t2+. . . +an—Jn ^anIn其中,aQ,· · ·,an为多项式的系数,η为多项式的阶数,t = (N-2) · L/fs, ((N-2) · L+l)/fs, . . .,((N-I) · L-l)/fs。
3.根据权利要求1所述的一种语音信号的差错掩盖方法,其特征在于,所述第三步采 用的多项式拟合y (s),设该多项式为Y (s),具体如下Y(s) = b0+bis+b2s2+. · · +bp_lSp_1+bpSp其中,IVb1,...,bp为多项式的系数,ρ为多项式的阶数,s = N .L/f;,(N*L+l)/fs,..., ((N+1) · L-l)/fs。
4.根据权利要求1所述的一种语音信号的差错掩盖方法,其特征是,所述利用x(t)和 y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式ζ (r),具体如下a.若11> ,则将7(8)的拟合多项式Y(S)扩展为η阶,那么 Y(s) = b0+bis+b2s2+. . . +bp_isp_1+bpsp+bp+1sp+1+. . . +bnsn其中,bp+1,...,bn 均为 0生成丢包部分语音信号的多项式表达式ζ (r),则z (r) = Cq+c^+^t2+. . . +Cr^rn ^clrTn其中,C0 = a0_b0,C1 = afbp ...,Cn = an_bn,且有,r = (N-I) · L/fs, ((N-I) · L+l)/fs, . . . , (N · L-l)/fs ;b.若11< ,则将1(0的拟合多项式X(t)扩展为ρ阶,那么 X (t) = a0+a1t+a2t2+. . . +a^jt" l+aDtTi+aD+ltTi+l+. . . +aptp其中,an+1, · · ·,ap 均为 0 生成丢包部分语音信号的多项式表达式ζ (r),则 z (r) =· · +cp—;^—^crrTp其中,C0 = a0_b0,C1 = afbp ...,Cp = ap_bp,且有, r = (N-I) · L/fs,((N-I) · L+l)/fs,. · ·,(N · L-l)/fs。
全文摘要
一种语音信号的差错掩盖方法,涉及一种数字通信领域的方法,尤其涉及一种音频信号差错掩盖的方法。包括以下步骤为根据接收端丢失的语音包的长度确定丢失部分的语音信号采样点数,并设该丢失部分的语音采样点数为L;设丢失帧的帧序号为N(N≥2),语音信号的采样率为fs;选取丢包语音前面接收到的已解码语音信号采样点L个,并设该语音信号为x(t);同时,选取丢包语音后面接收到的已解码语音信号采样点L个,并设该语音信号为y(s);采用多项式拟合x(t);采用多项式拟合y(s);利用x(t)和y(s)的拟合多项式表达式生成丢包部分语音信号的多项式表达式z(r);利用丢包部分语音信号的多项式表达式z(r),计算出丢包部分语音信号的预测值;根据上述步骤获得的预测值,对丢包部分语音值进行替代。
文档编号G10L21/02GK101976567SQ20101052177
公开日2011年2月16日 申请日期2010年10月28日 优先权日2010年10月28日
发明者肖菲, 赵岩, 陈贺新 申请人:吉林大学
一种语音信号差错掩盖方法
相关推荐
专利名称:一种警灯的制作方法技术领域:本实用新型涉及警灯技术领域。背景技术:传统的警灯,其安装底板是采用整体的铝底板,重量重,成本高。实用新型内容本实用新型的目的是提供一种警灯,以克服现有技术的缺陷,采用两条独立的带T型槽的铝型材作为安装螺
专利名称:竹灯具的制作方法技术领域:本实用新型涉及一种灯具。背景技术:现时人们使用的台灯、落地灯等灯具,其灯柱、灯座等部件多为金属或陶瓷、塑料等造成的,这些材料重量大,易损坏,成本高,缺乏耐用性;利用地方资源,选用竹材料作灯具可以开发新的产
专利名称:用于减少承载玻板过热的文件照明组件的制作方法技术领域:本发明与电子照像复印机的文件照明设备有关,具体有关一种与文件照明灯相关的防止承载玻板过热的装置。在传统复印机中,将待复印的文件原件,放置或移送到位于物平面的玻璃承载板上。文件用
专利名称:一种用于机动车远光照明的led透镜的制作方法技术领域:本实用新型涉及光学技术领域,具体地说是一种用于机动车远光照明的LED透镜。背景技术:机动车上配置的远光灯,能够为机动车驾驶员提供远处道路照明,帮助驾驶员及时辨明路面情况,适用于
专利名称:电鼓鼓盘的固定座的制作方法技术领域:本实用新型涉及一种电鼓配件,尤其是一种电鼓鼓盘的固定座。背景技术:电鼓鼓盘的固定座安装在电鼓鼓盘底部,其是电鼓鼓盘与电鼓支架之间重要的连接部件。而早期采用的电鼓鼓盘的固定座多数为一体成型的铸件,
双面发光灯具的制作方法【专利摘要】本发明适用于照明灯具生产【技术领域】,提供了一种双面发光灯具,包括电池箱,其内设有蓄电池;灯架,其设于所述电池箱上;双面发光的灯头,其设于所述灯架的上端;储线装置,其设于所述电池箱的底部,用于存储连接外接电