一种语音信号非连续传输及背景噪声生成方法
【专利摘要】本发明请求保护一种语音信号非连续传输及背景噪声生成方法,此方法包括:在语音帧向静音帧转换时加入过渡帧,根据静音帧中背景噪声的波动值大小来决定发送静音描述帧的频率。在解码端,以白噪声作为激励信号,通过线性预测编码合成滤波器后,再经过增益调整得到舒适噪声。本发明在传输噪声信号时具有较好的自适应性,并且合成的背景噪声在主观听觉上具有良好的连续性和舒适性。
【专利说明】一种语音信号非连续传输及背景噪声生成方法
【技术领域】
[0001]本发明涉及语音通信领域,更具体地说,涉及一种语音编码中的非连续传输技术和舒适背景噪声的生成方法。
【背景技术】
[0002]在语音通信过程中,语音压缩编码技术可以减小传输语音信号所需的带宽,增加通信系统的容量。人类在进行语音通信时,大约有70%左右的时间没有讲话,如果始终用一种速率进行语音编码,这对传输信道资源是一种浪费,而信道资源在通信领域,尤其是无线通信领域,是极其宝贵的。
[0003]在现有技术中,为了减少这种资源浪费,将传输的话音信号帧分为语音帧和静音帧两类。由于接收端所关注的是有用的语音信号,因此可用相对语音信号较低的编码速率对静音帧中的背景噪声信号进行编码传输,即采用非连续传输DTX (DiscontinuosTransmission mode)的方式。在接收端,虽然静音帧的背景噪声合成质量有所下降,但不会对语音信号的连续性造成影响。[0004]图1为现有的背景噪声编解码方案示意图。发送端使用话音激活检测VAD(VoiceActivity Detector)算法判断信号是语音信号还是背景噪声信号,如果VAD输出是“ 1”,说明当前信号是语音信号,采用正常的语音编码方法进行编码传输;如果VAD输出是“0”,说明当前信号是背景噪声信号,则以相对较低的编码速率对该信号进行编码,用产生的背景噪声帧代替语音帧进行传输。对于背景噪声信号,只提取其谱形状线性预测LP (LinearPredictive)参数和能量参数,并量化编码组成静音描述SID(Silence Descriptor)帧,然后根据DTX方案进行传输;接收端的舒适噪声产生CNG (Comfort Noise Generator)模块解码SID帧,合成出能描述发送端背景噪声特性的舒适噪声。
[0005]在目前的语音通信技术中,G.729 Annex B 和 3GPP AMR (Adaptive Multi Rate)是应用了 DTX/CNG技术的具有代表性的语音编码标准。
[0006]G.729B标准中的DTX模块使用了自适应能量门限和频谱失真测度来判断是否发送SID帧。当频谱参数和能量参数发生较大变化时,发送SID帧。两个相邻的SID帧之间的最小间隔为2 ;在接收端,舒适噪声由激励信号通过LPC (Linear Predictive Coding)合成滤波器得到。而激励信号是一个伪白噪声激励ex (n), ex (η)是语音激励Ox1 (η)和高斯白噪声激励ex2(n)的混合。高斯白噪声信号的加入是为了改善生成舒适噪声的生动性。此DTX/CNG方法把第一个静音帧判决为SID帧,即在话音变为背景噪声时没有设置平滑过渡阶段,这让接收方在听觉上会感到不自然。另外,自适应能量门限和频谱失真测度算法比较复杂,这增大了整个系统的复杂度。G.729中SID帧参数的比特分配如表1所示。
[0007]表1 G.729中SID中贞的比特分配_
【权利要求】
1.一种语音信号非连续传输及背景噪声生成方法,包括用话音激活检测VAD算法判断输入信号是语音信号还是背景噪声信号,其特征在于:所述语音信号按照正常的语音编码方法进行编码传输;在语音信号向背景噪声信号转换时加入过渡帧;提取背景噪声信号中背景噪声的基本特征参数,并计算出背景噪声的波动信息,根据波动信息的大小决定静音描述SID帧的发送频率;接收端解码静音描述SID帧后,用白噪声作为激励信号,先通过线性预测滤波器,再经过增益调整,产生舒适背景噪声。
2.根据权利要求1所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:所述过渡帧为背景噪声信号从第一帧开始的连续M帧,所述过渡帧的帧格式和编码发送方式与语音信号的帧格式和编码发送方式相同。
3.根据权利要求2所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:所述过渡帧之后的第一帧为静音描述SID帧,其参数是前M个过渡帧参数和本帧参数的平均值。
4.根据权利要求1或2或3所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:所述背景噪声的基本特征参数包括谱参数和增益参数,所述波动信息包括谱参数波动信息和增益参数波动信息。
5.根据权利要求4所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:所述谱参数波动信息的谱波动值计算公式如下:
6.根据权利要求4所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:所述增益参数波动信息的增益波动值计算公式如下:
7.根据权利要求1或5或6所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:所述静音描述SID帧的发送频率为:每N帧或N/2帧发送一次静音描述SID帧。
8.根据权利要求7所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:判断所述静音描述帧的发送频率的方法为:首先判断谱波动值speC_waV是否大于预设门限一,若是,则进一步判断增益波动值gain_wav是否大于预设门限二,若是,则静音描述SID帧的发送频率设定为N/2 ;其余情况下,静音描述SID帧的发送频率设定为N。
【文档编号】G10L19/012GK103680509SQ201310682844
【公开日】2014年3月26日 申请日期:2013年12月16日 优先权日:2013年12月16日
【发明者】李强, 谢虹恩, 张小红, 郑秋菊, 王丽珍, 夏绪玖, 明艳, 李云 申请人:重庆邮电大学
一种语音信号非连续传输及背景噪声生成方法
相关推荐
专利名称:音频编码器、音频编码方法和程序的制作方法技术领域:本技术涉及一种音频编码器、音频编码方法以及程序,更具体地,涉及能够在高效地对多个声道的音频信号进行编码时防止由于编码而导致声音质量劣化的音频编码器、音频编码方法和程序。背景技术:在
专利名称:实用十一孔笛子的制作方法技术领域:本实用新型涉及一种管乐器。技术背景现在较为普及的笛子为六个音孔。六个音孔分别由双手的食指、 中指、无名指来对应。受乐器构造限制,半音孔少,演奏转调、变化 音较多的近现代作品及外国作品时音色和音准较
专利名称:一种烛台的制作方法技术领域:一种烛台技术领域[0001]本实用新型涉及一种烛台。背景技术:[0002]随着人们对生活质量的不断提高,人们对照明的要求也越来越高。目前常用的烛台只能放置一只蜡烛,使得需要放置多个蜡烛的场合需要占用较大
专利名称:Led灯具的制作方法技术领域:本实用新型涉及室外照明技术领域,具体的说是一种LED灯具。背景技术:众所周知,随着半导体技术不断的发展,LED半导体光源作为节能光源,现已逐渐被各级政府部门所重视,并且在路灯或射灯照明方面已有少量的应
专利名称:两用名片制版机的制作方法技术领域:本实用新型属于一种用于制作名片印刷版材的制版机,特别是一种小型手动两用(PS版、固体树脂版)名片制版机。已有的制作名片印刷版的方法有(1)通过手工拣字排版制成铅字印刷板。(2)将名片原稿通过照像机
专利名称:用于口风琴的脚踏式进气装置以及口风琴演奏系统的制作方法技术领域:本实用新型涉及一种用于口风琴的脚踏式进气装置和具有该脚踏式进气装置的口风琴演奏系统。背景技术:口风琴是一种用嘴吹奏的便携式键盘乐器,演奏者吹出的气流由吹管进入口风琴形