一种语音信号非连续传输及背景噪声生成方法-品牌商务网

一种语音信号非连续传输及背景噪声生成方法
【专利摘要】本发明请求保护一种语音信号非连续传输及背景噪声生成方法，此方法包括：在语音帧向静音帧转换时加入过渡帧，根据静音帧中背景噪声的波动值大小来决定发送静音描述帧的频率。在解码端，以白噪声作为激励信号，通过线性预测编码合成滤波器后，再经过增益调整得到舒适噪声。本发明在传输噪声信号时具有较好的自适应性，并且合成的背景噪声在主观听觉上具有良好的连续性和舒适性。
【专利说明】一种语音信号非连续传输及背景噪声生成方法
【技术领域】
[0001]本发明涉及语音通信领域，更具体地说，涉及一种语音编码中的非连续传输技术和舒适背景噪声的生成方法。
【背景技术】
[0002]在语音通信过程中，语音压缩编码技术可以减小传输语音信号所需的带宽，增加通信系统的容量。人类在进行语音通信时，大约有70%左右的时间没有讲话，如果始终用一种速率进行语音编码，这对传输信道资源是一种浪费，而信道资源在通信领域，尤其是无线通信领域，是极其宝贵的。
[0003]在现有技术中，为了减少这种资源浪费，将传输的话音信号帧分为语音帧和静音帧两类。由于接收端所关注的是有用的语音信号，因此可用相对语音信号较低的编码速率对静音帧中的背景噪声信号进行编码传输，即采用非连续传输DTX (DiscontinuosTransmission mode)的方式。在接收端,虽然静音帧的背景噪声合成质量有所下降,但不会对语音信号的连续性造成影响。[0004]图1为现有的背景噪声编解码方案示意图。发送端使用话音激活检测VAD(VoiceActivity Detector)算法判断信号是语音信号还是背景噪声信号，如果VAD输出是“ 1”，说明当前信号是语音信号，采用正常的语音编码方法进行编码传输；如果VAD输出是“0”，说明当前信号是背景噪声信号，则以相对较低的编码速率对该信号进行编码，用产生的背景噪声帧代替语音帧进行传输。对于背景噪声信号，只提取其谱形状线性预测LP (LinearPredictive)参数和能量参数,并量化编码组成静音描述SID(Silence Descriptor)帧,然后根据DTX方案进行传输；接收端的舒适噪声产生CNG (Comfort Noise Generator)模块解码SID帧，合成出能描述发送端背景噪声特性的舒适噪声。
[0005]在目前的语音通信技术中，G.729 Annex B 和 3GPP AMR (Adaptive Multi Rate)是应用了 DTX/CNG技术的具有代表性的语音编码标准。
[0006]G.729B标准中的DTX模块使用了自适应能量门限和频谱失真测度来判断是否发送SID帧。当频谱参数和能量参数发生较大变化时，发送SID帧。两个相邻的SID帧之间的最小间隔为2 ;在接收端,舒适噪声由激励信号通过LPC (Linear Predictive Coding)合成滤波器得到。而激励信号是一个伪白噪声激励ex (n), ex (η)是语音激励Ox1 (η)和高斯白噪声激励ex2(n)的混合。高斯白噪声信号的加入是为了改善生成舒适噪声的生动性。此DTX/CNG方法把第一个静音帧判决为SID帧，即在话音变为背景噪声时没有设置平滑过渡阶段，这让接收方在听觉上会感到不自然。另外，自适应能量门限和频谱失真测度算法比较复杂，这增大了整个系统的复杂度。G.729中SID帧参数的比特分配如表1所示。
[0007]表1 G.729中SID中贞的比特分配_
【权利要求】
1.一种语音信号非连续传输及背景噪声生成方法，包括用话音激活检测VAD算法判断输入信号是语音信号还是背景噪声信号，其特征在于:所述语音信号按照正常的语音编码方法进行编码传输；在语音信号向背景噪声信号转换时加入过渡帧；提取背景噪声信号中背景噪声的基本特征参数，并计算出背景噪声的波动信息，根据波动信息的大小决定静音描述SID帧的发送频率；接收端解码静音描述SID帧后，用白噪声作为激励信号，先通过线性预测滤波器，再经过增益调整，产生舒适背景噪声。
2.根据权利要求1所述一种语音信号非连续传输及背景噪声生成方法，其特征在于:所述过渡帧为背景噪声信号从第一帧开始的连续M帧，所述过渡帧的帧格式和编码发送方式与语音信号的帧格式和编码发送方式相同。
3.根据权利要求2所述一种语音信号非连续传输及背景噪声生成方法，其特征在于:所述过渡帧之后的第一帧为静音描述SID帧，其参数是前M个过渡帧参数和本帧参数的平均值。
4.根据权利要求1或2或3所述一种语音信号非连续传输及背景噪声生成方法，其特征在于:所述背景噪声的基本特征参数包括谱参数和增益参数，所述波动信息包括谱参数波动信息和增益参数波动信息。
5.根据权利要求4所述一种语音信号非连续传输及背景噪声生成方法，其特征在于:所述谱参数波动信息的谱波动值计算公式如下:

6.根据权利要求4所述一种语音信号非连续传输及背景噪声生成方法，其特征在于:所述增益参数波动信息的增益波动值计算公式如下:
7.根据权利要求1或5或6所述一种语音信号非连续传输及背景噪声生成方法，其特征在于:所述静音描述SID帧的发送频率为:每N帧或N/2帧发送一次静音描述SID帧。
8.根据权利要求7所述一种语音信号非连续传输及背景噪声生成方法，其特征在于:判断所述静音描述帧的发送频率的方法为:首先判断谱波动值speC_waV是否大于预设门限一，若是，则进一步判断增益波动值gain_wav是否大于预设门限二，若是，则静音描述SID帧的发送频率设定为N/2 ;其余情况下，静音描述SID帧的发送频率设定为N。
【文档编号】G10L19/012GK103680509SQ201310682844
【公开日】2014年3月26日申请日期:2013年12月16日优先权日:2013年12月16日
【发明者】李强, 谢虹恩, 张小红, 郑秋菊, 王丽珍, 夏绪玖, 明艳, 李云申请人:重庆邮电大学

本文推荐一种语音信号非连续传输及背景噪声生成方法仅代表作者观点，不代表本网站立场。本站对作者上传的所有内容将尽可能审核来源及出处，但对内容不作任何保证或承诺。请读者仅作参考并自行核实其真实性及合法性。如您发现图文视频内容来源标注有误或侵犯了您的权益请告知，本站将及时予以修改或删除。未经允许不得转载：http://www.pinpai35.com/1656639342.html

当前位置：网站首页>专利 >正文

一种语音信号非连续传输及背景噪声生成方法

相关推荐