当前位置:网站首页>专利 >正文

一种语音信号非连续传输及背景噪声生成方法

一种语音信号非连续传输及背景噪声生成方法
【专利摘要】本发明请求保护一种语音信号非连续传输及背景噪声生成方法,此方法包括:在语音帧向静音帧转换时加入过渡帧,根据静音帧中背景噪声的波动值大小来决定发送静音描述帧的频率。在解码端,以白噪声作为激励信号,通过线性预测编码合成滤波器后,再经过增益调整得到舒适噪声。本发明在传输噪声信号时具有较好的自适应性,并且合成的背景噪声在主观听觉上具有良好的连续性和舒适性。
【专利说明】一种语音信号非连续传输及背景噪声生成方法
【技术领域】
[0001]本发明涉及语音通信领域,更具体地说,涉及一种语音编码中的非连续传输技术和舒适背景噪声的生成方法。
【背景技术】
[0002]在语音通信过程中,语音压缩编码技术可以减小传输语音信号所需的带宽,增加通信系统的容量。人类在进行语音通信时,大约有70%左右的时间没有讲话,如果始终用一种速率进行语音编码,这对传输信道资源是一种浪费,而信道资源在通信领域,尤其是无线通信领域,是极其宝贵的。
[0003]在现有技术中,为了减少这种资源浪费,将传输的话音信号帧分为语音帧和静音帧两类。由于接收端所关注的是有用的语音信号,因此可用相对语音信号较低的编码速率对静音帧中的背景噪声信号进行编码传输,即采用非连续传输DTX (DiscontinuosTransmission mode)的方式。在接收端,虽然静音帧的背景噪声合成质量有所下降,但不会对语音信号的连续性造成影响。[0004]图1为现有的背景噪声编解码方案示意图。发送端使用话音激活检测VAD(VoiceActivity Detector)算法判断信号是语音信号还是背景噪声信号,如果VAD输出是“ 1”,说明当前信号是语音信号,采用正常的语音编码方法进行编码传输;如果VAD输出是“0”,说明当前信号是背景噪声信号,则以相对较低的编码速率对该信号进行编码,用产生的背景噪声帧代替语音帧进行传输。对于背景噪声信号,只提取其谱形状线性预测LP (LinearPredictive)参数和能量参数,并量化编码组成静音描述SID(Silence Descriptor)帧,然后根据DTX方案进行传输;接收端的舒适噪声产生CNG (Comfort Noise Generator)模块解码SID帧,合成出能描述发送端背景噪声特性的舒适噪声。
[0005]在目前的语音通信技术中,G.729 Annex B 和 3GPP AMR (Adaptive Multi Rate)是应用了 DTX/CNG技术的具有代表性的语音编码标准。
[0006]G.729B标准中的DTX模块使用了自适应能量门限和频谱失真测度来判断是否发送SID帧。当频谱参数和能量参数发生较大变化时,发送SID帧。两个相邻的SID帧之间的最小间隔为2 ;在接收端,舒适噪声由激励信号通过LPC (Linear Predictive Coding)合成滤波器得到。而激励信号是一个伪白噪声激励ex (n), ex (η)是语音激励Ox1 (η)和高斯白噪声激励ex2(n)的混合。高斯白噪声信号的加入是为了改善生成舒适噪声的生动性。此DTX/CNG方法把第一个静音帧判决为SID帧,即在话音变为背景噪声时没有设置平滑过渡阶段,这让接收方在听觉上会感到不自然。另外,自适应能量门限和频谱失真测度算法比较复杂,这增大了整个系统的复杂度。G.729中SID帧参数的比特分配如表1所示。
[0007]表1 G.729中SID中贞的比特分配_
【权利要求】
1.一种语音信号非连续传输及背景噪声生成方法,包括用话音激活检测VAD算法判断输入信号是语音信号还是背景噪声信号,其特征在于:所述语音信号按照正常的语音编码方法进行编码传输;在语音信号向背景噪声信号转换时加入过渡帧;提取背景噪声信号中背景噪声的基本特征参数,并计算出背景噪声的波动信息,根据波动信息的大小决定静音描述SID帧的发送频率;接收端解码静音描述SID帧后,用白噪声作为激励信号,先通过线性预测滤波器,再经过增益调整,产生舒适背景噪声。
2.根据权利要求1所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:所述过渡帧为背景噪声信号从第一帧开始的连续M帧,所述过渡帧的帧格式和编码发送方式与语音信号的帧格式和编码发送方式相同。
3.根据权利要求2所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:所述过渡帧之后的第一帧为静音描述SID帧,其参数是前M个过渡帧参数和本帧参数的平均值。
4.根据权利要求1或2或3所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:所述背景噪声的基本特征参数包括谱参数和增益参数,所述波动信息包括谱参数波动信息和增益参数波动信息。
5.根据权利要求4所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:所述谱参数波动信息的谱波动值计算公式如下:

6.根据权利要求4所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:所述增益参数波动信息的增益波动值计算公式如下:
7.根据权利要求1或5或6所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:所述静音描述SID帧的发送频率为:每N帧或N/2帧发送一次静音描述SID帧。
8.根据权利要求7所述一种语音信号非连续传输及背景噪声生成方法,其特征在于:判断所述静音描述帧的发送频率的方法为:首先判断谱波动值speC_waV是否大于预设门限一,若是,则进一步判断增益波动值gain_wav是否大于预设门限二,若是,则静音描述SID帧的发送频率设定为N/2 ;其余情况下,静音描述SID帧的发送频率设定为N。
【文档编号】G10L19/012GK103680509SQ201310682844
【公开日】2014年3月26日 申请日期:2013年12月16日 优先权日:2013年12月16日
【发明者】李强, 谢虹恩, 张小红, 郑秋菊, 王丽珍, 夏绪玖, 明艳, 李云 申请人:重庆邮电大学

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:影像加热设备的制作方法技术领域:本发明涉及一种影像加热设备例如安装在影像成形设备如复印机或打印机中的热定影装置。具体地说,本发明涉及一种影像加热设备,它包括与其上载有影像的记录媒介接触的旋转部件和用于沿着与其母线方向平行的方向调节

    专利发布时间:2025-07-01阅读:(156)

    专利名称:偏光型led台灯反射器的制作方法技术领域:本发明涉及一种照明设备,具体涉及一种偏光型LED台灯反射器。 背景技术:台灯的种类越来越多,在对台灯进行照明光学设计时,现有的设计是将照射区域 扩大,以灯具出光口为中心,形成一个轴对称的照

    专利发布时间:2025-07-01阅读:(149)

    专利名称:一种搭扣式照明灯的制作方法技术领域:本实用新型涉及一种灯,特别涉及一种搭扣式照明灯。背景技术:人们在晚上或是阴雨天出行时,往往一手拿着雨具,一手提着包或是其他东西,就无法再腾出一只手来拿手电筒照明,这给出行的人带来了极大的不方便。

    专利发布时间:2025-07-01阅读:(120)

    专利名称:一种用于舞台灯具的效果轮装置的制作方法技术领域:本实用新型涉及舞台灯光技术领域,具体涉及一种用于舞台灯具的效果轮装置。背景技术:在现今许多电视及舞台节目制作中,不难看见灯光师利用不同的灯光效果,为节目增添更热闹的气氛,通常会需要一

    专利发布时间:2025-07-01阅读:(115)

    专利名称:带螺纹的汽喇叭发音室的制作方法技术领域:本实用新型涉及一种汽车喇叭发音装置,尤其是带螺纹的汽喇叭发音室。背景技术:目前,公知的汽喇叭发音室构造是,发音室壳体与上盖的边缘制成4处或5处小孔。这种发音室的紧固方式是将其上盖与壳体两部分

    专利发布时间:2025-07-01阅读:(145)

    专利名称::乳液聚集调色剂组合物和显影剂的制作方法乳液聚集调色剂组合物和显影剂技术领域:在此公开特别适合用于具有无油熔凝器系统的静电复印设备的乳液聚集调色剂组合物和显影剂。具体地,该乳液聚集调色剂包含聚酯树脂,并且基本不含结晶聚酯树脂。背景

    专利发布时间:2025-07-01阅读:(113)