当前位置:网站首页>专利 >正文

语音解码装置及补偿帧生成方法

专利名称:语音解码装置及补偿帧生成方法
技术领域
本发明涉及语音解码装置及补偿帧(repaired frame)生成方法。
背景技术
在互联网等中进行的分组通信中,由于在传输路径中丢失分组等原因而没能在解码装置接收到编码信息时,一般进行该分组的丢失补偿(屏蔽)处理。
例如在语音编码领域,在ITU-T建议G.729中规定了如下帧丢失屏蔽处理(frame erasure concealment processing)(1)重复使用合成滤波器系数;(2)使音调增益和固定码本增益(FCB增益)渐渐衰减;(3)使FCB增益预测器的内部状态渐渐衰减;(4)基于前一正常帧中的有声模式/无声模式的判定结果,使用在自适应码本或固定码本中的任一个生成音源信号(例如,参见专利文献1)。
上述方式中,使用由后置滤波器进行的音调分析结果,根据音调预测增益的大小判定有声模式/无声模式,并且,例如,在前一正常帧为有声模式时,使用自适应码本生成合成滤波器的音源矢量。基于为了帧丢失补偿处理而生成的音调滞后,利用自适应码本生成ACB(自适应码本)矢量,并将其乘以为了帧丢失补偿处理而生成的音调增益,由此得到音源矢量。将在刚刚使用过的解码音调滞后进行增量后,用作为帧丢失补偿处理的音调滞后。将刚刚使用过的解码音调增益衰减一定倍数以后,用作为帧丢失补偿处理的音调增益。
专利文献1日本专利特开平9-120298号公报发明内容发明要解决的问题然而,以往的语音解码装置基于过去的音调增益决定用于帧丢失补偿处理的音调增益。但是,音调增益并不一定是反映了信号的能量变化的参数。于是,所生成的用于帧丢失补偿处理的音调增益并没有考虑到过去信号的能量变化的音调增益。而且,由于以一定比率使音调增益衰减,所以用于帧丢失补偿处理的音调增益会与过去的信号的能量变化无关地衰减。也就是说,由于没有考虑到过去信号的能量变化,而且以一定比率使音调增益衰减,所以经补偿的帧与过去的信号之间难以保持能量的连续性,从而容易产生断音感。由此,解码信号的音质恶化。
因此,本发明旨在提供一种语音解码装置及补偿帧生成方法,在丢失补偿处理中考虑过去信号的能量变化,从而能够提高解码信号的音质。
解决问题的方案本发明的语音解码装置的结构包括自适应码本,生成音源信号;计算单元,计算所述音源信号的子帧之间的能量变化;决定单元,基于所述能量变化决定所述自适应码本的增益;以及生成单元,使用所述自适应码本的增益生成对于丢失帧的补偿帧。
发明效果根据本发明,在丢失补偿处理中能够考虑过去信号的能量变化,从而能够提高解码信号的音质。


图1是表示实施方式1所涉及的补偿帧生成单元的主要结构的方框图;图2是表示实施方式1所涉及的噪声性附加单元内部的主要结构的方框图;图3是表示实施方式2所涉及的语音解码装置的主要结构的方框图;图4表示使用自适应码本和固定码本两者而生成补偿帧的例子;图5表示以由固定码本生成的噪声性信号置换由自适应码本生成的音源中的一部分频带的例子;图6是表示实施方式3所涉及的补偿帧生成单元的主要结构的方框图;图7是表示实施方式3所涉及的噪声性附加单元内部的主要结构的方框图;图8是表示实施方式3所涉及的ACB分量生成单元内部的主要结构的方框图;
图9是表示实施方式3所涉及的FCB分量生成单元内部的主要结构的方框图;图10是表示实施方式3所涉及的丢失帧屏蔽处理单元的主要结构的方框图;图11是表示实施方式3所涉及的模式判定单元内部的主要结构的方框图;以及图12是表示实施方式4所涉及的无线发送装置和无线接收装置的主要结构的方框图。
具体实施例方式
以下,参照附图详细说明本发明的实施方式。
(实施方式1)本发明的实施方式1所涉及的语音解码装置对缓冲在自适应码本中的、过去生成的音源信号的能量变化进行分析,并生成自适应码本的音调增益(即自适应码本增益(ACB增益)),以便保持能量的连续性。由此,能够改善作为丢失帧的补偿帧而生成的音源矢量与过去信号之间的能量连续性,并能够保持存储在自适应码本中的信号的能量连续性。
图1是表示本发明的实施方式1所涉及的语音解码装置内部的补偿帧生成单元100的主要结构的方框图。
该补偿帧生成单元100包括自适应码本106;矢量生成单元115;噪声性附加单元116;乘法器132;ACB增益生成单元135;以及能量变化计算单元143。
能量变化计算单元143计算由自适应码本106输出的ACB(自适应码本)矢量的最后一个音调周期长度的音源信号的平均能量。另一方面,在能量变化计算单元143的内部存储器中,存储着在前一子帧中同样地计算出的1个音调周期长度的音源信号的平均能量。于是,能量变化计算单元143计算当前子帧与前一子帧的一个周期长度的音源信号的平均能量之比。此外,该平均能量也可以是音源信号的能量的平方根或对数。能量变化计算单元143还对计算出的比值在子帧之间进行平滑处理,并将经平滑处理的比值输出给ACB增益生成单元135。
能量变化计算单元143使用在当前子帧计算出的一个音调周期长度的音源信号的能量,更新在前一子帧计算出的一个音调周期长度的音源信号的能量。例如,根据以下(式1)计算Ec。
Ec=√((∑(ACB[Lacb-i])2)/P c) ...(式1)(在此,ACB自适应码本缓冲、Lacb自适应码本缓冲长度、Pc在当前子帧的音调周期、Ec在当前子帧的过去一个音调周期的音源信号的平均振幅(能量的平方根)、i=1,2,...,Pc)然后,能量变化计算单元143将在前一子帧计算出的Ec作为Ep存储起来,以Re=Ec/Ep计算能量变化率Re。接着,能量变化计算单元143以0.98对Re进行削波,使用譬如Sre=0.7×Sre+0.3×Re这样的算式进行平滑处理,并将平滑能量变化率Sre输出给ACB增益生成单元135。能量变化计算单元143最后使Ep=Ec,由此更新Ep。
通过如上计算能量变化而决定ACB增益,由此能够保持能量连续性。然后,使用所决定的ACB增益仅根据自适应码本生成音源,就能够生成保持了能量连续性的音源矢量。
ACB增益生成单元135在使用过去解码出的ACB增益而定义的用于屏蔽处理的ACB增益、和由能量变化计算单元143输出的能量变化率信息所定义的用于屏蔽处理的ACB增益中任意选择一个,并将最终的用于屏蔽处理的ACB增益输出给乘法器132。
在此,能量变化率信息为对由前一子帧的最后一个音调周期得到的平均振幅A(-1)和由向前两个子帧的最后1个音调周期得到的平均振幅A(-2)之比(即A(-1)/A(-2))、在子帧间进行平滑处理而得到的信息,其表示过去的解码信号的功率变化,基本上将其作为ACB增益。只是,在使用过去解码出的ACB增益所定义的用于屏蔽处理的ACB增益大于上述能量变化率信息的情况下,也可以选择使用过去解码出的ACB增益所定义的用于屏蔽处理的ACB增益作为最终的用于屏蔽处理的ACB增益。此外,在上述A(-1)/A(-2)的比值超过上限值时,以上限值进行削波。作为上限值,例如使用0.98。
矢量生成单元115根据自适应码本106生成相应的ACB矢量。
可是,上述补偿帧生成单元100不管有声性的强弱,仅根据过去的信号的能量变化来决定ACB增益。于是,虽然能够消除断音感,但有时有声性虽弱但ACB增益反而增高,此时会产生较强的蜂鸣声。
因此,本实施方式中为了得到自然的音质,具有与返回自适应码本106的反馈环路为不同系统的噪声性附加单元116,用于对由自适应码本106生成的矢量附加噪声性。
通过对由自适应码本106生成的音源矢量的特定频带分量进行噪声化处理,来进行噪声性附加单元116处的音源矢量的噪声化处理。更具体来讲,对由自适应码本106生成的音源矢量使用低通滤波器而去除高频分量,并加上具有与所去除的高频分量相同的信号能量的噪声信号。对由固定码本生成的音源矢量使用高通滤波器去除低频分量,而生成该噪声信号。低通滤波器和高通滤波器使用其阻带和通带彼此相反的完全重构滤波器组(perfectreconfiguration filter bank)或与其相应的滤波器。
根据上述结构,在将最后正常接收到的音源波形的特征存储在自适应码本106中的同时能够任意附加噪声性,从而任意加工所生成的音源矢量的特征。此外,即使对音源矢量附加噪声性,由于对附加噪声性之前的音源矢量的能量进行存储,所以不会影响到能量的连续性。
图2是表示噪声性附加单元116内部的主要结构的方框图。
该噪声性附加单元116包括乘法器110、111;ACB分量生成单元134;FCB增益生成单元139;FCB分量生成单元141;固定码本145;矢量生成单元146以及加法器147。
ACB分量生成单元134使由矢量生成单元115输出的ACB矢量通过低通滤波器,由此生成在由矢量生成单元115输出的ACB矢量中不附加噪声的频带分量,并将该分量作为ACB分量输出。通过低通滤波器之后的ACB矢量A输出到乘法器110和FCB增益生成单元139。
FCB分量生成单元141使由矢量生成单元146输出的FCB(固定码本)矢量通过高通滤波器,由此生成在由矢量生成单元146输出的FCB矢量中要附加噪声的频带分量,并将该分量作为FCB分量输出。通过高通滤波器之后的FCB矢量F输出到乘法器111和FCB增益生成单元139。
另外,上述低通滤波器和高通滤波器为线性相位FIR滤波器。
FCB增益生成单元139根据由ACB增益生成单元135输出的用于屏蔽处理的ACB增益、由ACB分量生成单元134输出的用于屏蔽处理的ACB矢量A、输入到ACB分量生成单元134的、经ACB分量生成单元134处理前的ACB矢量、以及由FCB分量生成单元141输出的FCB矢量F,如下计算用于屏蔽处理的FCB增益。
FCB增益生成单元139对经ACB分量生成单元134进行处理前和处理后的ACB矢量的差矢量D,计算能量Ed(矢量D的各个要素的平方和)。然后,FCB增益生成单元139计算FCB矢量F的能量Ef(矢量F的各个要素的平方和)。其次,FCB增益生成单元139对由ACB分量生成单元134输入的ACB矢量A和由FCB分量生成单元141输入的FCB矢量F,计算互相关Raf(矢量A和矢量F的内积)。接着,FCB增益生成单元139对由ACB分量生成单元134输入的ACB矢量A和上述差矢量D,计算互相关Rad(矢量A和D的内积)。然后,FCB增益生成单元139根据以下(式2)计算增益。(-Raf+√(Raf×Raf+Ef×Ed+2×Ef×Rad))/Ef...(式2)在此,所得的解为虚数或负数时,将√(Ed/Ef)作为增益。最后,FCB增益生成单元139将由上述(式2)得到的增益乘以由ACB增益生成单元135生成的用于屏蔽处理的ACB增益,由此得到用于屏蔽处理的FCB增益。
以上的记载为计算用于屏蔽处理的FCB增益以便使以下两个矢量的能量相等的一个例子。在此所谓的两个矢量,其中一个为将输入到ACB分量生成单元134的原来的ACB矢量乘以用于屏蔽处理的ACB增益而得到的矢量,而另一个为将ACB矢量A乘以用于屏蔽处理的ACB增益而得到的矢量,和将FCB矢量F乘以用于屏蔽处理的FCB增益(此为未知的、在此要计算的对象)而得到的矢量的和矢量。
加法器147,将由ACB增益生成单元135决定的ACB增益乘以由ACB分量生成单元134生成的ACB矢量A(音源矢量的ACB分量)而得到的矢量、和将由FCB增益生成单元139决定的FCB增益乘以由FCB分量生成单元141生成的FCB矢量F(音源矢量的FCB分量)而得到的矢量的和矢量,作为最终的音源矢量输出给合成滤波器。此外,将输入到ACB分量生成单元134的(经低通滤波器处理前的)ACB矢量乘以用于屏蔽处理的ACB增益的矢量反馈给自适应码本106,由此仅使用ACB矢量更新自适应码本106,并将由加法器147得到的矢量作为合成滤波器的激励音源。
另外,对于合成滤波器的驱动音源,也可以施加相位扩散处理(phasedispersion processing)或实现音调周期性增强的处理。
如上所述,根据本实施方式,由于根据过去的解码语音信号的能量变化率决定ACB增益,并生成与由使用该增益生成的ACB矢量的能量相等的音源矢量,所以解码语音的能量变化在丢失帧的前后变得平滑,因此难以发生断音感。
另外,由于在上述结构中仅使用自适应码矢量进行自适应码本106的更新,所以能够抑制例如使用经随机噪声化的音源矢量更新自适应码本106时发生的后续帧的噪声感。
另外,在上述结构中,由于在语音信号的有声恒定单元中的屏蔽处理主要仅对高频(例如,3kHz以上)附加噪声,所以与以往的对所有频域附加噪声的方式相比,不容易发生噪声感。
(实施方式2)在实施方式1中,作为本发明所涉及的补偿帧生成单元的结构的一例,将补偿帧生成单元单独提出来进行了说明。在本发明的实施方式2中,示出了将本发明所涉及的补偿帧生成单元安装在语音解码装置时的语音解码装置的结构的一例。此外,对于与实施方式1相同的结构单元附上相同的标记,并省略其说明。
图3是表示本发明的实施方式2所涉及的语音解码装置的主要结构的方框图。
本实施方式所涉及的语音解码装置在输入帧是正常帧时进行通常的解码处理,而在输入帧不是正常帧(丢失了帧)时,进行对该丢失帧的屏蔽处理。切换开关121至127根据表示输入帧是否为正常帧的坏帧指示(BFI)进行切换,由此实现上述两种处理。
首先对本实施方式所涉及的语音解码装置在通常的解码处理中的动作进行说明。图3所示的开关的状态表示在通常的解码处理中的开关的位置。
复用分离单元101将编码比特流分离为各个参数(LPC代码、音调代码、音调增益代码、FCB代码以及FCB增益代码),并分别供给给相应的解码单元。LPC解码单元102基于由复用分离单元101供给的LPC代码解码出LPC参数。音调周期解码单元103基于由复用分离单元101供给的音调代码解码出音调周期。ACB增益解码单元104基于由复用分离单元101供给的ACB代码解码出ACB增益。FCB增益解码单元105基于由复用分离单元101供给的FCB增益代码解码出FCB增益。
自适应码本106使用由音调周期解码单元103输出的音调周期生成ACB矢量,并输出给乘法器110。乘法器110将由ACB增益解码单元104输出的ACB增益乘以由自适应码本106输出的ACB矢量,并将增益调整后的ACB矢量供给给音源生成单元108。另一方面,固定码本107基于由复用分离单元101输出的固定码本代码生成FCB矢量,并输出给乘法器111。乘法器111将由FCB增益解码单元105输出的FCB增益乘以由固定码本107输出的FCB矢量,并将增益调整后的FCB矢量供给给音源生成单元108。音源生成单元108将由乘法器110、111输出的两个矢量相加而生成音源矢量,将其反馈给自适应码本106,并输出给合成滤波器109。
音源生成单元108从乘法器110得到已乘上了用于屏蔽处理的ACB增益后的ACB矢量,而从乘法器111得到已乘上了用于屏蔽处理的FCB增益后的FCB矢量,并将两者相加而得到音源矢量。没有差错时,音源生成单元108将该所相加的矢量作为音源信号反馈给自适应码本106,并输出给合成滤波器109。
合成滤波器109为基于经由开关124输入的线性预测系数(LPC)构成的线性预测滤波器,通过输入由音源生成单元108输出的激励音源矢量而进行滤波处理,由此输出解码语音信号。
所输出的解码语音信号在经过后置滤波器等的后处理之后,成为语音解码装置的最终输出。此外,该信号也输出到丢失帧屏蔽处理单元112内部的零交叉率计算单元(未图示)。
下面,对本实施方式所涉及的语音解码装置在屏蔽处理中的动作进行说明。该处理主要由丢失帧屏蔽处理单元112执行。
在通常的解码处理中,也将由LPC解码单元102、音调周期解码单元103、ACB增益解码单元104以及FCB增益解码单元105得到的各个解码参数(LPC参数、音调周期、ACB增益以及FCB增益)供给给丢失帧屏蔽处理单元112。这四种解码参数、前帧的解码语音(合成滤波器109的输出)、存储于自适应码本106中的过去生成的音源信号、为用于当前帧(丢失帧)而生成的ACB矢量以及为用于当前帧(丢失帧)而生成的FCB矢量输入到丢失帧屏蔽处理单元112。丢失帧屏蔽处理单元112使用这些参数进行后述的丢失帧的屏蔽处理,并输出所得到的LPC参数、音调周期、ACB增益、固定码本代码、FCB增益、ACB矢量以及FCB矢量。
在所生成的用于屏蔽处理的ACB矢量、用于屏蔽处理的ACB增益、用于屏蔽处理的FCB矢量以及用于屏蔽处理的FCB增益中,用于屏蔽处理的ACB矢量输出到乘法器110,用于屏蔽处理的ACB增益输出到乘法器110,用于屏蔽处理的FCB矢量经由切换开关125输出到乘法器111,而用于屏蔽处理的FCB增益经由切换开关126输出到乘法器111。
音源生成单元108在屏蔽处理中,将输入给ACB分量生成单元134的(经LPF处理前的)ACB矢量乘以用于屏蔽处理的ACB增益,并将所得到的矢量反馈给自适应码本106(自适应码本106仅使用ACB矢量进行更新),将由上述加法处理得到的矢量作为合成滤波器的激励音源。此外,也可以像没有差错时那样对合成滤波器的激励音源施加相位扩散处理和实现音调周期增强的处理等。
另外,在上述说明中,丢失帧屏蔽处理单元112和音源生成单元108相当于实施方式1中的补偿帧生成单元。此外,用语音解码装置的固定码本107来代替用于噪声性附加处理中的固定码本(实施方式1中的固定码本145)。
如上所述,根据本实施方式,能够将本发明所涉及的补偿帧生成单元安装在语音解码装置中。
另外,在AMR方式中,通过在开始一个帧的解码处理之前随机生成一个帧长度的比特流来进行相当于后述的FCB代码生成单元140的处理,所以并不一定需要配置专门生成FCB代码的单元。
另外,输出给合成滤波器109的音源信号和反馈给自适应码本106的音源信号并非必需为相同信号。例如,在生成输出给合成滤波器109的音源信号时,也可以如AMR方式那样对FCB矢量适用相位扩散处理,或施加增强音调周期的处理。此时,使输出给自适应码本106的信号的生成方法与编码端的结构一致。由此,有时能进一步改善主观质量。
另外,虽然在本实施方式中由FCB增益解码单元105将FCB增益输入给丢失帧屏蔽处理单元112,但这并不一定是必需的。在上述方法中在计算用于屏蔽处理的FCB增益之前需要求出临时的用于屏蔽处理的FCB增益时,需要FCB增益。或者,在有限字长的固定小数点计算中,为了通过使动态范围变窄而防止运算精确度的恶化,将上述FCB矢量F预先乘以该临时的用于屏蔽处理的FCB增益时,也需要FCB增益。
(实施方式3)对于具有有声和无声的中间性质的丢失帧,优选方式为如图4所示使用自适应码本和固定码本两者,通过混合由这些码本生成的音源矢量而生成补偿帧。然而,这种中间性质的信号存在各种情形,例如,由于具有噪声性而使其有声性降低,或由于功率变化而使其有声性降低,或由于是过渡部分、上升部分、字尾部分的附近而使其有声性降低等,所以,如果采用以固定方式使用随机生成的固定码本生成音源信号的结构的话,则解码语音中会发生噪声感,导致主观质量的恶化。
另一方面,CELP方式的语音解码将过去生成的音源信号存储在自适应码本中,并基于使用该音源信号表示对于当前输入信号的音源信号的模型。也就是说,递归使用存储在自适应码本中的音源信号。于是,一旦音源信号成为噪声性信号,由于其影响的传播,在后续的帧中也成为噪声性的信号,这成为一个问题。
因此,在本实施方式中,如图5所示仅将由自适应码本生成的音源中的一部分频带置换为由固定码本生成的噪声性信号,由此尽可能地减少噪声对主观质量的影响。更具体来讲,仅将由自适应码本生成的音源的高频带置换为由固定码本生成的噪声性信号。其原因在于,高频分量具有噪声性是在实际的语音信号中能观察到的现象,所以,与将全部频带均一地噪声化处理相比,更容易得到自然的主观质量。
另外,本实施方式中,为附加噪声性还配置了模式判定单元,以根据所判定的语音模式在噪声性附加单元中切换要附加噪声的信号频带,来控制所附加的噪声性的强弱。
另外,使用经频带限制的自适应码本和经频带限制的固定码本生成的音源矢量合成音源信号,意味着无法原封不动地使用针对作为正常帧的前帧得到的ACB增益和FCB增益。因为基于未经频带限制的自适应码本和未经频带限制的固定码本生成的音源矢量的合成矢量的增益,与基于经频带限制的自适应码本和经频带限制的固定码本生成的音源矢量的增益不同。于是,为了防止发生帧间的能量的不连续,就需要实施方式1中所示的补偿帧生成单元。
另外,在将由固定码本生成的音源矢量混合时,可以挪用实施方式1中所示的噪声性附加单元。
由此,能够根据语音信号的特征(语音模式)切换解码音源信号的要进行噪声化处理的信号频带。例如,在周期性较低而噪声性较高的模式中,将附加噪声的信号频带加宽,而在周期性较强而有声性较高的模式中,将附加噪声的信号频带缩小,由此能够使解码合成语音信号的主观质量更为自然。
图6是表示本发明实施方式3所涉及的补偿帧生成单元100a的主要结构的方框图。此外,该补偿帧生成单元100a具有与实施方式1所示的补偿帧生成单元100同样的基本结构,对相同的结构单元附上相同的标记,并省略其说明。
模式判定单元138使用过去的解码音调周期的历史记录、过去的解码合成语音信号的零交叉率、过去的平滑ACB增益、过去的解码音源信号的能量变化率以及连续丢失帧数量,进行解码语音信号的模式判定。噪声性附加单元116a基于由模式判定单元138判定的模式,切换附加噪声的信号频带。
图7是表示噪声性附加单元116a内部的主要结构的方框图。此外,该噪声性附加单元116a具有与实施方式1所示的噪声性附加单元116同样的基本结构,对相同的结构单元附上相同的标记,并省略其说明。
滤波器截止频率切换单元137根据由模式判定单元138输出的模式判定结果决定滤波器截止频率,并输出对应于ACB分量生成单元134和FCB分量生成单元141的滤波器系数。
图8是表示上述ACB分量生成单元134内部的主要结构的方框图。
ACB分量生成单元134在BFI指示丢失帧时,使由矢量生成单元115输出的ACB矢量通过LPF(低通滤波器)161,由此作为ACB分量生成不附加噪声的频带分量。该LPF 161为基于从滤波器截止频率切换单元137输出的滤波器系数构成的线性相位FIR滤波器。滤波器截止频率切换单元137存储有与多种截止频率相对应的滤波器系数组合,选择与由模式判定单元138输出的模式判定结果相对应的滤波器系数并输出给LPF 161。
滤波器的截止频率与语音模式之间的对应关系例如为如下。在此表示电话频带语音中语音模式为三种模式结构的例子。
有声模式截止频率=3kHz噪声模式截止频率=0Hz(全频带截止=ACB矢量为零矢量)
其它模式截止频率=1kHz图9是表示上述FCB分量生成单元141内部的主要结构的方框图。
由矢量生成单元146输出的FCB矢量在BFI指示丢失帧时输入到高通滤波器(HPF)171。HPF 171为基于从滤波器截止频率切换单元137输出的滤波器系数构成的线性相位FIR滤波器。滤波器截止频率切换单元137存储着与多种截止频率相对应的滤波器系数组合,选择与由模式判定单元138输出的模式判定结果相对应的滤波器系数组合并输出给HPF 171。
滤波器的截止频率与语音模式之间的关系例如为如下。在此也表示电话频带语音中语音模式为三种模式结构的例子。
有声模式截止频率=3kHz噪声模式截止频率=0Hz(全频带带通=将输入的FCB矢量原封不动地输出)其它模式截止频率=1kHz此时,如果通过如下(式3)所示的音调周期化处理将最终的FCB矢量的周期性增强的话,则该FCB矢量对于生成具有周期性的信号的情况有效。
c(n)=c(n)+βc(n-T)[n=T,T+1,...,L-1]...(式3)(其中,c(n)为FCB矢量,β为音调周期化增益系数,T为音调周期,L为子帧长度)将本实施方式所涉及的补偿帧生成单元安装在实施方式2所示的语音编码装置中,则如下。图10是表示本实施方式所涉及的语音解码装置内部的丢失帧屏蔽处理单元112的主要结构的方框图。此外,对于已经说明的方框附上相同的标记,并基本上省略其说明。
LPC生成单元136基于过去输入的解码LPC信息生成用于屏蔽处理的LPC参数、并将其经由切换开关124输出给合成滤波器109。作为用于屏蔽处理的LPC参数的生成方法,例如在AMR方式中使刚刚之前的LSP参数近似于平均的LSP参数后将其作为用于屏蔽处理的LSP参数,并将其变换为LPC参数作为用于屏蔽处理的LPC参数。此外,在帧的丢失持续较长时间(例如,3个或3个以上20ms的帧)时,也可以对LPC参数进行加权处理,由此扩展合成滤波器的带宽而进行白色化处理。假设LPC合成滤波器的传递系数为1/A(z)时,该加权表现为1/A(z/y),其中y的取值约为0.99至0.97,或者将该值作为初始值渐渐降低。此外,1/A(z)基于以下(式4)。
1/A(z)=1/(1+∑a(i)z-i) ...(式4)(其中,i=1,...,p(p为LPC分析阶数))音调周期生成单元131在由模式判定单元138的模式判定之后,生成音调周期。具体来讲,在AMR方式的12.2kbps模式时,将前一的正常子帧的解码音调周期(整数精确度)输出,作为丢失帧中的音调周期。也就是说,音调周期生成单元131具有存储解码音调的存储器,对每个子帧更新其值,在有差错时将该存储的值输出,作为屏蔽处理时的音调周期。此外,自适应码本106根据由音调周期生成单元131输出的该音调周期,生成相对应的ACB矢量。
FCB代码生成单元140将所生成的FCB代码经由切换开关127输出给固定码本107。
固定码本107将与FCB代码相对应的FCB矢量输出给FCB分量生成单元141。
零交叉率计算单元142得到由合成滤波器输出的合成信号,计算零交叉率并输出给模式判定单元138。在此,为了提取前一个音调周期的信号的特征(为了反映在时间上最接近的部分的特征),优选使用前一个音调周期计算零交叉率。
如上生成的各个参数分别被输出,具体来讲,用于屏蔽处理的ACB矢量经由切换开关123输出给乘法器110,用于屏蔽处理的ACB增益经由切换开关122输出给乘法器110,用于屏蔽处理的FCB矢量经由切换开关125输出给乘法器111,用于屏蔽处理的FCB增益经由切换开关126输出给乘法器111。
图11是表示模式判定单元138内部的主要结构的方框图。
模式判定单元138使用音调历史记录的分析结果、平滑音调增益、能量变化信息、零交叉率信息以及丢失帧的连续数目,进行模式判定。由于本发明的模式判定为用于屏蔽处理的判定,所以,在帧中进行一次(在从结束正常帧的解码处理之后到第一次进行使用模式信息的屏蔽处理为止的时间)即可,在本实施方式中为在第一子帧的音源解码处理的开头部分进行。
音调历史记录分析单元182在缓冲器中存储着有关过去的多个子帧的解码音调周期信息,根据过去的音调周期的变动的大小判定有声恒定性(voicedstationarity)。更具体来讲,在存储在缓冲器内的最大音调周期与最小音调周期之间的差在规定阈值(例如,最大音调周期的15%或10个采样(8kHz采样处理时))以内时,判定为有声恒定性较高。作为音调周期的缓冲器更新,如果存储着1个帧份的音调周期信息的话,则在一帧中进行一次(通常在帧处理的最后)即可,否则在每个子帧中进行一次(通常在子帧处理的最后)即可。所存储的音调周期的数目为之前4个子帧(20ms)左右。由于仅根据音调变化的大小进行判定,在倍音调错误(将音调误认为二分之一)或半音调错误(将音调误认为两倍)时不会判定为有声恒定,所以,不会出现因使用倍音调或半音调的信息进行屏蔽处理而发生的“语音变为假声”的现象。
平滑ACB增益计算单元183进行子帧间平滑处理,以便将解码ACB增益在子帧间的变动抑制到一定程度。例如,进行由下式所示的程度的平滑处理。
(平滑ACB增益)=0.7×(平滑ACB增益)+0.3×(解码ACB增益)在计算出的平滑ACB增益超过阈值(例如为0.7)时判定为有声性较高。
判定单元184除了上述参数之外,还使用能量变化信息和零交叉率信息进行模式判定。具体来讲,在音调历史记录分析结果表示有声恒定性较高、且平滑ACB增益的阈值处理的结果表示有声性较高、且能量变化为阈值以下(例如,小于2)、且零交叉率为阈值以下(例如,小于0.7)的情况下,判定为有声(有声恒定)模式,在零交叉率为阈值以上(例如,0.7或0.7以上)的情况下,判定为噪声(噪声性信号)模式,而在其它情况下判定为其它(上升、过渡)模式。
模式判定单元138在进行模式判定之后,根据当前帧为连续第几个丢失帧决定最终模式判定结果。具体来讲,到连续第二帧为止将上述模式判定结果作为最终模式判定结果,在为连续第三帧时,如果上述模式判定结果为有声模式的话,则改变为其它模式并且作为最终模式判定结果,而在连续第四帧以后则作为噪声模式。通过如上的最终模式判定结果,能够防止在突发帧丢失时(帧丢失连续了3帧或3帧以上时)发生蜂鸣声,并使解码信号随着时间得到自然的噪声化,由此能够缓和主观上的不适感。如果配置连续丢失帧数目计数器,以便在当前帧为正常帧时将计数值复位为0,否则每次将计数值加1的话,通过参照该计数器的值就能够判断为连续第几个丢失帧。此外,在AMR方式中具有状态机,所以参照状态机的状态即可。
如上所述,根据本实施方式,在有声部分的屏蔽处理时能够防止噪声感的发生,即使在刚刚之前的子帧的增益偶然成为较小值的情况下,也能够防止在屏蔽处理时发生断音。
另外,在上述结构中,由于模式判定单元138在解码端无需进行音调分析即可进行模式判定,所以在适用于不进行解码端的音调分析的编码解码器时,能够压缩运算量。
另外,在上述结构中,由于根据丢失帧的连续数目改变所附加的噪声的频带,所以能够抑制因屏蔽处理而发生的蜂鸣声。
(实施方式4)图12是表示将本发明所涉及的语音解码装置适用于无线通信系统时的无线发送装置300和与其相对应的无线接收装置310的主要结构的方框图。
无线发送装置300包括输入装置301、A/D变换装置302、语音编码装置303、信号处理装置304、RF调制装置305、发送装置306以及天线307。
A/D变换装置302的输入端子连接到输入装置301的输出端子。语音编码装置303的输入端子连接到A/D变换装置302的输出端子。信号处理装置304的输入端子连接到语音编码装置303的输出端子。RF调制装置305的输入端子连接到信号处理装置304的输出端子。发送装置306的输入端子连接到RF调制装置305的输出端子。天线307连接到发送装置306的输出端子。
输入装置301接收语音信号,将其变换成作为电信号的模拟语音信号,并将其提供给A/D变换装置302。A/D变换装置302将来自输入装置301的模拟语音信号变换成数字语音信号,并将其提供给语音编码装置303。语音编码装置303对来自A/D变换装置302的数字语音信号进行编码而生成语音编码比特流,并将其提供给信号处理装置304。信号处理装置304对来自语音编码装置303的语音编码比特流进行信道编码处理、分组化处理和发送缓冲处理等之后,将该语音编码比特流提供给RF调制装置305。RF调制装置305对来自信号处理装置304的经信道编码处理等的语音编码比特串的信号进行调制,并将其提供给发送装置306。发送装置306经由天线307,将来自RF调制装置305的经调制的语音编码信号作为电波(RF信号)发送出去。
在无线发送装置300中,对经由A/D变换装置302得到的数字语音信号,以几十ms的帧为单位进行处理。在构成系统的网络为分组网的情况下,将1个帧或几个帧的编码数据包装在1个分组中并将该分组发送给分组网。此外,上述网络为线路交换网的情况下,不需进行分组化处理和发送缓冲处理等。
无线接收装置310包括天线311、接收装置312、RF解调装置313、信号处理装置314、语音解码装置315、D/A变换装置316以及输出装置317。此外,作为语音解码装置315使用本实施方式所涉及的语音解码装置。
接收装置312的输入端子连接到天线311。RF解调装置313的输入端子连接到接收装置312的输出端子。信号处理装置314的输入端子连接到RF解调装置313的输出端子。语音解码装置315的输入端子连接到信号处理装置314的输出端子。D/A变换装置316的输入端子连接到语音解码装置315的输出端子。输出装置317的输入端子连接到D/A变换装置316的输出端子。
接收装置312经由天线311,接收包含语音编码信息的电波(RF信号)而生成作为模拟的电信号的接收语音编码信号,并将其提供给RF解调装置313。如果经由天线311接收到的电波(RF信号)在传播路径没有发生信号的衰减或噪声的重叠的话,则将为与从无线发送装置300发送的电波(RF信号)完全相同的信号。RF解调装置313对来自接收装置312的接收语音编码信号进行解调,并将其提供给信号处理装置314。信号处理装置314对来自RF解调装置313的接收语音编码信号进行抖动吸收缓冲处理、分组组合处理以及信道解码处理等,并将接收语音编码比特流提供给语音解码装置315。语音解码装置315对来自信号处理装置314的接收语音编码比特流进行解码处理而生成解码语音信号,并将其提供给D/A变换装置316。D/A变换装置316将来自语音解码装置315的数字解码语音信号变换成模拟解码语音信号,并将其提供给输出装置317。输出装置317将来自D/A变换装置316的模拟解码语音信号变换成空气的振动,并作为音波输出以便让人听到。
如上所述,根据本实施方式的语音解码装置可适用于无线通信系统中。此外,根据本实施方式的语音解码装置并不限用于无线通信系统中,例如,不言而喻也可以适用于有线通信系统中。
以上对本发明的各个实施方式进行了说明。
本发明所涉及的语音解码装置及补偿帧生成方法并不限于上述实施方式1至4,也可以进行各种各样的变形后实施之。
另外,本发明所涉及的语音解码装置、无线发送装置、无线接收装置以及补偿帧生成方法可以安装在移动通信系统中的通信终端装置以及基站装置,由此能够提供具有与以上说明同样的作用效果的通信终端装置、基站装置以及移动通信系统。
另外,本发明所涉及的语音解码装置也可以适用于有线通信系统中,由此能够提供具有与以上的说明同样的作用效果的有线通信系统。
另外,虽然在此以由硬件构成本发明的情况为例进行了说明,但本发明也可以由软件实现。例如,将本发明所涉及的补偿帧生成方法的算法使用编程语言记述,将该程序存储于存储器并让信息处理单元实行,由此能够实现与本发明所涉及的语音解码装置同样的功能。
另外,用于上述各实施方式的说明中的各功能模块,典型地由集成电路LSI来实现。这些即可以分别作成一个芯片,也可以包括其中一部分或者是全部而作成一个芯片。
另外,虽然在此称作LSI,但根据集成度的不同也可以称为IC、系统LSI、超LSI以及极大LSI等。
另外,集成电路化的技术并不限于LSI,也可以使用专用电路或通用处理器来实现。也可以利用制造LSI后可编程的现场可编程门阵列(FPGA),也可以利用可将LSI内部的电路块连接或设定重新配置的可重配置处理器(Reconfigurable Processor)。
再有,如果随着半导体技术的进步或者其他技术的派生,出现了替换LSI的集成电路技术,当然,也可以利用该技术来实现功能模块的集成化。也有应用生物工程学技术等的可能性。
本说明书基于2004年7月20日申请的日本专利申请特愿2004-212180号。其内容全部包括在此作为参考。
工业实用性本发明所涉及的语音解码装置及补偿帧生成方法,可以适用于移动通信系统等用途。
权利要求
1.一种语音解码装置,包括自适应码本,生成音源信号;计算单元,计算所述音源信号的子帧间的能量变化;决定单元,基于所述能量变化决定所述自适应码本的增益;以及生成单元,使用所述自适应码本的增益生成对于丢失帧的补偿帧。
2.如权利要求1所述的语音解码装置,还包括噪声化单元,对所述补偿帧的一部分频带进行噪声化处理。
3.如权利要求2所述的语音解码装置,其中,所述噪声化单元对所述补偿帧的高频带进行噪声化处理。
4.如权利要求2所述的语音解码装置,其中,所述噪声化单元根据所述丢失帧以前的帧的语音模式,决定进行噪声化处理的所述一部分频带。
5.如权利要求2所述的语音解码装置,其中,所述噪声化单元根据丢失帧的连续数目,将进行噪声化处理的所述一部分频带加宽。
6.一种通信终端装置,包括权利要求1所述的语音解码装置。
7.一种基站装置,包括权利要求1所述的语音解码装置。
8.一种补偿帧生成方法,包括计算步骤,计算由自适应码本生成的音源信号的子帧间的能量变化;决定步骤,根据所述能量变化决定所述自适应码本的增益;以及生成步骤,使用所述自适应码本的增益生成对于丢失帧的补偿帧。
全文摘要
提供一种语音解码装置,在丢失补偿处理中考虑过去信号的能量变化,从而能够提高解码信号的音质。在该装置中,能量变化计算单元(143),计算由自适应码本(106)输出的ACB矢量的最后一个音调周期长度的音源信号的平均能量。此外,能量变化计算单元(143)计算当前子帧与前一子帧的平均能量之比,并输出给ACB增益生成单元(135)。ACB增益生成单元(135)由过去解码出的ACB增益或由能量变化计算单元(143)输出的能量变化率信息中的任一个所定义的用于屏蔽处理的ACB增益输出给乘法器(132)。
文档编号G10L19/00GK1989548SQ20058002448
公开日2007年6月27日 申请日期2005年7月14日 优先权日2004年7月20日
发明者江原宏幸 申请人:松下电器产业株式会社

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:一种全息光栅显影过程实时监测电路的制作方法技术领域:本发明属于光电检测技术领域中涉及的一种全息光栅显影监测电路。技术背景-由于全息光栅具有独特的色散特性,在光谱仪器、测量、光学信息处 理和通讯等诸多领域具有广泛的应用。传统的全息光

    专利发布时间:2025-05-15阅读:(77)

    专利名称:防鼠啮咬室内布线光缆的制作方法技术领域:本发明涉及一种外观尺寸2x3醒的室内布线通信光缆,适用于FTTH末端布线的小尺寸光缆。背景技术:随着社会的飞速发展,人们对通信网络和信息传输的依赖性日益增加,通信网络正在向 大容量和高密度方

    专利发布时间:2025-05-15阅读:(81)

    专利名称:背框、背框的制造方法以及背光系统的制作方法技术领域:本发明涉及显示技术领域,特别是涉及一种平板显示装置的背框、背框的制造方法以及背光系统。背景技术:现有技术中液晶显示装置包括前框、面板以及背光模组,其中背光模组包括背框、 反射片、

    专利发布时间:2025-05-15阅读:(91)

    专利名称:具有微透镜图案和压纹图案的漫射膜的制作方法技术领域:本发明涉及用在背光单元中的光学膜,且更具体地涉及在其表面上具有微透镜图 案和压纹图案以提供聚集和漫射光功能的漫射膜。背景技术:通常,诸如液晶显示器等显示器系统包括在背光单元内起聚

    专利发布时间:2025-05-15阅读:(65)

    专利名称:防护地灯的制作方法技术领域:本实用新型涉及一种防护地灯受损的地灯。二背景技术:现有技术中的地灯,由于地灯的玻璃罩与地面在一平面上,很容易被损坏。三发明内容本实用新型的目的在于提供一种结构简单,能够解决以上缺陷防止损坏的防护地灯,其

    专利发布时间:2025-05-15阅读:(75)

    专利名称:面向目标的音频系统的制作方法技术领域:本发明通常涉及一种计算机系统的改进,特别是涉及一种用于在两个多媒体部件之间对音频信息进行路由选择的系统。本专利申请的部分内容受版权保护。版权所有者允许对出现在专利局的专利文献或记录中或专利公开

    专利发布时间:2025-05-15阅读:(74)