专利名称:音频解码器和音频解码方法
技术领域:
本发明涉及一种在对语音信号进行编码和传输的移动通信系统和包括因特网通信的分组通信系统中对以低比特率编码的语音信号进行解码的语音解码装置,特别涉及一种将语音信号分成频谱包络分量和残留分量来表示的CELP(Code Excited Linear Prediction,码激励线性预测)语音解码装置。
背景技术:
在数字移动通信、以因特网通信为典型的分组通信和语音存储的领域内,使用语音编码装置来高效编码,其中,语音编码装置压缩语音信息,从而有效使用无线信号传输路径和存储介质的容量。其中,基于CELP(码激励线性预测)的系统以中低比特率得到广泛的应用。CELP技术在M.R.Schroeder和B.S.Atal的“Code-Excited Linear Prediction(CELP)High-quality Speech atVery Low Bit Rates(码激励线性预测(CELP)比特率极低的高质量语音)”,Proc.ICASSP-85,25.1.1,937-940页,1985中有描述。
在CELP语音编码系统中,语音分为长度固定的帧(约5ms到50ms),对每帧执行线性预测分析,使用均由已知波形组成的自适应码向量和固定码向量对每帧的线性预测残留(激励信号)进行编码。自适应码向量从存储先前生成的激励向量的自适应码本中选择,并且固定码向量从存储预定数目的具有预定形状的预先准备的向量的固定码本中选择。使用随机向量和通过将多个脉冲排列在不同位置而生成的向量作为存储在固定码本中的固定码向量。
传统CELP编码装置使用输入数字信号,执行LPC(线性预测系数)的分析和量化、音调(pitch)搜索、固定码本搜索和增益码本搜索,并且将LPC码(L)、音调周期(A)、固定码本索引(F)和增益码本索引(G)传输到解码装置。
解码装置对LPC码(L)、音调周期(A)、固定码本索引(F)和增益码本索引(G)进行解码,并且根据解码结果,用激励信号驱动合成滤波器以获得解码语音。
然而,在传统语音解码装置中,通过区分平稳但不是噪声的信号如平稳元音与平稳噪声来检测平稳噪声区域是困难的。
发明内容
本发明的一个目的是提供一种语音解码装置,它准确地检测平稳噪声信号区域以对语音信号进行解码,具体地说,一种能够判定语音区域或非语音区域的语音解码装置和语音解码方法,使用音调周期和自适应码增益来区分周期平稳信号与平稳噪声信号如白噪声,并且准确检测平稳噪声信号区域。
该目的通过如下操作来实现临时判定解码信号的平稳噪声特性,然后根据临时判定结果和解码信号周期性的判定结果,判定当前处理单元是否为平稳噪声区域,区分包含平稳语音信号如平稳元音的解码信号与平稳噪声,并且正确检测平稳噪声区域。
图1是根据本发明第一实施例的平稳(stationary)噪声区域判定装置的结构图;图2是示出音调历史分组过程的流程图;图3是一个示出模式选择部分流程的图;图4是另一个示出模式选择部分流程的图;图5是根据本发明第二实施例的平稳噪声后处理装置的结构图;图6是根据本发明第三实施例的平稳噪声后处理装置的结构图;图7是示出根据本发明第四实施例的语音解码处理系统的图;图8是示出语音解码系统流程的流程图;图9是装备在语音解码系统中的存储器及其初始值的示例图;图10是模式判定处理的流程图;图11是平稳噪声添加处理的流程图;以及图12是调音(scaling)的流程图。
具体实施例方式
下面将参照附图对本发明的多个实施例进行描述。
(第一实施例)图1示出根据本发明第一实施例的平稳噪声区域判定装置的结构。
编码器(未示出)首先使用输入数字信号,执行LPC(线性预测系数)的分析和量化、音调搜索、固定码本搜索和增益码本搜索,并且传输LPC码(L)、音调周期(A)、固定码本索引(F)和增益码本索引(G)。
码接收装置100接收从编码器传输的编码信号,并且从接收信号中分离出表示LPC的码L、表示自适应码向量的码A、表示增益信息的码G和表示固定码向量的码F。分出的码L、码A、码G和码F输出到语音解码装置101。具体地说,码L输出到LPC解码器110,码A输出到自适应码本111,码G输出到增益码本112,并且码F输出到固定码本113。
首先将对语音解码装置101进行描述。
LPC解码器110从码L解码出LPC以输出到合成滤波器117。LPC解码器110将解码LPC转换为LSP(Line Spectrum Pairs,线谱对)参数,以采用它们更好的插值特性,并且将LSP输出到装备在平稳噪声区域检测装置102中的子帧间变化计算器119、距离计算器120和平均LSP计算器125。
通常,LPC是在LSP域内编码的,即码L是编码的LSP,并且在这种情况下,LPC解码器对LSP进行解码,然后将解码LSP转换为LPC。LSP参数是表示语音信号频谱包络分量的频谱包络参数的一个例子。频谱包络参数包括PARCOR系数或LPC。
装备在语音解码装置101中的自适应码本111更新先前生成的激励信号,以作为缓冲区进行临时存储,并且使用通过对输入码A进行解码而获得的自适应码本索引(音调周期(音调滞后))来生成自适应码向量。在自适应码本111中生成的自适应码向量在自适应码增益乘法器114中与自适应码增益进行相乘,然后输出到加法器116。在自适应码本111中获得的音调周期输出到装备在平稳噪声区域检测装置102中的音调历史分析器122。
增益码本112存储预设数目的自适应码本增益和固定码本增益的集合(增益向量),并且将自适应码本增益分量(自适应码增益)输出到自适应码增益乘法器114和第二判定器124,并且还将固定码本增益分量(固定码增益)输出到固定码增益乘法器115,其中,这些分量属于通过对输入码G进行解码而获得的增益码本索引所指定的增益向量。
固定码本113存储预定数目的具有不同形状的固定码向量,并且将通过对输入码F进行解码而获得的固定码本索引所指定的固定码向量输出到固定码增益乘法器115。固定码增益乘法器115将固定码向量与固定码增益相乘,以输出到加法器116。
加法器116相加从自适应码增益乘法器114输入的自适应码向量和从固定码增益乘法器115输入的固定码向量,以生成合成滤波器117的激励信号,并且将该信号输出到合成滤波器117和自适应码本111。
合成滤波器117使用从LPC解码器110输入的LPC,构造LPC合成滤波器。合成滤波器117使用从加法器116输入的激励信号作为输入,执行滤波处理,以合成解码语音信号,并且将合成的解码语音信号输出到后滤波器118。
后滤波器118执行如格式增强和音调增强的处理,以对从合成滤波器117输出的合成信号改善主观质量。经过处理的语音信号作为语音解码装置101的最终后滤波器输出信号输出到装备在平稳噪声区域检测装置102中的功率变化计算器123。
如上所述语音解码装置101的解码处理是按照预定时间的处理单元(数十毫秒的帧)或从帧划分的处理单元(子帧)来执行的。下面将描述按子帧执行处理的情况。
下面将对平稳噪声区域检测装置102进行描述。首先说明装备在平稳噪声区域检测装置102中的第一平稳噪声区域检测部分103。第一平稳噪声区域检测部分103和第二平稳噪声区域检测部分104执行模式选择,并且判定子帧(sub-frame)是平稳噪声区域还是语音信号区域。
从LPC解码器110输出的LSP输出到装备在平稳噪声区域检测装置102中的第一平稳噪声区域检测部分103和平稳噪声特性提取部分105。输入到第一平稳噪声区域检测部分103的LSP被输入到子帧间变化计算器119和距离计算器120。
子帧间变化计算器119从前一(上一)子帧计算LSP变化。具体地说,根据从LPC解码器110输入的LSP,计算器119对各阶计算当前子帧与上一子帧之间的LSP差值,并且将差值的平方和作为子帧间变化量输出到第一判定器121和第二判定器124。
另外,最好在计算变化量时使用LSP的平滑型式,以减小量化误差波动等的影响。强平滑导致子帧之间的变化太慢,因此将平滑设为弱。例如,当平滑LSP如(方程1)所示定义时,最好将k设为约0.7。
平滑LSP[当前子帧]=k×LSP+(1-k)×平滑LSP(上一子帧)...(方程1)
距离计算器120计算从平均LSP计算器125输入的先前平稳噪声区域的平均LSP与从LPC解码器110输入的当前子帧LSP之间的距离,并且将计算结果输出到第一判定器121。例如,距离计算器120对各阶计算从平均LSP计算器125输入的平均LSP与从LPC解码器110输入的当前子帧LSP之间的差值,作为平均LSP与当前子帧LSP之间的距离,并且输出差值平方和。距离计算器120可以输出对各阶算出的LSP差值,而不进行平方求和。此外,除这些值之外,距离计算器120可以输出对各阶算出的LSP差值中的最大值。因此,通过将各种距离测量结果输出到第一判定器121,可以提高第一判定器121的判定准确度。
根据从子帧间变化计算器119和距离计算器120输入的信息,第一判定器121判定子帧之间的LSP变化度和当前子帧的LSP与平稳噪声区域的平均LSP之间的相似度(距离)。具体地说,使用阈值处理来进行这些判定。当判定子帧之间的LSP变化小且当前子帧的LSP类似于平稳噪声区域的平均LSP(即距离小)时,判定当前子帧为平稳噪声区域。判定结果(第一判定结果)输出到第二判定器124。
以这种方式,第一判定器121临时判定当前子帧是否为平稳噪声区域。该判定是如下进行的根据上一子帧与当前子帧之间的LSP变化量判定当前子帧的平稳特征,并且还根据平均LSP与当前子帧的LSP之间的距离判定当前子帧的噪声特征。
然而,仅基于LSP的判定有时误判周期平稳信号如平稳元音或正弦波为噪声信号。因此,如下所述的装备在第二平稳噪声区域检测部分104中的第二判定器124分析当前子帧的周期性,并且根据分析结果,判定当前子帧是否为平稳噪声区域。换句话说,由于具有高周期性的信号是平稳元音等(即不是噪声)的可能性大,因此第二判定器124判定这种信号不是平稳噪声区域。
下面将对第二平稳噪声区域检测部分104进行描述。
音调历史分析器122分析从自适应码本输入的音调周期中的各子帧间的波动。具体地说,音调历史分析器122临时存储与预定数目的子帧(例如10个子帧)相对应的从自适应码本111输入的音调周期,并且通过图2所示的方法对临时存储的音调周期(最后十个子帧包括当前子帧的音调周期)执行分组。
将以对包括当前子帧的最后十个子帧的音调周期执行分组的情况为例对分组进行描述。图2是示出分组执行过程的流程图。首先,在ST1001,对音调周期进行分类。具体地说,具有相同值的音调周期分到同一类。换句话说,具有完全相同值的音调周期分到同一类,而即使是差值很小的音调周期也分到不同类。
下一步,在ST1002,在分出的类中,执行如下分组音调周期值接近的类分到同一组。例如,音调周期差值在1以内的类分到同一组。在执行分组中,当存在音调周期的相互差值在1以内的五个类(例如,音调周期分别为30、31、32、33和34的类)时,这五个类可以分到同一组。
在ST1003,作为分组结果,输出表示包括当前子帧的最后十个子帧的音调周期所属组数的分析结果。随着分析结果所表示的组数减小,解码语音信号是周期信号的可能性增大,而随着组数增大,解码语音信号不是周期信号的可能性增大。因此,当解码语音信号平稳时,可以使用分析结果作为表示周期平稳信号特征(平稳噪声的周期性)的参数。
功率变化计算器123接收从后滤波器118输入的后滤波器输出信号和从平均噪声功率计算器126输入的平稳噪声区域的平均功率信息作为其输入。功率变化计算器123获得从后滤波器118输入的后滤波器输出信号的功率,并且计算所获得的后滤波器输出信号功率与平稳噪声区域的平均功率之比(功率比)。功率比输出到第二判定器124和平均噪声功率计算器126。后滤波器输出信号的功率信息也输出到平均噪声功率计算器126。当从后滤波器118输出的后滤波器输出信号功率(当前信号功率)大于平稳噪声区域的平均功率时,存在当前子帧为语音区域的可能性。平稳噪声区域的平均功率与从后滤波器118输出的后滤波器输出信号的功率用作参数来检测例如使用其他参数检测不出的语音开始区域。另外,功率变化计算器123可以计算功率中的差值而不是后滤波器输出信号功率与平稳噪声区域平均功率之比来用作参数。
如上所述,音调历史分析器122中的音调历史分析结果(组数)和在增益码本112中获得的自适应码增益输入到第二判定器124。使用输入信息,第二判定器124判定后滤波器输出信号的周期性。第一判定器121中的第一判定结果、在功率变化计算器123中算出的当前子帧的功率与平稳噪声区域的平均功率之比、以及在子帧间变化计算器119中算出的子帧间的LSP变化量也输入到第二判定器124。根据输入信息、第一判定结果和上述周期性判定结果,第二判定器124判定当前子帧是否为平稳噪声区域,并且将判定结果输出到下游提供的处理装置。判定结果还输出到平均LSP计算器125和平均噪声功率计算器126。另外,可以向码接收装置100、语音解码装置101或平稳噪声区域检测装置102提供一个解码部分,它对包含在接收码中的表示状态是否为语音平稳状态的信息进行解码,并且将表示状态是否为语音平稳状态的信息输出到第二判定器124。
下面将对平稳噪声特性提取部分105进行描述。
平均LSP计算器125接收来自第二判定器124的判定结果和来自语音解码装置101(更具体地说,LPC解码器110)的当前子帧的LSP作为其输入。只有当判定结果表示平稳噪声区域时,平均LSP计算器125才使用所输入的当前子帧的LSP,更新平稳噪声区域的平均LSP。平均LSP例如使用AR平滑方程来更新。更新的平均LSP输出到距离计算器120。
平均噪声功率计算器126接收来自第二判定器124的判定结果和来自功率变化计算器123的后滤波器输出信号功率及功率比(后滤波器输出信号的功率/平稳噪声区域的平均功率)作为其输入。在来自第二判定器124的判定结果表示平稳噪声区域的情况下,并且在(判定结果不表示平稳噪声区域,但)功率比小于预定阈值(当前子帧的后滤波器输出信号的功率小于平稳噪声区域的平均功率)的情况下,平均噪声功率计算器126使用所输入的后滤波器输出信号的功率,更新平稳噪声区域的平均功率(平均噪声功率)。平均噪声功率例如使用AR平滑方程来更新。在这种情况下,通过增加随着功率比的降低减小平滑的控制(从而当前子帧的后滤波器输出信号功率趋向得到反映),即使当在语音区域内背景噪声电平快速降低时,也可以迅速降低平均噪声功率电平。更新的平均噪声功率输出到功率变化计算器123。
在上述结构中,LPC、LSP和平均LSP是表示语音信号的频谱包络分量的参数,而自适应码向量、噪声码向量、自适应码增益和噪声码增益是表示语音信号的残留分量的参数。表示频谱包络分量的参数和表示残留分量的参数不限于上述信息。
下面将参照图3和4描述第一判定器121、第二判定器124和平稳噪声特性提取部分105中的处理过程。在图3和4中,ST1101到ST1107的处理在原理上是在第一平稳噪声区域检测部分103中执行的,ST1108到ST1117的处理在原理上是在第二平稳噪声区域检测部分104中执行的,并且ST1118到ST1120的处理在原理上是在平稳噪声特性提取部分105中执行的。
在ST1101,计算当前子帧的LSP,并且算出的LSP如前所述经过如方程(1)所示的平滑处理。在ST1102,计算当前子帧与上一(前一)子帧之间的LSP差值(变化量)。ST1101和ST1102的处理是在如前所述的子帧间变化计算器119中执行的。
在子帧间变化计算器119中计算LSP变化量的方法的一个例子如(方程1′)、(方程2)和(方程3)所示。(方程1′)是对当前子帧的LSP执行平滑处理的方程。(方程2)是计算子帧间经过平滑处理的LSP的差值的平方和的方程,并且(方程3)是进一步对子帧间的LSP差值的平方和执行平滑处理的方程。L′i(t)表示第t子帧的第i阶平滑LSP参数,Li(t)表示第t子帧的第i阶LSP参数,DL(t)表示第t子帧的LSP变化量(子帧间差值的平方和),DL′(t)表示第t子帧的LSP变化量的平滑型式,并且p表示LSP(LPC)的分析阶数。在本例中,子帧间变化计算器119使用(方程1′)、(方程2)和(方程3)获得DL′(t),并且所获得的DL′(t)用作模式判定中的子帧间的LSP变化量。
L′i(t)=0.7×Li(t)+0.3×L′i(t-1)...(方程1′)DL(t)=Σi=1p{[L′i(t)-L′i(t-1)]2}]]>...(方程2)DL′(t)=0.1×DL(t)+0.9×DL′(t-1)...(方程3)在ST113,距离计算器120计算当前子帧的LSP与先前噪声区域的平均LSP之间的距离。(方程4)和(方程5)表示距离计算器120中的距离计算的一个特定例子。(方程4)定义先前噪声区域的平均LSP与当前子帧的LSP之间的距离为所有阶的差值的平方和,并且(方程5)定义该距离为仅仅差值最大的那阶的差值的平方。LNi表示先前噪声区域的平均LSP,并且例如按子帧使用(方程6)来在噪声区域中更新。在本例中,距离计算器120使用(方程4)、(方程5)和(方程6)获得D(t)和DX(t),并且所获得的D(t)和DX(t)用作模式判定中的与平稳噪声区域的LSP的距离的信息。
D(t)=Σi=1p{[Li(t)-LNi]2}]]>...(方程4)DX(t)=Max{[Li(t)-LNi]2}i=1,...,p ...(方程5)LNi=0.95×LNi+0.05×Li(t)...(方程6)在ST1104,功率变化计算器123计算后滤波器输出信号(来自后滤波器118的输出信号)的功率。功率计算是在如前所述的功率变化计算器123中执行的,并且更具体地说,使用例如(方程7)来获得功率。在方程(7)中,S(i)是后滤波器输出信号,并且N是子帧的长度。由于ST1104中的功率计算是在如图1所示的装备在第二平稳噪声区域检测部分104中的功率变化计算器123中执行的,因此仅需要在ST1108之前执行功率计算,并且功率计算的定时不限于ST1104的位置。
P={Σi-0N[S(i)×S(i)]}]]>...(方程7)在ST1105,对解码信号的平稳噪声特性进行判定。具体地说,判定是否在ST1102算出的变化量为小值且在ST1103算出的距离为小值。换句话说,分别对在ST1102算出的变化量在ST1103算出的距离设置阈值,并且当在ST1102算出的变化量小于设定阈值并且在ST1103算出的距离也小于设定阈值时,平稳噪声特性高,并且处理流程转到ST1107。例如,对于如前所述的DL′D和DX,当LSP标准化到0.0到1.0的范围内时,使用如下所述的阈值能够以高准确度进行判定。
DL的阈值0.0004D的阈值0.003+D′DX的阈值0.0015D′是噪声区域中D的平均值,并且例如在噪声区域中使用方程(8)来计算。
D′=0.05×D(t)+0.95×D′ ...(方程8)由于只有当可获得具有相当足够时间的噪声区域(例如,对应于约20个子帧)时,作为先前噪声区域中的平均LSP的LNi才具有足够可靠的值,当先前噪声区域小于预定时间长度(例如,20个子帧)时,在ST1005对平稳噪声特性进行判定不使用D和DX。
在ST1107,判定当前子帧为平稳噪声区域,并且处理流程转到ST1108。同时,当在ST1102算出的变化量或者在ST1103算出的距离大于阈值时,判定当前子帧具有低平稳特征,并且处理流程转到ST1106。在ST1106,判定该子帧不是平稳噪声区域(换句话说,语音区域),并且处理流程转到ST1110。
在ST1108,判定当前子帧的功率是否大于先前平稳噪声区域的平均功率。具体地说,对功率变化计算器123的输出结果(后滤波器输出信号功率与平稳噪声区域的平均功率之比)设置阈值,并且当后滤波器输出信号功率与平稳噪声区域的平均功率之比大于设定阈值时,处理流程转到ST1109,并且在ST1109,纠正当前子帧的判定为语音区域。
使用2.0作为特定阈值(即,当使用(方程7)获得的后滤波器输出信号功率P超过在噪声区域中获得的平稳噪声区域的平均功率PN′的两倍时,处理流程转到ST1109,例如使用(方程9)对平稳噪声区域期间的每个子帧更新平均功率PN′)能够以高准确度进行判定。
PN′=0.9×PN′+0.1×P ...(方程9)同时,在功率变化小于设定阈值的情况下,处理流程转到ST1112。在这种情况下,保持ST1107的判定结果,仍判定当前子帧为平稳噪声区域。
下一步,在ST1110,检查平稳状态持续多久以及平稳状态是否为平稳浊音(voiced speech)。然后,如果当前子帧不是平稳浊音并且平稳状态已持续预定时长,则处理流程转到ST1111,并且在ST1111,重新判定当前子帧为平稳噪声区域。
具体地说,使用子帧间变化计算器119的输出(子帧间变化量),判定当前子帧是否处于平稳状态。换句话说,当在ST1102获得的子帧间变化量小(小于预定阈值(例如,与在ST1105使用的阈值相同的值))时,判定当前子帧为平稳状态。因此,当判定平稳噪声状态时,检查该状态已持续多久。
根据从平稳噪声区域检测装置102提供的表示当前子帧是否为平稳浊音的信息,检查当前子帧是否为平稳浊音。例如,当传输码信息包括如模式信息的信息时,使用解码模式信息,检查当前子帧是否为平稳浊音。否则,由装备在平稳噪声区域检测装置102中的语音平稳特征判定部分输出该信息,并且使用该信息,检查平稳浊音。
作为检查结果,在平稳状态已持续预定时长(例如,20个子帧或更多)并且不是平稳浊音的情况下,即使在ST1108判定功率变化大,也在ST1111重新判定当前子帧为平稳噪声区域,并且处理流程转到ST1112。另一方面,当ST1110的判定结果为“否”(语音平稳区域的情况或者平稳状态尚未持续预定时长的情况)时,保持当前子帧是语音区域的判定结果,并且处理流程转到ST1114。
下一步,当在直到此点的处理中判定当前子帧为平稳噪声区域时,在ST1112判定解码信号的周期性是否高。具体地说,根据从语音解码装置101(更具体地说,增益码本112)输入的自适应码增益和从音调历史分析器122输入的音调历史分析结果,第二判定器124判定当前子帧中的解码信号的周期性。在这种情况下,作为自适应码增益,最好使用平滑型式,从而使子帧间的变化平滑。
周期性判定如下进行例如,对平滑自适应码增益设置阈值,并且当平滑自适应码增益超过预定阈值时,判定周期性高并且处理流程转到ST1113。在ST1113,重新判定当前子帧为语音区域。
此外,由于音调历史分析结果中先前子帧的音调周期所属的组数越少,周期信号持续的可能性就越高,因此根据组数判定周期性。例如,如果前十个子帧的音调周期分成三组或更少,则由于周期信号持续区域的可能性高,因此处理流程转到ST1113,并且重新判定当前子帧为语音区域(不是平稳噪声区域)。
当ST1112的判定结果表示“否”(平滑自适应码增益小于预定阈值,并且在音调历史分析结果中先前音调周期分成很多组)时,则保持表示平稳噪声区域的判定结果,并且处理流程转到ST1115。
当在直到此点的处理中判定结果表示语音区域时,处理流程转到ST1114,并且对残余计数器(hangover counter)设置预定数目的残余子帧(hangover subframe)(例如,10)。对残余计数器设置残余帧数作为初始值,并且每当根据ST1101到ST1113的处理判定平稳噪声区域时减1。然后,当残余计数器为“0”时,在判定平稳噪声区域的方法中最终判定当前子帧为平稳噪声区域。
当在直到此点的处理中判定结果表示噪声平稳区域时,处理流程转到ST1115,并且检查残余计数器是否在残余范围(“1”到“残余帧数”)内。换句话说,检查残余计数器是否为“0”。当残余计数器在残余范围(“1”到“残余帧数”的范围)内时,处理流程转到ST1116,其中,纠正判定结果为语音区域,并且处理流程转到ST1117。在ST1117,残余计数器减1。当计数器不在残余范围内(为“0”)时,保持表示平稳噪声区域的判定结果,并且处理流程转到ST1118。
当判定结果表示平稳噪声区域时,在ST1118,平均LSP计算器125更新平稳噪声区域的平均LSP。当判定结果表示平稳噪声区域时,例如使用(方程6)执行更新,而当判定结果不表示平稳噪声区域时,保持先前值而不进行更新。另外,当先前判定为平稳噪声区域的时时间期间短时,则可以减小(方程6)中的平滑系数0.95。
在ST1119,平均噪声功率计算器126更新平均噪声功率。当判定结果表示平稳噪声区域时,例如使用(方程9)执行更新,而当判定结果不表示平稳噪声区域时,保持先前值而不进行更新。然而,当判定结果不表示平稳噪声区域,但当前后滤波器输出功率的功率小于平均噪声功率时,除了小于0.9从而减小平均噪声功率的平滑系数,使用与方程(9)相同的方程来更新平均噪声功率。通过执行这种更新,可以处理在语音区域期间背景噪声电平突然减小的情况。
最后,在ST1120,第二判定器124输出判定结果,平均LSP计算器125输出更新的平均LSP,并且平均噪声功率计算器126输出更新的平均噪声功率。
如上所述,根据本实施例,即使当通过使用LSP判决平稳特征来判定当前子帧为平稳噪声区域时,也使用自适应码增益和音调周期检查(判定)当前子帧的周期性程度,并且根据周期性程度,检查当前子帧是否为平稳噪声区域。因此,可以准确判定平稳但不是噪声的信号如正弦波和平稳元音。
(第二实施例)
图5示出根据本发明第二实施例的平稳噪声后处理装置的结构。在图5中,与图1相同的部分分配有与图1相同的标号,并且省略其特定描述。
平稳噪声后处理装置200包括噪声生成部分201、加法器202和调音部分203。平稳噪声后处理装置200在加法器202中相加在噪声生成部分201中生成的伪平稳噪声信号和来自语音解码装置101的后滤波器输出信号,在调音部分203中对经过相加的后滤波器输出信号执行调音以调整功率,并且输出经过后处理的后滤波器输出信号。
噪声生成部分201包括激励生成器210、合成滤波器211、LSP/LPC转换器212、乘法器213、乘法器214以及增益调整器215。调音部分203包括调音系数计算器216、子帧间平滑器217、样本间平滑器218以及乘法器219。
下面将描述具有上述结构的平稳噪声后处理装置200的操作。
激励生成器210从装备在语音解码装置101中的固定码本113内随机选择一个固定码向量,并且根据所选固定码向量,生成噪声激励信号,然后输出到合成滤波器211。生成噪声激励信号的方法不限于根据从装备在语音解码装置101中的固定码本113内选择一个固定码向量来生成信号的方法,但是可以为各系统确定在计算量、存储量以及所生成噪声信号的特性这些方面评定为最有效的方法。通常,从装备在语音解码装置101中的固定码本113内选择固定码向量是最有效的。LSP/LPC转换器212将来自平均LSP计算器125的平均LSP转换为LPC,然后输出到合成滤波器211。
合成滤波器211使用从LSP/LPC转换器212输入的LPC,构造LPC合成滤波器。合成滤波器211使用从激励生成器210输入的噪声激励信号作为其输入,执行滤波处理,以合成噪声信号,并且将合成噪声信号输出到乘法器213和增益调整器215。
增益调整器215计算增益调整系数以将合成滤波器211的输出信号的功率放大到来自平均噪声功率计算器126的平均噪声功率。增益调整系数经过平滑处理,从而在子帧之间保持平滑连续性,并且还经过每个样本的平滑处理,从而还在子帧内保持平滑连续性。最后,每个样本的增益调整系数输出到乘法器213。具体地说,根据(方程10)到(方程12)获得增益调整系数。Psn是在合成滤波器211中合成的噪声信号的功率(以与方程(7)相同的方式获得),并且Psn′通过在子帧之间对Psn执行平滑处理来获得,并且使用方程(10)更新。PN′是在(方程9)中获得的平稳噪声信号的功率,并且Scl是处理帧的调音系数。Scl′是对每个样本采用的增益调整系数,并且使用(方程12)对每个样本更新。
Psn′=0.9×Psn′+0.1×Psn...(方程10)Scl=PN′/Psn′ ...(方程11)Scl′=0.85×Scl′+0.15×Scl ...(方程12)乘法器213将从增益调整器215输入的增益调整系数与从合成滤波器211输出的噪声信号相乘。增益调整系数是针对每个样本的变量。相乘结果输出到乘法器214。
为了调整所要生成的噪声信号的绝对电平,乘法器214将预定常数(例如,约0.5)与来自乘法器213的输出信号相乘。乘法器214可以包括在乘法器213中。经过电平调整的信号(平稳噪声信号)输出到加法器202。如上所述,生成保持平滑连续性的平稳噪声信号。
加法器202将在噪声生成部分201中生成的平稳噪声信号加到从语音解码装置101(更具体地说,后滤波器118)输出的后滤波器输出信号,然后输出到调音部分203(更具体地说,调音系数计算器216和乘法器219)。
调音系数计算器216计算从语音解码装置101(更具体地说,后滤波器118)输出的后滤波器输出信号的功率以及从加法器202输出的加有平稳噪声信号的后滤波器输出信号的功率,计算这两个功率之比,从而计算调音系数,以减小调音信号与解码信号(尚未加有平稳噪声)之间的功率变化,然后输出到子帧间平滑器217。具体地说,如(方程13)所示获得调音系数SCALE。P是后滤波器输出信号的功率,并且通过(方程7)获得,并且P′是加有平稳噪声信号的后滤波器输出信号的功率,并且通过与P相同的方程获得。
SCALE=P/P′ ...(方程13)子帧间平滑器217对调音系数执行子帧间平滑处理,从而平滑系数在子帧之间缓和变化。在语音区域内不执行这种平滑(或者执行极弱的平滑)。当前子帧是否为语音区域根据从如图1所示的第二判定器124输出的判定结果来判定。平滑调音系数输出到样本间平滑器218。平滑调音系数SCALE′用(方程14)更新。
SCALE′=0.9×SCALE′+0.1×SCALE ...(方程14)样本间平滑器218对调音系数执行样本间平滑处理,从而经过子帧间平滑的调音系数在样本之间缓和变化。平滑处理可以通过AR平滑处理来执行。具体地说,每个样本的平滑调音系数SCALE″用(方程15)更新。
SCALE″=0.85×SCALE″+0.15×SCALE′ ...(方程15)这样,调音系数经过样本间平滑处理,因此对每个样本缓和地变化,从而可以防止调音系数在子帧之间的边界附近不连续。对每个样本算出的调音系数输出到乘法器219。
乘法器219将从样本间平滑器218输出的调音系数与从加法器202输入的加有平稳噪声信号的后滤波器输出信号相乘,然后作为最终输出信号进行输出。
在上述结构中,从平均噪声功率计算器126输出的平均噪声功率、从LSP/LPC转换器212输出的LPC、和从调音计算器216输出的调音系数是用于执行后处理的参数。
因此,根据本实施例,在噪声生成部分201中生成的噪声加到解码信号(后滤波器输出信号),然后调音部分203执行调音。这样,由于加有噪声的解码信号的功率经过调音,因此可以使加有噪声的解码信号的功率等于尚未加有噪声的解码信号的功率。此外,由于使用帧间平滑和样本间平滑两者,因此平稳噪声变得更加平滑,并且可以改善主观平稳噪声的质量。
(第三实施例)图6示出根据本发明第三实施例的平稳噪声后处理装置的结构。在图6中,与图5相同的部分分配有与图5相同的标号,并且省略其特定描述。
该装置包括如图2所示的平稳噪声后处理装置200的结构,并且还提供存储当帧被删除时生成噪声信号和调音所需的参数的存储器、帧删除消隐处理控制部分以及用于帧删除消隐处理的开关。
平稳噪声后处理装置300包括噪声生成部分301、加法器202、调音部分303以及帧删除消隐处理控制部分304。
噪声生成部分301包括如图5所示的噪声生成部分201的结构,并且还提供存储器310和311,存储当帧被删除时生成噪声信号和调音所需的参数;以及开关313和314,在帧删除消隐处理中闭合/断开。调音部分303包括存储器312,存储当帧被删除时生成噪声信号和调音所需的参数;以及开关315,在帧删除消隐处理中闭合/断开。
下面将描述平稳噪声后处理装置300的操作。首先,说明噪声生成部分301的操作。
存储器310存储通过开关313从平均噪声功率计算器126输出的平稳噪声信号功率(平均噪声功率),以输出到增益调整器215。
开关313根据来自帧删除消隐处理控制部分304的控制信号而闭合/断开。具体地说,开关313在输入指示执行帧删除消隐处理的控制信号的情况下断开,而在其他情况下闭合。当开关313断开时,存储器310存储上一子帧的平稳噪声信号的功率,并且在需要时将上一子帧的平稳噪声信号的功率输出到增益调整器215,直到开关313再次闭合。
存储器311存储通过开关314从LSP/LPC转换器212输出的平稳噪声信号的LPC,以输出到合成滤波器211。
开关314根据来自帧删除消隐处理控制部分304的控制信号而闭合/断开。具体地说,开关314在输入指示执行帧删除消隐处理的控制信号的情况下断开,而在其他情况下闭合。当开关314断开时,存储器311存储上一子帧的平稳噪声信号的LPC,并且在需要时将上一子帧的平稳噪声信号的LPC输出到合成滤波器211,直到开关314再次闭合。
下面将对调音部分303的操作进行描述。
存储器312存储在调音系数计算部分216中算出并且通过开关315输出的调音系数,并且将该系数输出到子帧间平滑器217。
开关315根据来自帧删除消隐处理控制部分304的控制信号而闭合/断开。具体地说,开关315在输入指示执行帧删除消隐处理的控制信号的情况下断开,而在其他情况下闭合。当开关315断开时,存储器312存储上一子帧的调音系数,并且在需要时将上一子帧的调音系数输出到子帧间平滑器217,直到开关315再次闭合。
帧删除消隐处理控制部分304接收通过错误检测等而获得的帧删除指示作为其输入,并且在被删除帧内的子帧和被删除帧之后从错误恢复的子帧(错误恢复帧)中将指示执行帧删除消隐处理的控制信号输出到开关313到315。存在在多个子帧(例如,两个子帧)中执行错误恢复子帧的帧删除消隐处理的情况。帧删除消隐处理是用来当部分子帧丢失信息时,通过使用被删除帧之前的帧(前一帧)的信息来防止解码结果质量恶化。另外,当在被删除帧之后的错误恢复子帧中毫不发生极端功率衰减时,不需要在错误恢复子帧中执行帧删除消隐处理。
在通常使用的帧删除消隐方法中,使用先前接收的信息推断当前帧。在这种情况下,由于推断数据使主观质量发生恶化,因此缓和减弱信号功率。然而,当帧删除发生在平稳噪声区域内时,有时会出现因功率减弱导致的信号不连续而产生的客观质量恶化大于因推断导致的失真而产生的主观质量恶化。特别,在以因特网通信为典型的分组通信中,帧有时被连续删除,并且由于信号不连续而产生的恶化往往是显著的。为了避免因信号不连续而导致的质量恶化,在本发明的平稳噪声后处理装置中,增益调整器215计算要与平稳噪声信号相乘的增益调整系数,以将其放大到来自平均噪声功率计算器126的平均噪声功率。此外,调音系数计算器216计算调音系数,以使加有后滤波器输出信号的平稳噪声信号的功率变化不大,并且输出乘以调音系数之后的信号作为最终输出信号。这样,可以将最终输出信号的功率变化抑制到一个小电平,并且保持在帧删除之前获得的平稳噪声信号电平,从而可以抑制由于声音信号不连续而产生的主观质量恶化。
(第四实施例)图7是根据本发明第四实施例的语音解码处理系统的结构图。语音解码处理系统包括在第一实施例中说明的码接收装置100、语音解码装置101和平稳噪声区域检测装置102以及在第三实施例中说明的平稳噪声后处理装置300。另外,代替平稳噪声后处理装置300,语音解码处理系统可以具有在第二实施例中说明的平稳噪声后处理装置200。
下面将描述语音解码处理系统的操作。每个结构单元的特定描述已参照图1、图5和图6在第一到第三实施例中给出,因此在图7中,与图1、图5和图6相同的部分分别分配有与图1、图5和图6相同的标号,并且省略其特定描述。
码接收装置100从传输路径接收编码信号,并且分出各种参数以输出到语音解码装置101。语音解码装置101从各种参数对语音信号进行解码,并且将在解码处理期间获得的后滤波器输出信号和所需参数输出到平稳噪声区域检测装置102和平稳噪声后处理装置300。平稳噪声区域检测装置102使用从语音解码装置101输入的信息,判定当前子帧为平稳噪声区域,并且将在判定处理期间获得的判定结果和所需参数输出到平稳噪声后处理装置300。
对于从语音解码装置101输入的后滤波器输出信号,平稳噪声后处理装置300使用从语音解码装置101输入的各种参数信息和从平稳噪声区域检测装置102输入的各种参数信息,执行生成平稳噪声信号的处理以复用于后滤波器输出信号,并且输出处理结果作为最终后滤波器输出信号。
图8是示出根据本实施例的语音解码系统处理流程的流程图。图8仅示出如图7所示的平稳噪声区域检测装置102和平稳噪声后处理装置300的处理流程,而省略码接收装置100和语音解码装置101的处理,因为该处理可以通过通常使用的公知技术来实现。下面将参照图8描述该系统中语音解码装置101之后的处理操作。首先在ST501,在根据本实施例的语音解码系统中初始化存储在存储器中的各种变量。图9示出要初始化的存储器和初始值的例子。
下一步,循环执行ST502到ST505的处理。执行该处理直到语音解码装置101不输出后滤波器输出信号(语音解码装置101停止处理)。在ST502,进行模式判定,并且判定当前子帧是否为平稳噪声区域(平稳噪声模式)或语音区域(语音模式)。ST502的处理流程将在后面具体说明。
在ST503,平稳噪声后处理装置300执行平稳噪声添加处理(平稳噪声后处理)。在ST503执行的平稳噪声后处理流程将在后面具体说明。在ST504,调音部分303执行最终调音处理。在ST504执行的调音处理流程将在后面具体说明。
在ST505,检查子帧是否为最后一个,以判定是结束还是继续ST502到ST505的循环处理。执行循环处理,直到语音解码装置101不输出后滤波器输出信号(语音解码装置101停止处理)。当循环处理结束时,根据本实施例的语音解码系统中的处理全部完成。
下面将参照图10描述ST502的模式判定处理流程。首先,在ST701,检查当前子帧是否属于被删除帧。
如果当前子帧属于被删除帧,则处理流程进入ST702,其中,将用于帧删除消隐处理的残余计数器设为预定值(在此,假定为“3”),然后进入ST704。残余计数器所设的预定值对应于在发生帧删除之后即使当子帧成功(未发生帧删除)时也连续执行帧删除消隐处理的帧数。
如果当前子帧不属于被删除帧,则处理流程进入ST703,并且检查用于帧删除消隐处理的残余计数器的值是否为0。作为检测结果,当用于帧删除消隐处理的残余计数器的值不为0时,用于帧删除消隐处理的残余计数器的值减1,并且处理流程进入ST704。
在ST704,判定是否执行帧删除消隐处理。如果当前子帧既不属于被删除帧,也不是紧接在被删除帧之后的残余区域,则判定不执行帧删除消隐处理,并且处理流程进入ST705。如果当前子帧属于被删除帧或者是紧接在被删除帧之后的残余区域,则判定执行帧删除消隐处理,并且处理流程进入ST707。
在ST705,计算平滑自适应码增益,并且如第一实施例所示执行音调历史分析。由于该处理已在第一实施例中示出,因此略去其描述。另外,音调历史分析的处理流程已参照图2作过说明。在执行该处理之后,处理流程进入ST706。在ST706,执行模式选择。模式选择流程已参照图3和4作过具体说明。在ST708,在ST706算出的平稳噪声区域的平均LSP被转换为LPC。ST708的处理可以不在ST706之后执行,并且只需要在ST503生成平稳噪声信号之前执行。
当在ST704判定执行帧删除消隐处理时,在ST707设置分别重复使用上一子帧的平稳噪声区域的平均LPC和模式作为当前子帧的平均LPC和模式,并且处理流程进入ST709。
在ST709,将表示当前子帧的模式信息(表示当前子帧是平稳噪声模式还是语音信号模式的信息)和当前子帧的平稳噪声区域的平均LPC存储在存储器中。另外,在本实施例中不需要总是将当前模式信息存储在存储器中,而是当在另一个块(例如,语音解码装置101)中使用模式判定结果时,才需要存储当前模式信息。如上所述,ST502的模式判定处理完成。
下面将参照图11描述ST503的平稳噪声添加处理的流程。首先在ST801,激励生成器210生成随机向量。可以使用任一生成随机向量的方法,但是如第二实施例所示的方法是有效的,其中,从装备在语音解码装置101中的固定码本113内随机选择一个随机向量。
在ST802,使用在ST801生成的随机向量作为激励,执行LPC合成滤波处理。在ST803,在ST802合成的噪声信号经过频带限制滤波处理,从而使噪声信号的带宽适于从语音解码装置101输出的解码信号的带宽。需要注意,该处理不是强制性的。在ST804,计算在ST803获得的经过频带限制的合成噪声信号的功率。
在ST805,对在ST804获得的信号功率执行平滑处理。平滑可以容易地通过在连续帧中执行如(方程1)所示的AR处理来执行。平滑系数k根据平稳信号所需的平滑程度来确定。最好执行约为0.05到0.2的相对强的平滑。具体地说,使用(方程10)。
在ST806,计算所要生成的平稳噪声信号的功率(已经在ST1118算出)与在ST805获得的经过子帧间平滑的信号功率之比作为增益调整系数(方程11)。算出的增益调整系数对每个样本经过平滑处理(方程12),并且与经过ST803的频带限制滤波处理的合成噪声信号相乘。乘以增益调整系数之后的平稳噪声信号与预定常数(固定增益)相乘。与固定增益相乘是为了调整平稳噪声信号的绝对电平。
在ST807,把在ST806生成的合成噪声信号加到从语音解码装置101输出的后滤波器输出信号,并且计算加有噪声信号的后滤波器输出信号的功率。
在ST808,计算从语音解码装置101输出的后滤波器输出信号的功率与在ST807算出的功率之比作为调音系数(方程13)。调音系数用于在平稳噪声添加处理的下游执行的ST504中的调音处理。
最后,加法器202相加在ST806生成的合成噪声信号与从语音解码装置101输出的后滤波器输出信号。需要注意,该处理可以包括在ST807中,并且在其中执行。这样,ST503的平稳噪声添加处理完成。
下面将参照图12描述ST504的调音流程。首先在ST901,检查当前子帧是否为帧删除消隐处理的目标子帧。如果当前子帧是帧删除消隐处理的目标子帧,则处理流程进入ST902,而如果当前子帧不是目标子帧,则流程进入ST903。
在ST902,执行帧删除消隐处理。换句话说,设置重复使用上一子帧的调音系数作为当前调音系数,并且处理流程进入ST903。
在ST903,使用从平稳噪声区域检测装置102输出的判定结果,检查模式是否为平稳噪声模式。当模式是平稳噪声模式时,处理流程进入ST904,而当模式不是平稳噪声模式时,处理流程进入ST905。
在ST904,使用如前所述的方程(1),对调音系数执行子帧间平滑处理。在这种情况下,k值设为约0.1。具体地说,使用如(方程14)的方程。在平稳噪声区域内执行在子帧之间平滑功率变化的处理。在执行平滑处理之后,处理流程进入ST905。
在ST905,逐样本地对调音系数进行平滑,并且将平滑过的调音系数与在ST502生成的加有平稳噪声的后滤波器输出信号相乘。每个样本的平滑也使用(方程1)来执行,并且在这种情况下,k值设为约0.15。具体地说,使用如(方程15)的方程。如上所述,ST504的调音处理完成,从而获得混有平稳噪声的调音后滤波器输出信号。
在上述各个实施例中,使用由方程(1)等表示的方程来计算平滑和平均值,但是用于平滑的方程不限于此方程。例如,可以使用预定先前区域的平均值。
本发明不限于上述第一到第四实施例,并且能够以其各种变型进行实施。例如,本发明的平稳噪声区域检测装置可应用于任何类型的解码器。
本发明不限于上述第一到第四实施例,并且能够以其各种变型进行实施。例如,上述实施例描述了本发明实现为语音解码装置的情况,但是它们不限于这些情况。语音解码方法可以作为软件来实现。
例如,执行如上所述语音解码方法的程序可以预先存储在ROM(ReadOnly Memory,只读存储器)中,并且该程序可以由CPU(Central Processor Unit,中央处理单元)来执行。
此外,可以将执行如上所述语音解码方法的程序存储在计算机可读存储介质中,然后将存储在存储介质中的程序存储在RAM(Random AccessMemory,随机访问存储器)中,并且根据程序运行计算机。
从上面描述可以清楚,根据本发明,使用自适应码增益和音调周期判定解码信号的周期性程度,并且根据周期性程度,判定子帧为平稳噪声区域。因此,可以准确地对平稳但不是噪声的信号如正弦波和平稳元音判定信号状态。
本申请基于2000年11月30日提交的日本专利申请2000-366342号,在此将其全文引作参考。
工业应用性本发明适用于对语音信号进行编码和传输的移动通信系统、包括因特网通信的分组通信系统以及语音解码装置。
权利要求
1.一种语音解码装置,包括第一解码部分,对编码信号进行解码,以获得至少一种表示语音信号的频谱包络分量的第一参数;第二解码部分,对编码信号进行解码,以获得至少一种表示语音信号的残留分量的第二参数;合成部分,根据第一参数构造合成滤波器,并且使用根据第二参数生成的激励信号驱动合成滤波器以生成解码信号;第一判定部分,根据第一参数判定解码信号的平稳噪声特性;以及第二判定部分,根据第二参数判定解码信号的周期性,并且根据周期性判定结果、第一判定部分中的平稳噪声特性判定结果、以及第一参数,进一步判定解码信号是否为平稳噪声区域。
2.如权利要求1所述的语音解码装置,其中,第二参数至少包括音调周期,并且根据处理单元之间的音调周期的变化,第二判定部分判定解码信号的周期性。
3.如权利要求1所述的语音解码装置,其中,第二参数至少包括用来与自适应码向量相乘的自适应码本增益,并且根据自适应码本增益,第二判定部分判定解码信号的周期性。
4.如权利要求1所述的语音解码装置,还包括变化量计算部分,计算处理单元之间的频谱包络参数的变化量,该第一参数至少包括频谱包络参数;以及距离计算部分,计算当前处理单元之前的平稳噪声区域的频谱包络参数的平均值与当前处理单元的频谱包络参数之间的距离,其中,第一判定部分根据变化量和距离,判定在合成部分中生成的解码信号的平稳特征,并且根据判定结果,进一步判定解码信号的平稳噪声特性。
5.如权利要求4所述的语音解码装置,其中,变化量计算部分计算当前处理单元的频谱包络参数与上一处理单元的频谱包络参数的平方差作为变化量,距离计算部分计算当前处理单元之前的平稳噪声区域的频谱包络参数的平均值与当前处理单元的频谱包络参数的平方差作为距离,并且第一判定部分至少对作为变化量算出的平方差和作为距离算出的平方差分别设置阈值,并且当作为变化量算出的平方差和作为距离算出的平方差都小于各自的设定阈值时,判定解码信号平稳。
6.如权利要求4所述的语音解码装置,还包括音调历史分析部分,临时存储当前处理单元之前的多个处理单元的各自音调周期,把多个处理单元中所存储的音调周期中相互接近的音调周期归为一组,并且输出分组的组数;以及信号功率变化计算部分,计算当前处理单元中解码信号的功率与当前处理单元之前的平稳噪声区域中解码信号的平均功率之间的变化量,其中,当变化量超过预定阈值时,第二判定部分判定解码信号为语音区域,并且当解码信号不是语音平稳区域,解码信号在第一判定部分中被判定为平稳,并且在变化量计算部分中算出的变化量小于预定阈值的状态已持续预定数目的处理单元或更多时,判定解码信号为平稳噪声区域,并且当从音调历史分析部分输出的组数不小于预定阈值或者自适应码增益不小于预定阈值时,判定解码信号为语音区域。
7.如权利要求1所述的语音解码装置,还包括后处理部分,将加有(混有)噪声的信号与调音系数相乘,以调整功率,调音系数是从在合成部分中生成的解码信号获得的,并且加有(混有)噪声的信号是通过将伪平稳噪声信号加到解码信号(与之混合)而获得的。
8.如权利要求7所述的语音解码装置,还包括调音部分,只有当第二判定部分判定解码信号为平稳噪声区域时,才在处理单元之间对调音系数执行平滑处理。
9.如权利要求8所述的语音解码装置,还包括存储部分,存储至少一种用于执行后处理的第三参数;以及控制部分,当在当前处理单元中发生帧删除时,从存储部分输出上一处理单元的第三参数,其中,后处理部分使用上一处理单元的第三参数执行后处理。
10.如权利要求9所述的语音解码装置,其中,第三参数至少包括调音系数,并且后处理部分使用从存储部分输出的上一处理单元的调音系数,执行后处理。
11.如权利要求7所述的语音解码装置,其中,后处理部分包括噪声生成部分,生成伪平稳噪声信号;相加部分,将在合成部分中生成的解码信号与伪噪声信号相加,以生成加有(混有)噪声的解码信号;以及调音部分,将调音系数与加有(混有)噪声的解码信号相乘,以调整功率。
12.如权利要求11所述的语音解码装置,其中,噪声生成部分包括激励生成部分,从固定码本中随机选择随机码向量,以生成噪声激励信号;第二合成滤波器,根据线性预测系数构造第二合成滤波器,并且使用噪声激励信号驱动第二合成滤波器,以合成伪平稳噪声信号;以及增益调整部分,调整在第二合成滤波器中合成的伪平稳噪声信号的增益。
13.如权利要求11所述的语音解码装置,其中,调音部分包括调音系数计算部分,根据在合成部分中生成的解码信号和通过将伪平稳噪声信号加到解码信号(与之混合)而获得的加有(混有)噪声的解码信号,计算调音系数;第一平滑部分,在处理单元之间对调音系数执行平滑处理;第二平滑部分,对第一平滑部分执行过平滑处理的调音系数执行平滑处理;以及相乘部分,将第二平滑部分执行过平滑处理的调音系数与加有(混有)噪声的解码信号进行相乘。
14.一种语音解码方法,包括解码至少一种表示语音信号的频谱包络分量的第一参数;解码至少一种表示语音信号的残留分量的第二参数;根据第一参数构造合成滤波器,并且使用根据第二参数生成的激励信号驱动合成滤波器以生成解码信号;根据第一参数判定解码信号的平稳噪声特性;以及根据第二参数判定解码信号的周期性,并且根据周期性的判定结果和平稳噪声特性的判定结果,进一步判定解码信号是否为平稳噪声区域。
15.一种存储有语音解码程序的存储介质,所述程序包括如下过程解码至少一种表示语音信号的频谱包络分量的第一参数;解码至少一种表示语音信号的残留分量的第二参数;根据第一参数构造合成滤波器,并且使用根据第二参数生成的激励信号驱动合成滤波器以生成解码信号;根据第一参数判定解码信号的平稳噪声特性;以及根据第二参数判定解码信号的周期性,并且根据周期性的判定结果和平稳噪声特性的判定结果,进一步判定解码信号是否为平稳噪声区域。
16.一种语音解码程序,使计算机执行如下过程解码至少一种表示语音信号的频谱包络分量的第一参数;解码至少一种表示语音信号的残留分量的第二参数;根据第一参数构造合成滤波器,并且使用根据第二参数生成的激励信号驱动合成滤波器以生成解码信号;根据第一参数判定解码信号的平稳噪声特性;以及根据第二参数判定解码信号的周期性,并且根据周期性的判定结果和平稳噪声特性的判定结果,进一步判定解码信号是否为平稳噪声区域。
全文摘要
第一判决器(121)根据解码信号的平稳判决结果,临时判决当前处理单元是否为平稳噪声部分。第二判决器(124)根据该临时判决结果和解码信号的周期性判决结果,判决当前处理单元是否为平稳噪声部分。因此,通过区分包括平稳元音等的平稳音频信号的解码信号与平稳噪声来准确检测平稳噪声部分。
文档编号G10L25/78GK1484823SQ01821643
公开日2004年3月24日 申请日期2001年11月30日 优先权日2000年11月30日
发明者江原宏幸, 安永和敏, 敏, 则, 间野一则, 佑介, 日和崎佑介 申请人:松下电器产业株式会社, 日本电信电话株式会社
音频解码器和音频解码方法
相关推荐
专利名称:一种具有滤光功能的微透镜阵列及其制备方法技术领域:本发明涉及光学领域,特别涉及一种具有滤光功能的微透镜阵列及其制备方法。背景技术:微透镜列阵是由通光孔径及浮雕深度为微米级的透镜组成的列阵,它不仅具有传统透镜的聚焦、成像等基本功能,
专利名称:Led轨道灯的制作方法技术领域:LED轨道灯技术领域[0001]本实用新型涉及一种照明灯具领域,尤其是涉及一种LED轨道灯。背景技术:[0002]LED是一种固态的半导体器件,可以直接把电能转化为可见光,具有体积小、耗电 量低、使
专利名称:一种照明壳罩的涂层结构的制作方法技术领域:本实用新型涉及一种照明壳罩的涂层结构。背景技术:如今人们越来越注重环保和节能,节能减排、低碳生活成为人们生活的主题,选用低能耗、小功率用电器,都是为环保做出一份贡献,但是同时这样也带来了一
专利名称:铜钹调整结构的制作方法技术领域:本实用新型涉及一种铜钹架的铜钹座,特别是涉及一种可调节下铜钹 倾斜角度功能的铜钹调整结构。背景技术:请参阅图1及图2所示,图1是现有习知脚踏铜钹架的立体图,图2 是现有习知脚踏铜钹架其下铜钹角度调节
专利名称:具有可提高保真度的柔和噪声可变特性语音编码的制作方法本申请根据35USC119(e)(1)要求申请日为1998年11月23日的US60109,555共同未决临时申请的优先权。所属领域本发明主要涉及语音编码,更确地说,涉及在语音暂停
专利名称:一种紧凑型led太阳能路灯的制作方法技术领域:本实用新型涉及ー种路灯,尤其是涉及ー种紧凑型LED太阳能路灯。背景技术:太阳能是一种取之不尽用之不竭的廉价能源,在当今全球都面临能源危机的时候,如何更合理有效的利用太阳光能,是目前乃至