当前位置:网站首页>专利 >正文

码簿激励线性预测编码器、译码器及编码、译码方法

码簿激励线性预测编码器、译码器及编码、译码方法
【专利摘要】本发明提供了码簿激励线性预测编码器、译码器及编码、译码方法。根据本发明的一方面,通过共同句柄簿激励线性预测(CELP)编译码器的码簿激励的增益,连同控制该变换编码帧的变换或反变换电压,可实现跨CELP编码帧及变换编码帧的全域增益控制。根据又另一方面,通过执行在激励信号的加权域的CELP编码中的增益值确定,当改变个别增益值时,可更良好适应于变换编码电压调整的表现而呈现CELP编码比特流的响度变化。
【专利说明】码簿激励线性预测编码器、译码器及编码、译码方法
[0001]本申请是分案申请,其母案的申请号为201080058349.0,申请日为2010年10月
19日,发明名称为“多模式音频编译码器及其适用的码簿激励线性预测编码”。
【技术领域】
[0002]本发明涉及多模式音频编码,诸如统一语音及音频编译码器,或适用于一般音频信号诸如音乐、语音、混合及其它信号的编译码器,及其适用的一种CELP编码方案。
【背景技术】
[0003]混合不同编码模式来编码表示不同类型音频信号诸如语音、音乐等的混合的一般音频信号是有利的个别编码模式可适用于特定的音频类型,因此,多模式音频编码器可利用随着时间与音频内容类型的改变相对应地改变编码模式的优势换言之,多模式音频编码器例如可判定使用特别专用于编码语音的编码模式来编码该音频信号的语音内容部分,使用另一编码模式来编码该音频内容的表示非语音内容诸如音乐的部分。线性预测编码模式倾向于较为适合用以编码语音内容,而只要有关音乐的编码,则频域编码模式倾向于表现效能优于线性预测编码模式。
[0004]但使用不同的编码模式,使得其难以全域地调整已编码的比特流内增益,或更准确地说,已编码的比特流的音频内容的译码表示型态的增益,无需实际上将该已编码的比特流译码然后再度重新编码增益已调整的译码表示型态,迂回绕道必然减低已调整增益的比特流的质量,原因在于再量化在重新编码已译码且已调整增益的表示型态进行。
[0005]举例来说,在AAC中,通过改变8-位字段「全域增益」的值,在比特流层面可实现输出电压的调整。此比特流元素可简单地被通过、编辑,而无需完整译码及重编码。如此,此处理并未引入任何质量下降,并且可毫无损耗地取消。有些应用用途实际上使用了此选项。举例来说,一种免费软件称作「AAC增益」,[AAC增益]恰应用了前述方法。此种软件为免费软件「MP3增益」的衍生,其应用与MPEC1/2层3相同的技术。
[0006]在刚萌芽的USAC编译码器中,FD编码模式从AAC继承8-位全域增益。因此,若USAC只以FD模式执行,例如用于较高比特率,则与AAC比较,全然保留电压调整功能。但一旦允许模式转换,则此项可能性不复存在。举例来说,在TCX模式中,也有一个具相同功能的比特流元素也称作「全域增益」,其具有7-位长度。换言之,编码个别模式的个别增益元素的比特数主要适应于各自的编码模式,来实现一方面耗用较少比特于增益控制,另一方面避免质量因增益调整的量化太过粗糙而降低间的最佳折衷。显然此折衷在比较TCX模式与FD模式时导致不同的比特数。在目前萌生的USAC标准的ACELP模式中,电压可通过具有2-位长度的比特流元素「平均能量」控制。再次,显然过多比特用于平均能量与过少比特用于平均能量间的折衷,结果导致与其它编码模式(即,TCX和FD编码模式)相比不同的比特数。
[0007]如此,到目前为止,全域地调整通过多模式编码所编码的已编码比特流的译码表示型态的增益烦琐且易于造成质量的降低。执行译码接着执行增益调整及重新编码,或单独通过调整影响比特流的不同编码模式部分的增益的不同模式的个别比特流元素,试探性地执行响度电压的调整。但后一可能性极其可能将假像(artifacts)引入已增益调整的已译码的表示型态。
[0008]因此,本发明的目的是提供一种多模式音频编码器,其允许全域增益调整,而无译码及重新编码的绕道,就质量及压缩率而言只有中等降低,及提供一种适用于嵌入多模式音频编码而达成类似性质的CELP编译码器。
[0009]该目的可通过所附的独立权利要求的主题实现。

【发明内容】

[0010]根据本发明的第一方面,本申请发明人了解当尝试跨不同编码模式使得全域增益调整协调时所遭遇的问题,系植基于实际上不同编码模式具有不同帧尺寸且以不同方式分解成子帧。根据本发明的第一方面,此困难可通过将子帧的比特流元素不同地编码成全域增益值,使得帧的全域增益值的改变导致该音频内容的译码表示型态的输出电压的调整。同时,不同的编码可节省位,否则当将新语法元素导入编码比特流时将出现位。另外,不同的编码通过允许设定全域增益值的时间分辨率比前述比特流元素不同地编码成全域增益值来调整各子帧的增益时的时间分辨率更低,而允许全域调整编码的比特流的增益时的负担减轻。
[0011]因此,根据本申请的第一方面,一种用以基于编码比特流而提供音频内容的译码表示型态的多模式音频译码器,该多模式音频译码器被配置为译码该编码比特流的每个帧的全域增益值,其中帧的第一子集以第一编码模式编码,及帧的第二子集以第二编码模式编码,而该第二子集的各个帧由多于一个子帧组成;对帧的该第二子集的子帧的至少一个子集的每个子帧,与各帧的全域增益值不同地译码相对应的比特流元素;在译码帧的第二子集的子帧的至少一个子集的子帧时使用所述全域增益值及相对应的比特流元素,及译码帧的第一子集时使用该全域增益值,完成所述比特流的译码,其中该多模式音频译码器被配置为使得编码比特流内的帧的全域增益值变化导致该译码音频内容表示型态的输出电压的调整。根据本第一方面,一种多模式音频编码器被配置为将音频内容编码成编码的比特流而帧的第一子集以第一编码模式编码及帧的第二子集以第二编码模式编码,此时帧的第二子集由一个或多个子帧组成,此时该多模式音频编码器被配置为确定和编码每帧的全域增益值,及对第二子集的子帧的至少一个子集的每个子帧与各帧的全域增益值不同地编码和确定相对应的比特流元素,其中执行多模式音频编码方法,使得编码比特流内的帧的全域增益值的改变导致音频内容的译码表示型态在译码端的输出电位的调整。
[0012]根据本申请的第二方面,本申请发明人发现若CELP编译码器的码簿激励的增益连同变换编码帧的变换或反变换电压一起控制,则跨经CELP编码帧及变换编码帧的通用增益控制可经由维持前文概述的优点实现。
[0013]据此,根据第二方面,一种用以基于编码比特流而提供音频内容的译码表示型态的多模式音频译码器,其帧的第一子集以CELP编码,及其帧的第二子集以变换编码,该多模式音频译码器包括CELP译码器,其被配置为解码该第一子集的目前帧,该CELP译码器包括激励发生器,其被配置为通过基于该编码比特流内的该第一子集的目前帧的码簿指标及过去激励而组成码簿激励,以及基于该编码比特流内部之全域增益值而设定该码簿激励之增益,来产生该第一子集的前帧的目前激励;以及线性预测合成滤波器,其被配置为基于该编码比特流内的第一子集的目前帧的线性预测滤波系数而滤波目前激励;变换译码器被配置为通过如下方式解码该第二子集的目前帧:由编码比特流构造第二子集的目前帧的频谱信息,及对该频谱信息进行频域至时域变换来获得时域信号,使得时域信号的电压取决于全域增益值。
[0014]同理,根据第二方面,一种多模式音频编码器,用于通过CELP编码音频内容的帧的第一子集及通过变换编码的第二帧子集而将该音频内容编码成编码比特流,该多模式音频编码器包括=CELP编码器,被配置为编码第一子集的目前帧,该CELP编码器包括:线性预测分析器,其被配置为对该第一子集的目前帧产生线性预测滤波系数,并将其编码成该编码比特流;及激励发生器,被配置为判定该第一子集的目前帧的目前激励,当通过线性预测合成滤波器基于编码比特流内的线性预测滤波系数滤波时,其恢复由该第一子集的目前帧的码簿指标及过去激励所限定的第一子集的目前帧,及将该码簿指标编码成该编码比特流;及变换编码器,其被配置为通过对该第二子集的目前帧的时域信号执行时域至频域变换成而编码第二子集的目前帧来获得频谱信息,及将该频谱信息编码成该编码比特流,其中该多模式音频编码器被配置为将全域增益值编码成编码比特流,该全域增益值取决于第一子集的目前帧的音频内容根据线性预测系数而使用该线性预测分析滤波器来滤波的版本的能量,或取决于该时域信号的能量。
[0015]根据本申请的第三方面,发明人发现若CELP编码的全域增益值经运算且施加于激励信号的加权域,而非直接使用普通激励信号,则当改变各全域增益值时,CELP编码比特流的响度变化更加适应配合变换编码电压调整的表现。此外,当考虑CELP编码模式排它地作为CELP的其它增益诸如码增益及LTP增益在加权域运算时,在激励信号的加权域运算与施加全域增益值也有其优势。
[0016]如此,根据第三方面,一种CELP译码器,包括激励发生器,其被配置为产生比特流的目前帧的目前激励,概产生通过:基于该比特流内的目前帧的自适应码簿指标及过去激励,构造自适应码簿激励;基于该比特流内的目前帧的创新码簿指标,构造创新码簿激励;计算由该比特流内的线性预测滤波系数所组成的加权线性预测合成滤波器而频谱式加权的该创新码簿激励的能量的估值;基于该比特流内的全域增益值与估算的能量间的比,设定该创新码簿激励的增益;及组合该自适应码簿激励与该创新码簿激励来获得该目前激励;及线性预测合成滤波器,其被配置为基于该等线性预测滤波系数而滤波该目前激励。
[0017]同理,根据第三方面,一种CELP编码器,包括线性预测分析器,其被配置生成对音频内容的目前帧的线性预测滤波系数,以及将线性预测滤波系数编码成比特流;激励发生器,被配置为将目前帧的目前激励确定为自适应码簿激励与创新码簿激励的组合,而当基于线性预测滤波系数通过线性预测合成滤波器滤波时,恢复所述目前帧,通过:造由目前帧的自适应码簿指标及过去激励所限定的所述自适应码簿激励,以及将自适应码簿指标编码成比特流;及构造由该目前帧的创新码簿指标限定的创新码簿激励,及将该创新码簿指标编码成该比特流;及能量测定器,其被配置为确定加权滤波器滤波的该目前帧的音频内容的版本的能量,以获得全域增益值,以及将该全域增益值编码成该比特流,该加权滤波器由该线性预测滤波系数解释。【专利附图】

【附图说明】
[0018]本申请的优选实施例为本申请所附的从属权利要求的主旨。此外,本申请的优选实施例在后文参考附图进行说明,附图中:
[0019]图1A和图1B示出根据实施方式的多模式音频编码器的方块图;
[0020]图2示出根据第一替代例的图1的编码器的能量计算部分的方块图;
[0021]图3示出根据第二替代例的图1的编码器的能量计算部分的方块图;
[0022]图4示出根据实施方式且适用于译码由第I图的编码器编码的比特流的多模式音频译码器;
[0023]图5A及图5B示出根据本发明又一实施方式的多模式音频编码器及多模式音频译码器;
[0024]图6A及图6B示出根据本发明又一实施方式的多模式音频编码器及多模式音频译码器;以及
[0025]图7A及图7B示出根据本发明又一实施方式的CELP编码器及CELP译码器。【具体实施方式】
[0026]图1A和IB示出根据本申请实施方式的一种多模式音频编码器的实施方式。图1A和IB的多模式音频编码器适用于编码混合型音频信号,诸如语音与音乐的混合信号。为了获得最适当的速率/失真折衷,该多模式音频编码器被配置为在数种编码模式间切换而调整编码性质适应要编码的音频内容的目前需求。更明确地,根据图1A和IB的实施方式,多模式音频编码器通常使用三种不同的编码模式,即FD(频域)编码及LP(线性预测)编码,其又再划分成TCX(变换编码激励)及CELP (码簿激励线性预测)编码。在FD编码模式中,要编码的音频内容经开窗、频谱分解,且该频谱分解经根据心理声学而量化及定标来隐藏在掩蔽临界值下方的量化噪声。在TCX及CELP编码模式中,音频内容接受线性预测分析来获得线性预测系数,及这些线性预测系数在比特流内连同激励信号一起传输,其当使用比特流内的线性预测系数,以相对应的线性预测合成滤波器滤波时,获得音频内容的译码表示型态。在TCX的情况下,激励信号经变换编码,而在CELP的情况下,激励信号通过码簿内的检索登录项目编码,或以合成方式组成所滤波样本的码簿向量。根据本实施方式使用的ACELP (代数码簿激励线性预测),激励由自适应码簿激励及创新码簿激励所组成。容后详述,在TCX中,线性预测系数可在译码器端使用,也通过推导定标因子而在频域直接采用来成形噪声量化。在此种情况下,TCX被设定来变换原先信号,及将LPC结果只应用在频域。
[0027]尽管编码模式不同,但图1A和IB的编码器产生比特流,使得通过例如等量增或减全域增益值,例如,相等数量的比特数(其等于以对数底乘以位数的因子(或除数)缩放),与该已编码比特流的全部帧相关联的某个语法元素(具体实例是与帧个别地或帧组群相关联)允许跨全部编码模式的全域增益适应。
[0028]具体地,根据图1A和IB的多模式音频编码器10支持的各种编码模式,其包含FD编码器12及LPC(线性预测编码)编码器14。LPC编码器14又由TCX编码部16、CELP编码部18及编码模式切换器20所组成。编码器10所包含的又一编码模式切换器相当概略地显示为模式分配器22。模式分配器被配置为分析要编码的音频内容24以便将其连续的时间部分与不同编码模式相关联。具体地,在图1A和IB的情况下,模式分配器22将音频内容24的不同的连续时间部分分配至FD编码模式及LPC编码模式中的任一者。在图1A和IB的说明例中,举例来说,模式分配器22已将音频内容24的部分26分配至FD编码模式,而紧随后部分28分配至LPC编码模式。根据模式分配器22分配的编码模式,音频内容24可再细分成不同的连续帧。举例来说,在图1A和IB的实施方式中,部分26内的音频内容24被编码成等长帧30,而彼此有例如50%重迭。换言之,FD编码器12被配置为以这些单元30编码音频内容24的FD部分26。根据图1A和IB的实施方式,LPC编码器14也被配置以帧单位32编码音频内容24的相关联部分28,但这些帧并非必需与帧30大小相等。以图1A和IB为例,帧32的大小小于帧30的大小。具体地,根据特定实施方式,帧30的长度为音频内容24的2048个样本,而帧32的长度为1024个样本。可能在LPC编码模式与FD编码模式间的边界,最末帧与第一帧重迭。但在图1A和IB的实施方式中,及如图1A和IB示例性所示,在从FD编码模式转换至LPC编码模式的情况下并无帧重迭,反之亦然。
[0029]如第I图所示,FD编码器12接收帧30,并通过频域变换编码将其编码成已编码比特流36的个别帧34。为了实现该目的,FD编码器12包括一开窗器38、变换器40、量化及定标模块42、无损耗编码器44,以及心理声学控制器46。原则上,FD编码器12可根据AAC标准实施,只要下文描述并未教示FD编码器12的不同表现即可。具体地,开窗器38、变换器40、量化及定标模块42、及无损耗编码器44系串接在FD编码器12的输入端48与输出端50之间,及心理声学控制器46具有输入端连接至输入端48,及输出端连接至量化及定标模块42的另一输入端。须注意FD编码器12还可包括额外的模块用于其它编码选项,但在此处并不关键。
[0030]开窗器38可使用不同窗用来开窗进入输入端48的目前帧。该开窗帧在变换器40诸如使用MDCT等接受时域至频域的变换。变换器40可使用不同变换长度来变换开窗帧。
[0031]具体地,开窗器38可支持长度与帧30的长度一致的窗,变换器40使用相同的变换长度以便获得例如在MDCT的情况下与帧30的半数样本相对应的多个变换系数。但开窗器38也可被配置为支持编码选项,根据这些编码选项,时间上彼此相对偏移的诸如帧30的半长度的8窗的若干较短窗被施加至目前帧,变换器40使用符合开窗的变换长度变换目前帧的这些开窗版本,从而获得该帧期间的不同时间,藉取样该音频内容而对该帧获得8频谱。由开窗器38所使用的窗可为对称或非对称的,且可具有零前端及/或零后端。在施加若干短窗至目前帧的情况下,这些短窗的非零部分相对于彼此位移,但彼此重迭。当然,根据其它实施方式也可使用开窗器38及变换器40的窗及变换长度的其它编码选项。
[0032]由变换器40输出的变换系数在模块42量化及定标。特别,心理声学控制器46分析输入端48的输入信号以确定掩蔽临界值48,据此,由量化及定标所导入的量化噪声形成为低于该掩蔽临界值。具体地,定标模块42可在定标因子带运算,共同覆盖频谱域所再细分的变换器40的频谱域。据此,成组连续的变换系数被分配至不同的定标因子带。模块42判定每个定标因子带的定标因子,该定标因子当乘以分配给各定标因子频带的各变换系数值时,获得变换器40所输出的变换系数的重建版本。此外,模块42设定频谱上一致地定标该频谱的增益值。如此,重建变换系数等于该变换系数值乘以相关联的定标因子乘以各帧i的增益值gi。变换系数值、定标因子、及增益值在无损耗编码器44接受无损耗编码,诸如利用熵编码,诸如算术编码或霍夫曼编码,连同其它语法元素,例如有关前述窗及变换长度决策的语法元素,及允许其它编码选项的额外语法元素。有关此方面的进一步细节,请参考AAC标准有关其它编码选项。
[0033]为了略为更加精确,量化及定标模块42可被配置为传输每频谱列k的量化变换系数值,当重新定标时,其获得个别频谱列k的重建变换系数,即X_reScal,当乘以
[0034]增益=2°.25.(sf_sf-°ffset)
[0035]其中,sf为个别量化变换系数所属的个别定标因子带的定标因子,Sf_offSet为常数,例如可设定为100。
[0036]如此,定标因子在对数域内定义。定标因子可在比特流36内连同频谱存取彼此差异编码,亦即只有频谱邻近定标因子sf间的差异可在比特流内传输。相对于前述全域增益值(global_gain value)被差异编码的第一定标因子sf可在比特流内传输。下文说明将关注此语法元素global_gain。
[0037]global_gain值可在对数域在比特流内传输。换言之,模块42可被配置为取目前频谱的第一定标因子sf作为global_gain。然后,此sf值可与零差异地传输,及随后的sf值与个别前趋值差异传输。
[0038]显然,当一致地在全部帧30上进行时,改变global_gain,将改变重建变换的能量,而如此转译成FD编码部分26的响度变化。
[0039]具体地,FD巾贞的global_gain在比特流内传输,使得global_gain对数式地取决于重建的音频时域样本的移动平均,或反之亦然,重建的音频时域样本的移动平均指数式地取决于global_gain。
[0040]类似于帧30,全部分配给LPC编码模式的帧亦即帧32进入LPC编码器14。在LPC编码器14内,切换器20将各个帧32再划分成一个或多个子帧52。各个子帧52可被分配给TCX编码模式或CELP编码模式。被分配给TCX编码模式的子帧52传递至TCX编码器16的输入端54,而被分配给CELP编码模式的子帧通过切换器20被传递至CELP编码器18的输入端56。
[0041]须注意图1A和IB示出的切换器20配置在LPC编码器14的输入端58与TCX编码器16及CELP编码器18个子的输入端54及56仅为了说明的目的,实际上,有关帧32再划分成子帧52并且将TCX及CELP中的各编码模式与个别子帧关联的编码决策,可在TCX编码器16与CELP编码器18的内部元素间以互动方式进行,以便最大化某个权值/失真测量值。
[0042]总而言之,TCX编码器16包含激励发生器60、LP分析器62、及能量测定器64,其中,该LP分析器62及该能量测定器64由CELP编码器18共同使用(共同拥有),CELP编码器18进一步包括其本身的激励发生器66。激励发生器60、LP分析器62及能量测定器64的各自的输入端连接至TCX编码器16的输入端54。同理,LP分析器62、能量测定器64及激励发生器66各自的输入端连接至CELP编码器18的输入端56。LP分析器62被配置为分析目前帧即TCX帧或CELP帧内音频内容来确定线性预测系数,且连接至激励发生器60、能量测定器64及激励发生器66各自的系数输入端来传递线性预测系数至这些组件。容后详述,LP分析器可在原先音频内容的预强调版本上运算,及各预强调滤波器可为LP分析器的各输入部分的一部分,或可连接至其输入端的前方。同理适用于能量测定器64,容后详述。但至于激励发生器60,其可直接对原先信号操作。激励发生器60、LP分析器62、能量测定器64及激励发生器66各自的输出端以及输出端50连接至编码器10的多路复用器68的各个输入端,该多路复用器被配置为在输出端70将所接收的语法元素多任务化成比特流36。
[0043]如前文已述,LPC分析器62被配置为确定输入的LPC帧32的线性预测系数。有关LP分析器62可能的功能的进一步细节请参考ACELP标准。一般而言,LP分析器62可使用自我相关法或协方差法来确定LPC系数。举例来说,使用自我相关法,LP分析器62可使用李杜(Levinson-Durban)演绎法则,解出LPC系数来产生自我相关矩阵。如本领域已知的,LPC系数限定一种合成滤波器,其粗略地仿真人类声道模型,而当通过激励信号驱动时,大致上仿真气流通过声带的模型。这种合成滤波器通过LP分析器62使用线性预测模型化。声道形状改变速率受限制,据此,LP分析器62可使用适应于该限制的更新速率且与帧32的帧率不同的更新速率,来更新线性预测系数。LP分析器62执行LP分析对组件60、64及66等某些滤波器提供信息,诸如:
[0044]线性预测合成滤波器H (Z);
[0045]其反滤波器,亦即线性预测分析滤波器或白化滤波器A(Z),其中
【权利要求】
1.一种CELP译码器,包括: 激励发生器(540),被配置为产生比特流(544)的目前帧的目前激励(542),该产生通过 基于所述比特流(544)内的目前帧的自适应码簿指标(550)及过去激励(548),构造自适应码簿激励(546); 基于所述比特流(544)内的目前帧的创新码簿指标(554),构造创新码簿激励(552);计算由所述比特流(36,134,304,514)内的线性预测滤波系数(556)所构造的加权线性预测合成滤波器而频谱加权的所述创新码簿激励(546)的能量的估值; 基于所述比特流(544)内的全域增益值(560)与估算的所述能量间的比,设定所述创新码簿激励(552)的增益;以及 组合所述自适应码簿激励(546)和所述创新码簿激励(552)以获得所述目前激励(542);以及 线性预测合成滤波器(542),被配置为基于所述线性预测滤波系数(556)而滤波所述目前激励(542)。
2.根据权利 要求1所述的CELP译码器,其中,所述激励发生器出0,66,146,416,440,444,540)被配置为在构造所述自适应码簿激励(556,520,546)时,根据所述自适应码簿指标(526,550,546,556)使用滤波器来滤波所述过去激励(420,446,524,548)。
3.根据权利要求1所述的CELP译码器,其中,所述激励发生器(540)被配置为构造所述创新码簿激励(552),使得后者包括具有多个非零脉冲的零向量,所述非零脉冲的数目及位置由所述创新码簿指标(554)指示。
4.根据权利要求1所述的CELP译码器,其中,所述激励发生器(540)被配置为在计算所述创新码簿激励的能量的估值时,用下式滤波所述创新码簿激励(552), mz) kz) HrmpJ-) 其中,所述线性预测合成滤波器被配置为根据滤波所述目前激励(542),其中W(z)^歲ζ/>)及Y为听觉加权因子,Hraiph = 1-αζΛ α为高频增强因子,其中,所述激励发生器(540)进一步被配置为计算经滤波的所述创新码簿激励的样本的平方和以获得所述能量的所述估值。
5.根据权利要求1所述的CELP译码器,其中,所述激励发生器(540)被配置为在组合所述自适应码簿激励(546)和所述创新码簿激励(552)时,形成根据所述自适应码簿指标(550)以加权因子加权的所述自适应码簿激励(546)与以所述增益加权的所述创新码簿激励(552)的加权和。
6.一种CELP编码器,包括: 线性预测分析器(502),被配置生成对音频内容(512)的目前帧(510)的线性预测滤波系数(508),以及将所述线性预测滤波系数(508)编码成比特流(514);激励发生器(504)被配置为将所述目前帧(510)的目前激励(516)确定为自适应码簿激励(520)与创新码簿激励(522)的组合,而当基于线性预测滤波系数通过线性预测合成滤波器滤波时,恢复所述目前帧(510),通过 构造由所述目前帧(510)的自适应码簿指标(526)及过去激励(524)所限定的所述自适应码簿激励(520),以及将所述自适应码簿指标(526)编码成所述比特流(514);以及 构造由所述目前帧(510)的创新码簿指标(528)限定的所述创新码簿激励(522),以及将所述创新码簿指标(528)编码成所述比特流(514);以及 能量测定器(506),被配置为确定加权滤波器滤波的所述目前帧的音频内容的版本的能量,以获得全域增益值(530),以及将所述全域增益值(530)编码成所述比特流(514),所述加权滤波器由所述线性预测滤波系数(508)解释。
7.根据权利要求6所述的CELP编码器,其中,所述线性预测分析器(502)被配置为通过将线性预测分析施加至开窗的且根据预定前置增强滤波器而前置增强的音频内容(512)的版本而确定所述线性预测滤波系数(508)。
8.根据权利要求6所述的CELP编码器,其中,所述激励发生器(504)被配置为在构造所述自适应码簿激励(520)和所述创新码簿激励(522)时,相对于所述音频内容(512)最小化听觉加权失真测量值。
9.根据权利要求6所述的CELP编码器,其中,所述激励发生器(504)被配置为在构造所述自适应码簿激励(520)和所述创新码簿激励(522)时,使用听觉加权滤波器相对于所述音频内容(512)最小化听觉加权失真测量值,
W(z) = A(z/ Y ), 其中,Y为听觉加权因子,A(Z)为1/H(z),其中,H(Z)为线性预测合成滤波器,及其中,所述能量测定器(506)被配置为使用所述听觉加权滤波器作为加权滤波器。
10.根据权利要求6所述的CELP编码器,其中,所述激励发生器(504)被配置为执行激励更新以获得下一帧的过去激励,通过 使用下式通过滤波由所述创新码簿指标(522)内所含第一信息所限定的创新码簿向量来估算创新码簿激励能量估值,
11.一种CELP译码方法,包括: 通过下列处理产生比特流(544)的目前帧的目前激励(542):基于所述比特流(544)内的所述目前帧的自适应码簿指标(550)和过去激励(548)而构造自适应码簿激励(546); 基于所述比特流(544)内的所述目前帧的创新码簿指标(554)而构造创新码簿激励(552); 计算由所述比特流(36,134,304,514)内的线性预测滤波系数(556)所构造的加权线性预测合成滤波器而频谱加权的所述创新码簿激励(546)的能量的估值; 基于所述比特流(544)内的全域增益值(560)与估算的所述能量间的比,设定所述创新码簿激励(552)的增益;以及 组合所述自适应码簿激励(546)和所述创新码簿激励(552)以获得所述目前激励(542);以及 通过线性预测合成滤波器(542)基于所述线性预测滤波系数(556)而滤波所述目前激励(542)。
12.—种CELP编码方法,包括: 执行线性预测分析来产生音频内容(512)的目前帧(510)的线性预测滤波系数(508),及将所述线性预测滤波系数(508)编码成比特流(514); 确定目前帧(510)的目前激励(516)为自适应码簿激励(520)与创新码簿激励(522)的组合,当由线性 预测合成滤波器基于线性预测滤波系数(508)滤波时,其通过如下处理恢复所述目前帧(510), 构造由所述目前帧(510)的自适应码簿指标(526)和过去激励(524)所限定的自适应码簿激励(520),及将所述自适应码簿指标(526)编码成比特流(514);以及 构造由所述目前帧(510)的创新码簿指标(528)所限定的创新码簿激励(522),及将所述创新码簿指标(528)编码成所述比特流(514);以及 确定以加权滤波器滤波的所述目前帧的音频内容的版本的能量,以获得全域增益值(530),以及将所述全域增益值(530)编码成所述比特流(514),所述加权滤波器由所述线性预测滤波系数(508)解释。
【文档编号】G10L19/083GK104021795SQ201410256091
【公开日】2014年9月3日 申请日期:2010年10月19日 优先权日:2009年10月20日
【发明者】拉尔夫·盖尔, 纪尧姆·福奇斯, 马库斯·穆赖特鲁斯, 伯恩哈德·格里 申请人:弗兰霍菲尔运输应用研究公司

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:语音命令竞争处理方法、装置、语音遥控器和数字电视的制作方法技术领域:本发明涉及语音识别技术,尤其涉及一种语音命令竞争处理方法、装置、语音遥控器和数字电视。背景技术:与机器进行语音交流,让机器明白你说什么,这是人们长期以来梦寐以求的

    专利发布时间:2025-05-15阅读:(72)

    专利名称:背光模组的制作方法技术领域:本发明涉及一种背光模组,尤其涉及一种改进光学膜片固定方式的背光模组。 背景技术:目前,液晶面板的侧发光式背光模组中,导光板是不可缺少的重要光学部件, 导光板的固定方式的设计也就成了必须要考虑的问题。图1

    专利发布时间:2025-05-15阅读:(76)

    专利名称::图像形成装置的定影器的制作方法技术领域::本发明涉及例如复印机、传真机、或者打印机装置等的图像形成装置的定影器(fussingunit),其中,涉及将纸张从加热辊(heatroller)的周面强制地分离的分离爪(separati

    专利发布时间:2025-05-15阅读:(84)

    专利名称:多稀土掺杂超宽带光纤放大器的制作方法技术领域:本发明涉及一种多稀土掺杂超宽带光纤放大器,是一种铒镨离子共掺光纤和掺铥光纤结合使用的超宽带光纤放大器,适用于光纤通信系统和网络。然而,目前发明的光纤放大器的最大平坦带宽只有120nm,

    专利发布时间:2025-05-15阅读:(81)

    一种轻质二组元软性薄层局域共振声学材料结构的制作方法【专利摘要】本发明公开了一种轻质二组元柔性薄层局域共振声学材料结构,其设计了一种用同种轻质柔性材料提供质量和弹性,另一种轻质材料提供局域化刚度的二组元软薄型局域共振单元。局域共振单元可以控

    专利发布时间:2025-05-15阅读:(78)

    专利名称:芳纶纤维增强光缆加强芯及其制造方法芳纶纤维增强光缆加强芯及其制造方法技术领域:本发明涉及通信光缆,尤其涉及芳纶纤维增强光缆加强芯的制造方法。背景技术:1.目前随着社会高速发展,人们对网速的要求越来越高,光纤到户,刻不容缓,况且国家

    专利发布时间:2025-05-15阅读:(74)