专利名称:音频编码器和解码器及用于音频信号的编码和解码的方法
技术领域:
本发明涉及音频信号编码和解码领域。
背景技术:
移动通信系统呈现了用于话音传送服务的挑战性环境。话音呼叫实际上能够在任何地方进行,并且周围背景噪声和声学条件将对传送的语音的质量和可理解性有影响。同时,存在用于限制每个通信装置消耗的传送资源的强烈的动机。移动通信服务因此采用压缩技术以便降低话音信号消耗的传送带宽。低带宽消耗在移动装置和基站中均产生了低功耗。这转化成了移动运营商的能量和成本节约,同时最终用户将体验到延长的电源寿命和 增大的通话时间。此外,通过每用户更少消耗的带宽,移动网络能够同时服务于更大数量的用户。今天,用于移动话音服务的主导压缩技术是例如在“极低比特率的码激励线性预测(CELP)高质量语音’’("Code-Excited Linear Prediction (CELP) high-quality speechat very low bit rates", M. R. Schroeder and B. Atal, IEEE ICASSP 1985)中所述的码激励线性预测(CELP)。CELP是根据合成式分析过程操作的编码方法。在用于话音编码的CELP中,使用了线性预测分析以便基于要编码的音频信号确定表示人声道的慢速变化线性预测(LP)滤波器A(z)。将音频信号分割成信号段,并且使用确定的A(Z)过滤信号段,过滤产生过滤的信号段,经常称为LP残差。随后,形成目标信号x(n),一般是通过加权合成滤波器
过滤LP残差以形成在加权域中的目标信号x(n)。目标信号X (η)用作用于合成式分析过程的参考信号,其中,搜索自适应码本以查找在通过加权合成滤波器过滤时将提供目标信号的良好近似的过去激励样本的序列。随后,通过从过滤的信号段减去所选择的自适应码本信号,推导次要目标信号χ2 (η)。次要目标信号又用作用于又一合成式分析过程的参考信号,其中,搜索固定码本以查找脉冲的向量,脉冲的向量通过加权合成滤波器过滤时将提供次要目标信号的良好近似。随后,通过所选择的自适应码本向量和所选择的固定码本向量的线性组合更新自适应码本。通过使用CELP,良好的语音质量一般在适度低带宽得以实现,并且该方法在诸如GSM-EFR、AMR和AMR-WB等部署的编解码器中广泛使用。然而,对于极低比特率,CELP编码技术的限制开始显现。虽然有声语音的段仍表现良好,但诸如摩擦音等更多噪声类辅音开始听起来更差。在背景噪声中也能够感觉到质量下降。如上所看到的一样,CELP技术使用基于脉冲的激励信号。对于有声信号段,过滤的信号段(目标激励信号)集中在对应于语音段的基频的定期间隔出现的所谓喉脉冲周围。此结构能够通过脉冲的向量很好地建模。另一方面,对于噪声类段,目标激励信号结构更松散,表现在能量在整个向量内更分散。此类能量分布未通过脉冲的向量很好地捕捉,并且尤其在低比特率未很好地捕捉。在比特率低时,脉冲只是变得太少而不能适当地捕捉噪声类信号的能量分布,并且结果合成语音将具有经常称为CELP编解码器的稀疏假象的杂音失真。因此,对于例如在传送信道条件差时能够有利的极低比特率,要求使用CELP的备选以便获得声音良好的合成信号。几个技术已开发以便处理在低比特率的CELP稀疏假象。W099/12156公开了一种解码已编码信号的方法,其中,防稀疏滤波器应用为在语音信号的解码中的后处理步骤。此类防稀疏处理降低了稀疏假象,但最后结果仍能够听起来有点不自然。技术领域熟知的减轻稀疏假象的另一种方法经常称为噪声激励线性预测(NELP)。在NELP中,使用噪声信号作为激励信号来处理信号段。噪声激励只适用于噪声类声音的表示。因此,使用NELP的系统经常将例如CELP等不同激励方法用于声调或有声段。因此,NELP技术依赖为音频信号的无声和有声部分使用不同编码策略的语音段的分类。这些编码策略之间的差别在有声与无声切换策略之间切换时引发切换假象。此外,噪声激励一般将不能成功地为复杂的噪声类信号的激励建模,并且防稀疏假象的部分因此一般将保持不变。如从上面所述能够看到的一样,需要改进的编解码器,由此即使在为低比特率传送将编码的信号编码时,也能够获得高质量合成音频信号。
发明内容
本发明的目的涉及在以低比特率传送编码信号时改进合成音频信号的质量。此目的通过编码方法、解码方法、音频编码器、音频解码器及用于音频信号的编码和解码的计算机程序而得以解决。提供了一种将音频信号编码和解码的方法,其中,通过编码时间域信号段的频率域表示,更新编码器及解码器的自适应谱码本。编码器分析收到的时间域信号段以产生频率域表示,并且搜索编码器中的自适应谱码本以查找提供获得的频率域表示的第一近似的ASCB向量。选择此ASCB向量。从频率域表示与所选择的ASCB向量之间的差生成残差频率表示。随后,搜索编码器中的固定谱码本以查找提供残差频率表示的近似的FSCB向量。也选择此FSCB向量。从两个所选择的向量可生成合成频率域表示。编码器还生成信号表示,信号表示指示引用所选择的ASCB向量的索引和引用所选择的FSCB向量的索引。线性组合的增益也能够有利地在信号表示中指示。通过使用从信号表示取回的ASCB索引和FSCB索引,识别ASCB向量和FSCB向量,能够解码如上所述由编码器生成的信号表示。在信号表示的解码中,识别的ASCB向量和识别的FSCB向量的线性组合提供要合成的时间域信号段的合成频率域表示。从合成频率域表不生成合成时间域信号。通过在音频信号的编码中使用时间域信号段的频率域表示,也能够在低比特率有效获得噪声类声音的谱分布的控制,并且在编码器与解码器之间的传送信道提供低比特率时,也能够改进此类声音的合成。由于为语音信号的编码考虑的时间域信号段的长度较短,因此,对应频率域表示将可能显示在时间邻近帧之间的大变化。通过提供经常更新的自适应谱码本,确保能够找到频率域表示的适合近似,而不管在时间域信号段的时间邻近频率域表示之间的预期差相关。在一个实施例中,通过执行时间域信号段的时间到频率域变换分析,由此获得段谱,来获得频率域表示。频率域表示作为段谱的至少一部分获得。时间到频率域变换例如能够是离散傅立叶变换(DFT),其中,获得的段谱包括幅度谱和相位谱。频率域表示随后能够对应于段谱的幅度谱部分。时间到频率域变换分析的另一示例是修改的离散余弦变换分析,该分析生成单个实值MDCT谱。在此情况下,频率域表示能够对应于MDCT谱。备选,可使用其它分析。在另一实施例中,通过执行时间域信号段的线性预测分析,获得频率域表示。在一个实施例中,应用到时间域信号段的编码/解码方法取决于段携带的声音信息的相位灵敏度。在此实施例中,应将段作为相位不灵敏还是相位灵敏处理的指示能够例如作为信号表示的一部分发送到解码器。对于携带相位不灵敎信息的段,从合成频率域表示的合成时间域信号的生成能够包括能够在解码器中有利地生成的随机分量。例如,在编码器中执行的频率分析是DFT时,相位谱能够在解码器中随机生成,或者在频率分析是LP分析时,时间域激励信号能够在解码器中随机生成。对于携带相位灵敎信息的段的编码,将使用诸如CELP等基于时间域的编码方法。备选,使用自适应谱码本的基于频率域的编码方法也能够用于相位灵敎信号段的编码,其中,信号表示包括用于相位灵敏信号段的信息多于用于相位不灵敏的信息。例如,如果一些信息在用于相位不灵敏段的解码器中随机生成,则至少部分此类信息对于相位灵敏段转而由编码器参数化,并且作为信号表示的一部分传输到解码器。通过为不同类型的声音使用编码/解码方法,能够保持用于信号表示的传送的低带宽要求,同时允许借助于使用自适应谱码本的基于频率域的编码方法,编码噪声类声音。诸如段谱的相位或时间域激励信号等随机生成的信息在一个实施例中能够用于所有信号段,而与相位灵敏度无关。在频率分析是DFT,并且随机生成相位谱在段的解码中使用时,随机谱的DC分量的符号例如能够根据段谱的DC分量的符号进行调整,由此改进在邻近段之间能量演化的稳定性。因此,段谱的DC分量的符号能够包括在信号表示中。通过在合成段谱时使用随机生成的相位信息,能够大幅减少或者在一些实施例中甚至消除要从编码器传送到解码器的相位信息量。在一个实施例中,编码方法可包括频率域表示的第一近似的质量估计。如果此类质量估计指示质量不充分,则编码器能够进入快速收敛模式,其中,频率域表示通过至少两个FSCB向量而不是一个FSCB向量和一个ASCB向量来近似。由于在自适应谱码本中存储的ASCB向量可因此不那么适合用于近似频率域表示,因此,在要编码的音频信号快速更改或者在自适应谱码本已启动后立即更改的情况下,这能够是有用的。快速收敛模式能够例如作为信号表示的一部分通过信号发送到解码器。编码器和解码器的自适应谱码本也能够有利地在快速收敛模式中更新。编码器和解码器的自适应谱码本的更新能够以相关性指示符超过相关性阈值为条件,相关性指示符为将来时间域信号段的编码性提供特定频率域表示的相关性的值。段的全局增益例如能够用作相关性指示符。在解码器中,相关性指示符的值在一个实施例中能够由解码器本身确定,或者相关性指示符的值能够例如作为信号表示的一部分从编码器接收。本发明的其它方面在下面的详细描述和附图中陈述。
图1是包括编码器和解码器的音频编解码器系统的示意图。图2是示出将音频信号编码成信号表示的方法的流程图。图3是示出解码信号表示和合成音频信号的方法的流程图。图4以示意图方式示出音频编码器的一实施例。图5以不意图方式不出音频解码器的一实施例。图6是示出编码和解码方法的一实施例的特征的流程图。图7以示意图方式示出编解码器的一实施例的特征。图8是示出编码方法的一实施例的特征的流程图。图9以示意图方式示出编码器的一实施例的特征。图10以示意图方式示出对应于图9所示编码器特征的解码器特征。图11是示出编码方法的一实施例的特征的流程图,由此编码器能够进入相位灵敏或相位不灵敏编码模式之一。图12是示出图2的编码方法的一实施例的流程图。图13是示出图3的解码方法的一实施例的流程图。图14以示意图方式示出编码器的一实施例。图15以示意图方式示出解码器的一实施例。图16以示意图方式示出编码器的一实施例。图17以示意图方式示出解码器的一实施例。图18是编码器或解码器的备选图示。
具体实施例方式图1以示意图方式示出编解码器系统100,包括具有编码器110的第一用户设备105a及具有解码器112的第二用户设备105b。在一些实现中,用户设备105a/b能够包括编码器110和解码器112。通常引用任何用户设备时,将使用标号105。编码器110配置成接收输入音频信号115和将输入信号115编码成压缩音频信号表不120。另一方面,解码器112配置成接收音频信号表不120,并且将音频信号表不120解码成合成音频信号125,其因此是输入音频信号115的再现。输入音频信号115 —般由编码器110或在信号到达编码器110前由其它设备分割成输入信号段序列,并且编码器110/解码器112执行的编码/解码一般在逐段基础上执行。两个连续的信号段可具有时间重叠,使得一些信号信息在两个信号段中携带,或备选,两个连续信号段可表示两个完全不同且一般邻近的时间期。信号段例如能够是信号帧、不止一个信号帧的序列或信号帧的一部分。根据本发明,通过使用以下编码/解码技术,能够避免在上面相对于CELP编码技术论述的在低比特率的稀疏假象的效应其中,输入音频信号从时间域变换到频率域中,使得生成信号谱。通过带来直接控制信号段的谱能量分布的可能性,噪声类信号段能够甚至在低比特率更准确地再现。携带非周期性信息的信号段能够视为噪声类。此类信号段的示例是携带摩擦声音和噪声类背景噪声的信号段。从例如W095/28699和“使用变换编码激励(TCX)的宽带音频信号的高质量编码,,(,Tlfgi Quality Coding of Wideband Audio Signals using Transform CodedExcitation (TCX) 〃,R· Lefebvre et al., ICASSP 1994, pp. 1/193 - 1/196 vol.I)中知道作为编码过程的一部分,将输入音频信号变换到频率域中。称为TCX并且其中输入音频信号变换成频率域中的信号谱的这些出版物中公开的方法被提议作为在高比特率CELP的备选,其中,CELP要求高处理能力一CELP的计算要求随比特率呈指数增大。在R. Lefebvre 的TCX编码方法中,信号谱的预测通过从变换以前的信号段获得的以前的信号谱提供。预测残差随后作为信号谱的预测与信号谱本身之间的差获得。随后,搜索谱预测残差码本以查找提供预测残差的良好近似的残差向量。已为要求高比特且其中在邻近信号段之间谱能量分布中存在高相关的信号的编码开发了 TCX方法。此类信号的示例是音乐。另一方面,对于表示诸如摩擦音等噪声类声音的信号段,在使用对话音编码典型的段长度时(例如,其中5 ms是话音编码信号段的经常使用的持续时间),邻近信号段的谱能量分布通常不那么相关。由于更长的时间窗口将降低 时间分辨率,并且可能在噪声类短暂音上具有拖尾效应,因此,更长的信号段持续时间经常是不当的。然而,根据本发明,噪声类声音的谱分布的控制能够通过使用编码/解码技术获得,其中,将源于音频信号的时间域信号段变换到频率域中,使得生成段谱,以及其中自适应谱码本(ASCB)用于搜索能够提供段谱的近似的向量。ASCB包括表示以前合成的段谱的多个自适应谱码本向量,将提供段谱的第一近似的其中一个向量被选中。随后,生成表示在段谱与第一谱近似之间差的残差谱。随后,搜索固定谱码本(FSCB)以识别和选择能够提供残差谱的近似的FSCB向量。随后,通过使用所选择的ASCB向量和所选择的FSCB向量的线性组合,能够合成信号段。随后,通过将表示合成幅度谱的向量包括在谱自适应码本向量集中,更新ASCB。通过使用时间对频率域变换与用于将音频信号段编码的自适应谱码本组合,实现了能够获得音频信号的有效编码和解码,其中,噪声类声音以令人满意的方式再现。实验研究显示,虽然在时间域中自适应码本一般用于促进强周期信号的编码,但一般是非周期性的噪声类信号的编码能够通过使用自适应谱码本有效执行。时间对频率域变换有利于信号段的谱能量分布的准确控制,而自适应谱码本确保能够找到段谱的适合近似,而不管在携带噪声类声音的信号段的时间邻近段谱之间的可能差的相关。根据本发明的一实施例的编码方法在图2中示出。图2所示的方法将称为基于变换的自适应编码方法。在步骤200,在编码器110接收包括N个样本的时间域(TD)信号段f5'其中,m指示段号。在图2和3的以下描述中,描述了特定信号段的编码和解码,并且将从描述中省略段号m。TD信号段F例如能够是音频信号115的段,或者TD信号段能够是音频信号115的量化和预处理段。音频信号的预处理例如能够包括通过线性预测滤波器过滤音频信号和/或感知加权。在一些实现中,量化,分段和/或任何其它预处理在编码器110中执行,或者此类信号处理能够已在编码器HO的输入连接到的其它设备中执行。在步骤205中,应用时间到频率变换到TD信号段f,使得生成段谱S。时间到频率变换例如能够是例如实现为快速傅立叶变换的离散傅立叶变换
Innk
S(k) = J] =o T(n)e ⑴,,其中,τ (η)是TD信号段样本,!1則.0,1., 洱一11,并且3(10是复DFT的第k个分量,k E [O, I,... j N — 11 ο备选能够在步骤205中使用的其它可能变换包括离散余弦变换、Hadamard变换、Kariwm-Loew变换、奇值分解(SVD)变换、正交镜像滤波器(QMF)滤波器组等。此类变换算法在技术领域中已知,并且此处将不再进一步描述。步骤205 —般包括确定幅度谱Jr
其中,M=N/2 +1 (假设N是偶数)。如果只要求幅度谱,则因此将足以使k从k=0运行到k=M,而如果需要完全相位谱,则k将有利地从k=0运行到k=N-l。在步骤210中,搜索ASCB以查找能够提供幅度谱f的第一近似及因此段谱S的第
一近似的向量。ASCB能够视为具有维数NascbXM (或MXNascb)的矩阵己,其中,Nascb表示在ASCB中包括的自适应谱码本向量的数量,其中,Nascb的典型值能够位于范围[16,128]内(备选能够使用Nascb的其它值)。矩阵的每行(或列)表示以前段的合成幅度谱,使得Ca,i,k(CA,k,i)表示用于段 m_i 的频率箱(frequency bin), ke
, i=l, 2, 3...,Nascb,其中,m表示当前段。为便于描述,在下述内容中将假设以前合成谱由ASCB矩阵^的行而不是列表示。此外,为便于说明,将假设^的行已归一化,使得
权利要求
1.一种将音频信号编码的方法,所述方法包括 在音频编码器中接收源于所述音频信号的时间域信号段; 在所述音频编码器中执行所述时间域信号段的频率分析,以便获得所述信号段的频率域表示; 搜索所述音频编码器的自适应谱码本以查找提供所述频率域表示的第一近似的自适应谱码本向量,所述自适应谱码本包括多个自适应谱码本向量; 选择提供第一近似的所述自适应谱码本向量; 从所述频率域表示与所选择的自适应谱码本向量之间的差生成残差频率表示; 搜索所述音频编码器的固定谱码本以查找提供所述残差频率表示的近似的固定谱码本向量,所述固定谱码本包括多个固定谱码本向量; 选择提供所述残差频率表示的近似的所述固定谱码本向量; 通过包括作为所选择的固定谱码本向量和所选择的自适应谱码本向量的线性组合获得的向量,更新所述音频编码器的所述自适应谱码本;以及 在所述音频编码器中生成所述收到时间域信号段的信号表示,所述信号表示指示引用所选择的固定谱码本向量的索引和引用所选择的固定谱码本向量的索引,所述信号表示要传输到解码器。
2.如权利要求I所述的编码方法,其中 所选择的自适应谱码本向量在最小均方误差意义上匹配所述频率域表示以最小化所述残差频率表示;以及 所选择的固定谱码本向量在最小均方误差意义上匹配所述残差频率表示。
3.如权利要求I或2所述的编码方法,还包括 在所述音频编码器中为将来频率域表示的编码性确定所述线性组合的相关性;以及其中 所述自适应谱码本的所述更新以所述相关性超过预确定的相关性阈值为条件。
4.如权利要求3所述的编码方法,其中 通过确定所述段的全局增益,确定所述线性组合的所述相关性;以及 所述自适应谱码本的所述更新以所述全局增益超过全局增益阈值为条件。
5.如前面权利要求任一项所述的编码方法,其中 所述段被分类为相位灵敏段或相位不灵敏段,以及其中段的所述编码取决于所述段是被分类为相位灵敏还是相位不灵敏。
6.如权利要求5所述的编码方法,其中 所述段是相位不灵敏段; 被分类为相位灵敏的任何其它收到信号段将借助于基于时间域的编码方法进行编码。
7.如权利要求5所述的编码方法,其中在所述段是相位灵敏时,所述信号表示包括比在所述段是相位不灵敏时与所述执行的频率分析的结果有关的更多信息。
8.如前面权利要求任一项所述的编码方法,其中 所述频率分析是线性预测分析,以及所述频率域表示是线性预测滤波器。
9.如权利要求1-7任一项所述的编码方法,其中 所述频率分析是时间到频率域变换,借助于所述时间到频率域变换获得段谱;以及如果从所述段谱的至少一部分形成,则所述频率域表示。
10.如权利要求9所述的编码方法,还包括 在所述音频编码器中识别所述段谱的实值DC分量的符号;以及其中执行表示所述收到时间域信号段的信号的所述生成,使得所述信号指示所述DC分量的所述符号。
11.如权利要求8或9所述的编码方法,还包括 在所述音频编码器中确定所述段谱的相位;以及其中 执行表示所述收到时间域信号段的信号的所述生成,使得所述信号指示所述段谱的所述相位的至少一部分的参数化表示。
12.如在从属于权利要求5时的权利要求11所述的编码方法,其中 所述段谱的所述相位的所述确定以所述段已被分类为相位灵敏段为条件。
13.如前面权利要求任一项所述的方法,还包括 在所述音频编码器中接收源于所述音频信号的又一时间域信号段; 在所述音频编码器中执行所述又一时间域信号段的所述频率分析,以便获得表示所述又一时间域信号的又一频率域表不; 确定由任何所述自适应谱码本向量提供的所述又一频率域表示的第一近似的质量将是否充分;以及如果不充分 则搜索所述固定谱码本以查找至少两个其它固定谱码本向量,其线性组合提供所述又一频率域表示的近似,以及选择所述至少两个其它固定谱码本向量; 通过包括作为所述至少两个其它固定谱码本向量的线性组合获得的向量,更新所述自适应谱码本;以及 在所述音频编码器中,生成表示所述又一时间域信号段并且指示其它固定码本索引的信号,每个索引引用所述至少两个其它所选择的固定码本向量之一。
14.如前面权利要求任一项所述的方法,其中 所述时间域信号段源于已通过使用线性预测滤波器过滤的所述音频信号的段。
15.如前面权利要求任一项所述的方法,其中 在执行所述搜索前,在所述音频编码器中应用感知加权到所述时间域信号段和/或所述频率域表示。
16.一种将已借助于如权利要求1-15任一项所述编码方法编码的音频信号解码的方法,所述方法包括 在音频解码器中接收表示所述音频信号的时间域信号段的信号,所述表示指示自适应谱码本索引和固定谱码本索引; 在所述音频解码器的自适应谱码本中识别所述自适应谱码本索引引用的自适应谱码本向量,所述自适应谱码本包括多个自适应谱码本向量; 在所述音频解码器的固定谱码本中识别所述固定谱码本索引引用的固定谱码本向量,所述固定谱码本包括多个固定谱码本向量; 在所述音频解码器中从所述识别的固定谱码本向量和所述识别的自适应谱码本向量的线性组合生成所述信号段的合成频率域表示; 在所述音频解码器中通过使用所述合成频率域表示,生成合成时间域信号段;以及通过包括对应于所述识别的自适应谱码本向量和所述识别的固定谱码本向量线性组合的线性组合的向量,更新所述自适应谱码本。
17.如权利要求16所述的解码方法,还包括 在所述音频解码器中为将来频率域表示的编码性确定所述线性组合的相关性;以及其中 所述自适应谱码本的所述更新以所述线性组合的所述相关性超过预确定的相关性阈值为条件。
18.如权利要求16或17所述的解码方法,还包括 在所述音频解码器中接收要合成的所述段是相位不灵敏段的指示。
19.如权利要求16-18任一项所述的解码方法,其中所述频率域表示对应于在时间域中适用的滤波器,以及通过应用所述滤波器到激励信号,执行合成时间域信号段的所述生成。
20.如权利要求16-18任一项所述的解码方法,其中 所述生成的合成频率域表示是段谱的合成幅度谱;以及 通过应用频率到时间变换到所述段谱,执行合成时间域信号段的所述生成。
21.如在从属于权利要求18时的权利要求20所述的解码方法,还包括 在执行所述频率到时间变换之前借助于随机数生成器在所述音频解码器中确定伪随机相位谱;以及 在应用所述频率到时间变换到所述段谱之前将所述伪随机相位谱指派到所述段谱。
22.如权利要求21所述的解码方法,其中 所述信号表示还包括所述段谱的实值DC分量的符号的指示;以及所述方法还包括 在应用所述频率到时间变换到所述段谱之前,在所述解码器中将所述指示的符号指派到所述伪随机相位谱的所述实值DC分量。
23.如权利要求20所述的解码方法,其中 表示所述时间域信号段的所述信号指示所述段谱的所述相位谱的至少一部分的参数化表示;所述方法还包括 在应用所述频率到时间变换到所述段谱之前,根据所述相位参数化,在所述解码器中指派相位谱到所述段谱。
24.如权利要求20-23任一项所述的解码方法,其中 所述识别的自适应谱码本向量和所述识别的固定谱码本向量是量化的谱; 所述段谱的所述合成包括 识别合成所述段谱的所述两个码本向量的所述幅度之和取负值的任何频率箱;以及在应用所述频率到时间变换到所述段谱之前,为此类频率箱将所述段谱的所述幅度设成O。
25.如权利要求16-24任一项所述的解码方法,还包括 在与又一时间域信号段的所述合成有关的所述音频编码器中,接收所述又一信号段应借助于至少两个固定谱码本向量来合成的指示,以及接收至少两个固定谱码本索引; 借助于所述收到的至少两个固定谱码本索引在所述固定谱码本中,识别对应的至少两个固定谱码本向量;在所述音频解码器中从所述至少两个识别的固定谱码本索引的线性组合生成又一合成频率域表示; 在所述音频解码器中通过使用所述合成频率域表示,生成合成时间域信号段;以及通过包括对应于所述至少两个识别的固定谱码本向量的所述线性组合的向量,更新所述自适应谱码本。
26.一种用于将音频信号编码的音频编码器,所述编码器包括 输入,配置成接收源于音频信号的时间域信号段; 自适应谱码本,配置成存储和更新多个自适应谱码本向量; 固定谱码本,配置成存储多个固定谱码本向量; 处理器,连接到所述输入,所述处理器还连接到所述自适应谱码本、所述固定谱码本及 输出,所述处理器可通过编程配置成 执行在所述输入收到的时间域信号段的频率分析,以便获得所述信号段的频率表示;搜索所述自适应谱码本以查找能够提供频率域表示的第一近似的自适应谱码本向量,以及选择能够提供所述第一近似的所述自适应谱码本向量; 从频率域表示与对应所选择的自适应谱码本向量之间的差生成残差频率表示; 搜索所述固定谱码本以识别提供所述残差频率表示的近似的固定谱码本向量; 从识别的固定谱码本向量和识别的自适应谱码本向量的线性组合生成合成频率域表示; 通过在所述自适应谱码本中存储对应于所述线性组合的向量,更新所述自适应谱码本;以及 生成收到的时间域信号段的信号表示,所述信号表示指示引用识别的自适应谱码本向量的自适应谱码本索引和引用识别的固定谱码本向量的固定谱码本索引,所述信号表示要传输到解码器;其中 所述输出连接到所述处理器并且配置成输送从所述处理器收到的信号表示。
27.如权利要求26所述的音频编码器,其中 所述处理器还可通过编程配置成 为将来频率域表示的编码性确定线性组合的相关性;以及仅在所述确定的相关性超过预确定的相关性阈值时,通过对应于识别的固定谱码本向量和识别的自适应谱码本向量的线性组合的向量更新所述自适应谱码本。
28.如权利要求26或27所述的音频编码器,其中 所述处理器还可通过编程配置成 确定收到的时间域信号段是相位灵敏信号段还是相位不灵敏信号段,以及使时间域信号段的所述编码的至少一部分适应所述时间域信号段是相位灵敏还是相位不灵敏。
29.如权利要求28所述的音频编码器,其中 所述处理器还可通过编程配置成 借助于基于时间域的编码方法,将任何收到的相位灵敏时间域信号段编码。
30.如权利要求28所述的音频编码器,其中 所述处理器配置成在所述段是相位灵敏时,包括比在所述段是相位不灵敏时与所述执行的频率分析的结果有关的更多信息。
31.如权利要求26-30任一项所述的音频编码器,其中所述处理器可通过编程配置成通过执行所述信号段的线性预测分析,执行时间域信号段的频率分析。
32.如权利要求26-30任一项所述的音频编码器,其中 所述处理器可通过编程配置成 通过应用时间到频率变换到所述信号段,使得频率域表示作为段谱的至少一部分而获得,来执行时间域信号段的频率分析。
33.如权利要求32所述的音频编码器,其中 所述处理器还可通过编程配置成 识别段谱的实值DC分量的符号;以及 生成所述收到的时间域信号段的信号表示,使得所述信号表示指示表示所述时间域信号段的所述段谱的所述DC分量的所述符号。
34.如权利要求32或33所述的音频编码器,其中 所述处理器还可通过编程配置成 确定段谱的所述相位谱; 参数化确定的相位谱;以及 生成所述收到的时间域信号段的信号表示,使得所述信号表示指示表示所述时间域信号段的参考化相位谱的至少一部分。
35.如权利要求34所述的音频编码器,其中所述处理器还可通过编程配置成仅在所述信号段是相位灵敏时才参数化信号段的所述相位谱。
36.如权利要求26-35任一项所述的音频编码器,其中 所述处理器还可通过编程配置成 确定段谱的所述第一近似的所述质量是否充分,以及如果不充分,则搜索所述固定谱码本以查找至少两个固定谱码本向量,其线性组合提供所述段谱的近似。
37.一种用于从表示编码音频信号的信号合成音频信号的音频解码器,所述解码器包括 输入,配置成接收时间域信号段的信号表示,所述信号包括自适应谱码本索引和固定谱码本索引; 自适应谱码本,配置成存储多个自适应谱码本向量; 固定谱码本,配置成存储多个固定谱码本向量; 处理器,连接到所述输入,所述处理器还连接到所述自适应谱码本、固定谱码本及输出,所述处理器可通过编程配置成 通过使用收到的自适应谱码本索引在所述自适应谱码本中识别自适应谱码本向量; 通过使用收到的固定谱码本索引在所述固定谱码本中识别固定谱码本向量; 从识别的自适应谱码本向量和识别的固定谱码本向量的线性组合生成合成频率域表示; 通过使用所述合成频率域表示,生成合成时间域信号段;以及通过在所述自适应谱码本中存储对应于所述线性组合的向量,更新所述自适应谱码本;其中 所述输出连接到所述处理器并且配置成输送从所述处理器收到的合成时间域信号段。
38.如权利要求37所述的音频解码器,其中 所述处理器还可通过编程配置成 为将来段谱的编码性确定所述合成频率域表示的相关性;以及仅在所述确定的相关性超过预确定的相关性阈值时,通过对应于识别的自适应谱码本向量和识别的固定谱码本向量的线性组合的向量更新所述自适应谱码本。
39.如权利要求37或38所述的音频解码器,其中 所述处理器还可通过编程配置成 从收到的信号取回信号段是相位灵敏信号段还是相位不灵敏信号段的指示,以及使所述解码的至少一部分适应所述时间域信号段是相位灵敏还是相位不灵敏。
40.如权利要求37-39任一项所述的音频解码器,其中 频率域表示对应于在时间域中适用的滤波器;以及 所述处理器可通过编程配置成通过应用所述滤波器到激励信号,生成合成时间域信号段。
41.如权利要求37-39任一项所述的音频解码器,其中 所述处理器可通过编程配置成通过应用频率到时间变换到所述合成频率域表示,生成合成时间域信号段,以及生成的合成频率域表示是段谱的合成幅度谱。
42.如在从属于权利要求39时的权利要求41所述的音频解码器,其中 所述处理器还可通过编程配置成 借助于随机数生成器,确定伪随机相位谱;以及 如果已取回所述信号段是相位不灵敏的指示,则在应用所述频率到时间变换到段谱之前,指派伪随机相位谱到所述段谱。
43.如权利要求42所述的音频解码器,其中 所述处理器还可通过编程配置成 从所述信号表示取回段谱的实值DC分量的符号的指示;以及在应用所述频率到时间变换到所述段谱之前,将所述指示的符号指派到伪随机相位谱的所述实值DC分量。
44.如权利要求41-43所述的音频解码器,其中 所述处理器还可通过编程配置成 从收到的信号表示取回段谱的所述相位谱的至少一部分的参考化表示的指示;以及 在应用所述频率到时间变换到段谱之前,根据所述相位参数化,指派相位谱到所述段-i'TfeP曰。
45.一种用于在移动无线电通信系统中通信的用户设备,所述用户设备包括如权利要求26-36任一项所述的音频编码器和/或如权利要求37-44任一项所述的音频解码器。
46.一种用于音频信号的编码的计算机程序,所述计算机程序包括计算机程序代码部分,所述计算机程序代码部分在编码器的处理器上运行时,促使所述编码器执行以下操作 执行时间域信号段的频率分析,以便获得所述信号段的频率表示; 搜索自适应谱码本以查找能够提供所述频率域表示的第一近似的自适应谱码本向量,以及选择能够提供所述第一近似的所述自适应谱码本向量;从所述频率域表示与所选择的自适应谱码本向量之间的差生成残差频率表示; 搜索所述固定谱码本以识别提供所述残差频率表示的近似的固定谱码本向量; 通过包括作为所选择的固定谱码本向量和所选择的自适应谱码本向量的线性组合获得的向量,更新所述自适应谱码本;以及 生成所述时间域信号段的信号表示,所述信号表示指示引用所述识别的自适应谱码本向量的索引和引用所述识别的固定谱码本向量的索引,所述信号表示要传输到解码器。
47.一种用于音频信号的解码的计算机程序,所述计算机程序包括计算机程序代码部分,所述计算机程序代码部分在解码器的处理器上运行时,促使所述解码器执行以下操作 从表示所述音频信号的时间域信号段的收到信号表示取回自适应谱码本索引和固定谱码本索引; 借助于所述取回的自适应谱码本索引在自适应谱码本中识别自适应谱码本向量; 借助于所述取回的固定谱码本索引在固定谱码本中识别固定谱码本向量; 从所述识别的自适应谱码本向量和所述识别的固定谱码本向量的线性组合生成所述信号段的合成频率域表示; 通过使用所述合成频率域表示,生成合成时间域信号段;以及通过包括对应于所述识别的自适应谱码本向量和所述识别的固定谱码本向量的线性组合的向量,更新所述自适应谱码本。
48.一种计算机程序产品,包括计算机可读部件和在所述计算机可读部件上存储的如权利要求46或47所述计算机程序。
全文摘要
本发明涉及将音频信号编码和解码的基于频率域的方法,其中,使用时间域信号段的合成频率域表示,更新自适应谱码本。执行收到时间域信号段的频率分析以便获得频率域表示,并且搜索自适应谱码本以查找频率域表示的第一近似。搜索固定谱码本以查找残差频率表示的近似值。从这两个近似可生成合成频率域表示。
文档编号G10L19/12GK102985966SQ201080068091
公开日2013年3月20日 申请日期2010年7月16日 优先权日2010年7月16日
发明者E.诺韦尔, S.布鲁恩, H.波布洛特 申请人:瑞典爱立信有限公司
音频编码器和解码器及用于音频信号的编码和解码的方法
相关推荐
专利名称:液晶显示面板及其像素结构的制作方法技术领域:本发明涉及一种液晶显示面板及其像素结构,尤其涉及一种设置有配向 电极的多区域垂直配向型液晶显示面板的像素结构。背景技术:液晶显示器已被广泛地应用在各式电子产品,如手机、个人数字助理及 笔
专利名称:一种方便擦拭的眼镜的制作方法技术领域:本实用新型属于日常生活用品技术领域,尤其涉及一种眼镜。背景技术:佩戴眼镜的人一般都会随身携带一块擦镜布,方便随时擦拭眼镜。但是在实际使用过程中,人们往往由于忘记携带擦镜布而无法及时清除眼镜上的
专利名称:透镜单元以及摄像装置的制作方法技术领域:本发明涉及,将物体的光学像成像在摄像元件上的透镜单元以及利用了它的摄像>J-U ρ α装直。背景技术:一般而言,对于称为Extended depth of focus即EDOF
专利名称:使用外部存储装置的媒体处理设备的制作方法技术领域:本发明涉及一种媒体处理设备,该媒体处理设备对一外部存储装置进行访问,读取并再现存储在该外部存储装置中的媒体文件,并且把通过一编码过程由其自身所产生的媒体文件存储在该外部存储装置中,
专利名称:一种八音盒的制作方法技术领域:本实用新型涉及电子乐器领域,具体地说是一种八音盒。技术背景 八音盒也即音乐盒,由瑞士人首次制出之后,因其精致浪漫的特点,一直得到人们 的喜爱,传统的八音盒往往采用机械构造,通过拨齿扫过金属片发出不同的
专利名称:户外手电筒的制作方法技术领域:户外手电筒技术领域[0001]本实用新型涉及照明装置领域,具体涉及一种新型的户外手电筒。背景技术:[0002]手电筒在人们的生活中已经非常普及,其通常只是起到照明作用。对于爱好户外活动的使用者,其可能