当前位置:网站首页>专利 >正文

解码设备和解码方法、编码设备和编码方法、以及程序的制作方法

专利名称:解码设备和解码方法、编码设备和编码方法、以及程序的制作方法
技术领域
本发明涉及解码设备、解码方法、编码设备、编码方法和程序。更具体地,本发明涉及可以缩短在解码时由频带扩展引起的延迟时间并且抑制解码侧在资源上的增加的解码设备、解码方法、编码设备、编码方法和程序。
背景技术
作为音频信号编码技术,通常公知下面的变换编码技术:MP3 (运动图像专家组音频层3)、AAC (高级音频编码)和ATRAC (自适应变换声学编码)。在这样的编码技术中,编码的结果不包括包含大量信息的高频频谱,而是仅包括高频频谱的包络,以便实现较高的编码效率。在这样的情况下的解码时,通过平行移动或重 复等来复制低频频谱,以产生高频频谱。仅使得所产生的高频频谱的包络更接近包含在编码的结果中的原始高频频谱的包络,以改善听觉质量。这样的解码技术被称为频带扩展技术,并且已经为公众所了解。图I是示出仅具有在编码的结果中的高频频谱的包络的编码设备的示例结构的框图。图I的编码设备10包括MDCT (修正离散余弦变换)单元11、量化单元12和复用单元13。编码设备10与通常已知的变换编码设备相同,除了在编码结果中不包括高频频谱SP-H。为了容易说明附图,量化单元12不仅执行量化,而且提取和规格化要量化的对象。具体地说,编码设备10的MDCT单元11对于作为向编码设备10输入的音频时域信号的PCM (脉冲编码调制)信号执行MDCT。通过如此进行,MDCT单元11产生作为频域信号的频谱SP。MDCT单元11向量化单元12提供所产生的频谱SP。量化单元12从作为从MDCT单元11提供的频谱SP的高频分量的高频频谱SP-H并且从作为频谱SP的低频分量的低频频谱SP-L提取包络。量化单元12量化作为提取的高频频谱SP-H的包络的高频包络ENV-H和作为提取的低频频谱SP-L的包络的低频包络ENV-L。量化单元12向复用单元13提供量化的高频包络ENV-H和低频包络ENV-L。在本说明书中,为了容易说明,信号的名称(诸如SP-L和SP-Η)在量化和编码前后是相同的。量化单元12使用低频包络ENV-L来规格化低频频谱SP_L。量化单元12量化规格化的低频频谱SP-L,并且向复用单元13提供结果产生的低频频谱SP-L。如上所述,量化单元12具有包括在频谱SP的低频分量的编码的结果中的包络和规格化的频谱,但是仅具有包括在高频分量的编码的结果中的包络。因此,编码效率变高。复用单元13复用从量化单元12提供的低频包络ENV-L、低频频谱SP-L和高频包络ENV-H。复用单元13输出结果产生的比特流。该比特流被记录在记录介质(未示出)上,或者被传送到解码设备。图2是用于说明要由图I的编码设备10执行的编码操作的流程图。当例如向编码设备10输入音频PCM信号时开始这个编码操作。在图2的步骤Sll中,MDCT单元11对于作为被输入到编码设备10的音频时域信号的PCM信号执行MDCT,并且产生作为频域信号的频谱SP。MDCT单元11向量化单元12提供所产生的频谱SP。在步骤S12中,量化单元12从作为从MDCT单元11提供的频谱SP的高频分量的高频频谱SP-H并且从作为频谱SP的低频分量的低频频谱SP-L提取包络。在步骤S13中,量化单元12使用低频包络ENV-L来规格化低频频谱SP_L。在步骤S14中,量化单元12对于提取的高频包络ENV-H、低频包络ENV-L和规格化的低频频谱SP-L执行量化。量化单元12向复用单元13提供量化的高频包络ENV-H、低频包络ENV-L和规格化的低频频谱SP-L。在步骤S15中,复用单元13复用从量化单元12提供的低频包络ENV-L、低频频谱SP-L和高频包络ENV-H。复用单元13输出结果产生的比特流。这个操作然后结束。图3是示出解码由图I的编码设备10编码的比特流的解码设备的示例结构的框 图。图3的解码设备30包括划分单元31、逆量化单元32、逆MDCT单元33和频带扩展单元34。像传统变换解码设备那样,解码设备30的划分单元31、逆量化单元32和逆MDCT单元33仅解码PCM信号的低频分量。具体地说,划分单元31获得由编码设备10编码的比特流,并且将该比特流划分为低频包络ENV-L、低频频谱SP-L和高频包络ENV-H。划分单元31然后向逆量化单元32提供低频包络ENV-L、低频频谱SP-L和高频包络ENV-H。逆量化单元32对于从划分单元31提供的低频包络ENV-L、低频频谱SP-L和高频包络ENV-H执行逆量化。逆量化单元32然后向逆MDCT单元33提供逆量化的低频包络ENV-L和低频频谱SP-L,并且向频带扩展单元34提供高频包络ENV-H。利用从逆量化单元32提供的低频包络ENV-L,逆MDCT单元33将低频频谱SP-L去规格化。逆MDCT单元33对于作为去规格化的频域信号的低频频谱SP-L执行逆MDCT,并且获得作为时域信号的PCM信号。该PCM信号是不包含高频分量的PCM信号,并且是使得在听觉上低沉的声音的PCM信号。逆MDCT单元33向频带扩展单元34提供该PCM信号。频带扩展单元34包括频带划分滤波器41、高频分量产生单元42和频带组合滤波器43。频带扩展单元34扩展由逆MDCT单元33获得的并且不包含高频分量的PCM信号的频带。通过如此进行,频带扩展单元34执行频带扩展操作,以改善PCM信号的声音质量。具体地说,频带扩展单元34的频带划分滤波器41将从逆MDCT单元33提供的PCM信号划分为高频分量和低频分量。因为这个PCM信号不包含高频分量,所以频带划分滤波器41丢弃所划分的PCM信号的高频分量。频带划分滤波器41也向高频分量产生单元42和频带组合滤波器43提供作为划分的PCM信号的低频分量的低频PCM信号BS-L。使用从频带划分滤波器41提供的低频PCM信号BS-L和从逆量化单元32提供的高频包络ENV-H,高频分量产生单元42产生要作为伪高频PCM信号BS-H的高频PCM信号。在由申请人提交的专利文献I中公开了产生伪高频PCM信号BS-H的示例方法。高频分量产生单元42向频带组合滤波器43提供该伪高频PCM信号BS-H。频带组合滤波器43将从频带划分滤波器41提供的低频PCM信号BS-L与从高频分量产生单元42提供的伪高频PCM信号BS-H组合,并且输出作为解码的结果的整个频带的PCM信号。与以上述方式输出的整个频带的PCM信号对应的声音比与不包含高频分量的PCM信号对应的声音相比低沉感更小,并且是美好的和舒适的声音。图4是用于描述从逆MDCT单元33和频带组合滤波器43输出的信号的图。在图4中,横坐标指示频率,并且纵坐标指示信号电平。这也适用于下述的图7、10和12至6。从逆MDCT单元33输出的信号是通过使用低频包络ENV-L去规格化的低频频谱SP-L的PCM信号,如图4的A中所示。从频带组合滤波器43输出的信号是包含作为通过使用低频包络ENV-L去规格化的低频频谱SP-L的PCM信号的低频分量和作为从高频包络ENV-H和低频PCM信号BS-L产生的伪高频PCM信号BS-H的高频分量的PCM信号,如图4中的B中所示。图5是用于说明要由图3的解码设备30执行的解码操作的流程图。例如,当由编码设备10编码的比特流被输入到解码设备30时开始该解码操作。 在图5的步骤S31中,划分单元31将向解码设备30输入的比特流划分为低频包络ENV-L、低频频谱SP-L和高频包络ENV-H。划分单元31然后向逆量化单元32提供低频包络ENV-L、低频频谱SP-L和高频包络ENV-H。在步骤S32中,逆量化单元32对于从划分单元31提供的低频包络ENV-L、低频频谱SP-L和高频包络ENV-H执行逆量化。逆量化单元32向逆MDCT单元33提供逆量化的低频包络ENV-L和低频频谱SP-L。逆量化单元32向频带扩展单元34提供高频包络ENV-H。在步骤S33中,逆MDCT单元33使用从逆量化单元32提供的低频包络ENV-L去规格化低频频谱SP-L。在步骤S34中,逆MDCT单元33对于作为去规格化的频域信号的低频频谱SP-L执行逆MDCT,并且获得作为时域信号的PCM信号。逆MDCT单元33向频带扩展单元34提供该PCM信号。在步骤S35中,频带扩展单元34的频带划分滤波器41将从逆MDCT单元33提供的PCM信号划分为高频分量和低频分量。频带划分滤波器41丢弃划分的PCM信号的高频分量,并且向高频分量产生单元42和频带组合滤波器43提供作为划分的PCM信号的低频分量的低频PCM信号BS-L。在步骤S36中,高频分量产生单元42使用从频带划分滤波器41提供的低频PCM信号BS-L和从逆量化单元32提供的高频包络ENV-H来产生伪高频PCM信号BS-H。高频分量产生单元42向频带组合滤波器43提供伪高频PCM信号BS-H。在步骤S37中,频带组合滤波器43将从频带划分滤波器41提供的低频PCM信号BS-L与从高频分量产生单元42提供的伪高频PCM信号BS-H组合,以获得整个频带的PCM信号。频带组合滤波器43输出整个频带的PCM信号,并且操作结束。在作为国际标准的HE-AAC (高效率高级音频编码)中和在LPEC (商标名)的立体声高质量模式中已经使用上述的频带扩展技术。如上所述,通过传统的频带扩展技术,将频带扩展操作执行为低频频谱SP-L的解码的后处理。因此,可以使得伪高频PCM信号BS-H的自由度较高。即,可以不从作为频域信号的低频频谱SP-L产生伪高频PCM信号BS-H,而是从作为时域信号的低频PCM信号BS-L产生伪高频PCM信号BS-H。
任意地设置在编码操作和解码操作中的处理块大小和在频带扩展操作中的处理块大小,以便优化频率分析精度和时间解析精度。在其中通过在专利文献I中公开的技术来产生伪高频PCM信号的情况下,需要执行复杂的过程来从高频包络ENV-H产生噪声频谱,从高频包络ENV-H和低频PCM信号BS-L产生音调频谱(tonic spectrum),并且比较该两个频谱。产生噪声频谱和音调频谱的处理是在增大在低频频谱和高频频谱之间的匹配精度以产生具有高听觉质量的声音中的必要处理,并且也在专利文献2和3中公开的解码设备中执行。引用列表专利文献
专利文献I :日本专利No. 3861770专利文献2 日本专利No. 3646938专利文献3 日本专利No. 3646939

发明内容
本发明要解决的问题如上所述,已经以频带扩展技术作为低频频谱SP-L的解码的后处理来执行的方式对传统的频带扩展技术研究、开发和投入实践。因此,在已经从由划分单元31、逆量化单元32和逆MDCT单元33执行的传统解码操作的结束(在图3中所示的示例中的时间T0)起经过频带扩展单元34所需的处理时间(在图3中所示的示例中的时间Tl)后,输出整个频带的PCM信号。如果解码设备30设置在仅再现声音的再现设备中,则这不引起严重问题。然而,在解码设备30设置在与声音同步地再现视频图像的再现设备中的情况下,在仅执行传统解码的情况和也执行频带扩展的情况之间在整个频带的PCM信号的输出时间上存在差别。结果,与声音同步地输出视频图像变得困难。为了解决这个问题,需要延迟用于再现视频图像的时刻。然而,视频图像缓冲需要具有比用于声音缓冲的存储器的容量大的容量的存储器,导致在资源上的增加。可以预先延迟在视频图像和声音之间的同步时刻。然而,是否仅执行传统解码和是否执行频带扩展和传统解码取决于要使用的再现设备。因此,难以总是指定最佳同步时刻。解码设备30需要另外包括用于频带扩展的频带扩展单元34,导致与不执行频带扩展的解码设备中相比更多的资源。鉴于上面的情况,期望执行频带扩展的解码设备缩短由频带扩展引起的延迟时间,并且抑制在资源上的增加。已经鉴于上面的情况作出了本发明,并且其目的是缩短在解码时由频带扩展引起的延迟时间,并且抑制解码侧在资源上的增加。对于问题的解决方案根据本发明的第一方面的解码设备包括获得单元,其被配置来获得作为编码结果的音频信号的低频包络、通过使用所述低频包络规格化的低频频谱、所述音频信号的高频包络和所述音频信号的高频频谱的集中度;产生单元,其被配置来通过使用在由所述获得单元获得的所述编码结果中的所述规格化的低频频谱和所述高频包络来产生频谱;随机化单元,其被配置来基于所述集中度来随机化由所述产生单元产生的所述频谱的相位;以及组合单元,其被配置来通过使用在由所述获得单元获得的所述编码结果中的所述低频包络来去规格化所述低频频谱,并且将由所述随机化单元随机化的所述频谱或由所述产生单元产生的所述频谱与去规格化的所述低频频谱组合,所述组合的结果被用作整个频带的频
-i'TfeP曰。本发明的第一方面的解码方法和程序对应于本发明的第一方面的解码设备。在本发明的第一方面中,作为编码结果获得音频信号的所述低频包络、通过使用所述低频包络规格化的所述低频频谱、所述音频信号的所述高频包络和所述音频信号的所述高频频谱的集中度。通过使用在所述获得的编码结果中的所述低频频谱和所述高频包络来产生频谱。基于所述集中度,将所述频谱的相位随机化。通过使用在所述获得的编码结 果中的所述低频包络来去规格化所述低频频谱。所述随机化的频谱或所述产生的频谱与去规格化的所述低频频谱组合,并且所述组合结果被用作所述整个频带的频谱。根据本发明的第二方面的解码设备包括获得单元,其被配置来获得作为编码结果的音频信号的低频包络、通过使用所述低频包络规格化的低频频谱和所述音频信号的高频包络;产生单元,其被配置来通过使用在由所述获得单元获得的所述编码结果中的所述规格化的低频频谱和所述高频包络来产生频谱;确定单元,其被配置来基于在由所述获得单元获得的所述编码结果中的所述规格化的低频频谱来确定所述低频频谱的集中度;随机化单元,其被配置来基于由所述确定单元确定的所述集中度来随机化由所述产生单元产生的所述频谱的相位;以及组合单元,其被配置来通过使用在由所述获得单元获得的所述编码结果中的所述低频包络来去规格化所述低频频谱,并且将由所述随机化单元随机化的所述频谱或由所述产生单元产生的所述频谱与去规格化的所述低频频谱组合,所述组合的结果被用作整个频带的频谱。本发明的第二方面的解码方法和程序对应于本发明的第二方面的解码设备。在本发明的第二方面中,作为编码结果获得音频信号的所述低频包络、通过使用所述低频包络规格化的所述低频频谱和所述音频信号的所述高频包络。通过使用在所述获得的编码结果中的所述规格化的低频频谱和所述高频包络来产生频谱。基于在所述获得的编码结果中的所述规格化的低频频谱,确定所述低频频谱的集中度。基于所述确定的集中度,随机化所述产生的频谱的相位。通过使用在所述获得的编码结果中的所述低频包络来去规格化所述低频频谱。所述随机化的频谱或所述产生的频谱与去规格化的所述低频频谱组合,并且所述组合结果被用作所述整个频带的频谱。根据本发明的第三方面的编码设备包括确定单元,其被配置来基于音频信号的高频频谱来确定所述高频频谱的集中度;提取单元,其被配置来从所述音频信号的频谱提取低频频谱的包络和所述高频频谱的包络;规格化单元,其被配置来通过使用所述低频频谱的所述包络来规格化所述低频频谱;以及复用单元,其被配置来通过复用由所述确定单元确定的所述集中度、由所述提取单元提取的所述低频频谱的所述包络和所述高频频谱的所述包络以及由所述规格化单元规格化的所述低频频谱来获得编码结果。本发明的第三方面的编码方法和程序对应于本发明的第三方面的编码设备。在本发明的第三方面,基于所述高频频谱来确定音频信号的所述高频频谱的集中度。从所述音频信号的频谱提取所述低频频谱的所述包络和所述高频频谱的所述包络。通过使用所述低频频谱的所述包络来规格化所述低频频谱。复用所述确定的集中度、所述提取的所述低频频谱的包络、所述提取的所述高频频谱的包络和所述规格化的低频频谱,以获得编码结果。所述第一或第二方面的所述解码设备和所述第三方面的所述编码设备可以彼此独立,或可以是构成设备的内部块。本发明的效果根据本发明的第一和第二方面,可以缩短由在解码时的频带扩展引起的延迟时间,并且可以抑制在资源上的增加。根据本发明的第三方面,可以执行编码使得可以缩短由在解码时的频带扩展引起的延迟时间,并且可以抑制解码侧在资源上的增加。


图I是示出编码设备的示例结构的框图。图2是用于说明要由图I的编码设备执行的编码操作的流程图。图3是示出解码设备的示例结构的框图。图4是用于说明从逆MDCT单元和频带组合滤波器输出的信号的图。图5是用于说明要由图3的解码设备执行的解码操作的流程图。图6是示出应用了本发明的编码设备的第一实施例的示例结构的框图。图7是用于说明从图6的MDCT单元和量化单元输出的信号的图。图8是用于说明要由图6的编码设备执行的编码操作的流程图。图9是示出解码由图6的编码设备编码的比特流的解码设备的示例结构的框图。图10是用于说明从图9的逆MDCT单元输出的信号的图。图11是用于说明在其中执行相位随机化的情况和其中不执行相位随机化的情况之间在解码结果上的差别的图。图12是用于说明高频频谱SP-H的特性的图。图13是用于说明高频频谱SP-H的特性的图。图14是用于说明高频频谱SP-H的特性的图。图15是用于说明高频频谱SP-H的特性的图;图16是用于说明高频频谱SP-H的特性的图。图17是用于说明要由图9的解码设备执行的解码操作的流程图。图18是示出应用了本发明的解码设备的第二实施例的示例结构的框图。图19是用于说明要由图18的解码设备执行的解码操作的流程图。图20是示出计算机的示例结构的图。
具体实施例方式<第一实施例>[编码设备的第一实施例的示例结构]图6是示出应用了本发明的编码设备的第一实施例的示例结构的框图。
在图6中所示的结构中,通过与在图I中所示的附图标记相同的附图标记来表示与在图I中所示的部件相同的部件,并且将不重复相同的说明。图6的编码设备50的结构与图I的结构不同在将量化单元12和复用单元13替换为量化单元51和复用单元52。编码设备10通过复用随机标记RND (下面详细说明)以及低频包络ENV-L、低频频谱SP-L和高频包络ENV-H来产生比特流。具体地说,编码设备50的量化单元51包括确定单元61、提取单元62、规格化单元63和部分量化单兀64。基于从MDCT单元11提供的频谱SP的高频频谱SP_H,确定单元61根据下面的等式(I)来确定高频频谱SP-H的集中度D D=max(SP-H)/ave(SP-H)... (I) 在等式(I)中,max (SP-H)表示高频频谱SP-H的最大值,并且ave (SP-H)表示高频频谱SP-H的平均值。根据等式(I ),在要编码的声音的高频分量的音调特性突出并且高频频谱SP-H的分布具有高偏差程度的情况下,集中度D高。在要编码的声音的高频分量的噪声特性突出并且高频频谱SP-H的分布均匀的情况下,集中度D低。确定单元61基于集中度D来确定随机标记RND。随机标记RND是下述标记该标记指示是否要随机化频谱的相位,以近似在下述的解码设备中的频带扩展操作中从低频频谱SP-L和高频包络ENV-H产生的高频频谱SP-H。例如,在集中度D大于预先在编码设备50中设置的阈值或高频频谱SP-H的音调特性突出的情况下,随机标记RND被设置为0,其指示不执行随机化。在集中度D等于或小于预定阈值或高频频谱SP-H的噪声特性突出的情况下,随机标记RND被设置为I,其指示要执行随机化。确定单元61向复用单元52提供所确定的随机标记RND。像图I的量化单元12那样,提取单元62从自MDCT单元11提供的频谱SP的高频频谱SP-H和低频频谱SP-L提取包络。像量化单元12那样,规格化单元63使用低频包络ENV-L来规格化低频频谱SP_L。部分量化单元64对于规格化的低频频谱SP-L执行量化,并且向复用单元52提供结果产生的低频频谱SP-L。像量化单元12那样,部分量化单元64也量化提取的高频包络ENV-H和低频包络ENV-L。像量化单元12那样,部分量化单元64向复用单元52提供量化的高频包络ENV-H和低频包络ENV-L。复用单元52复用从量化单元51的确定单元61提供的随机标记RND以及从部分量化单元64提供的低频包络ENV-L、低频频谱SP-L和高频包络ENV-H。复用单元52输出结果产生的比特流。该比特流被记录在记录介质(未示出)上或被传送到解码设备。[在编码设备中的信号的描述]图7是用于说明从图6的编码设备50的MDCT单元11和量化单元51输出的信号的图。如图7中的A中所示,从MDCT单元11输出的频谱SP是整个频带的频谱。另一方面,从量化单元51输出并且排除随机标记RND的信号包括低频频谱SP-L、低频包络ENV-L和高频包络ENV-H,如图7中的B中所示。[编码设备的操作的说明]
图8是用于说明要由图6的编码设备50执行的编码操作的流程图。当例如向编码设备50输入音频PCM信号时开始编码操作。在图8的步骤S51中,MDCT单元11对于作为向编码设备50输入的音频时域信号的PCM信号执行MDCT,以产生作为频域信号的频谱SP,就像在图2的步骤Sll中那样。MDCT单元11向量化单元51提供所产生的频谱SP。在步骤S52中,基于从MDCT单元11提供的频谱SP的高频频谱SP-H,量化单元51的确定单元61根据上述的等式(I)来确定高频频谱SP-H的集中度D。在步骤S53中,确定单元61基于集中度D来确定随机标记RND。确定单元61向复用单元52提供所确定的随机标记RND,并且操作移动到步骤S54。步骤S54至S56的过程与图2的步骤S12至S14的过程相同,并且因此,在此不重复它们的说明。 在步骤S56的过程后,复用单元52在步骤S57中复用从量化单元51提供的随机标记RND、低频包络ENV-L、低频频谱SP-L和高频包络ENV-H。复用单元52输出结果产生的比特流。操作然后结束。[解码设备的示例结构]图9是示出解码由图6的编码设备50编码的比特流的解码设备的示例结构的框图。图9的解码设备70包括划分单元71、逆量化单元72、高频分量产生单元73、相位随机化单元74和逆MDCT单元75。解码设备70与低频频谱SPL的解码同时地执行频带扩
展操作。具体地说,划分单元71(获得单元)获得由图6的编码设备50编码的比特流。划分单元71将比特流划分为随机标记RND、低频包络ENV-L、低频频谱SP-L和高频包络ENV-H,随机标记RND、低频包络ENV-L、低频频谱SP-L和高频包络ENV-H然后被提供到逆量化单元72。像图3的逆量化单元32那样,逆量化单元72对于从划分单元71提供的低频包络ENV-L、低频频谱SP-L和高频包络ENV-H执行逆量化。逆量化单元72向逆MDCT单元75提供逆量化的低频包络ENV-L,并且向逆MDCT单元75和高频分量产生单元73提供低频频谱SP-L。逆量化单元72也向高频分量产生单元73提供高频包络ENV-H,并且向相位随机化单元74提供随机标记RND。使用从逆量化单元72提供的低频频谱SP-L和高频包络ENV-H,高频分量产生单元73产生要作为伪高频频谱的高频频谱。具体地说,高频分量产生单元73复制低频频谱SP-L,并且通过使用高频包络ENV-H来将复制的频谱变形,以形成伪高频频谱。为了产生这个伪高频频谱,可以使用在由申请人提交的专利文献I中公开的技术,或者,也可以使用某种其他技术。高频分量产生单元73向相位随机化单元74提供所产生的伪高频频谱。基于从逆量化单元72提供的随机标记RND,相位随机化单元74随机化从高频分量产生单元73提供的伪高频频谱的相位。具体地说,在指示要执行随机化的随机标记RND是I的情况下,相位随机化单元74根据下面的等式(2)来随机化伪高频频谱的符号(+或_)
SP-H (i) =-r (rand O &0 X I) X SP-H (i) · · · (2)在等式(2)中,SP-H表示高频频谱,并且i表示频谱号。根据等式(2),将高频频谱SP-H乘以“-I”由随机函数rand()的返回值的最低I个比特指示的次数,使得向高频频谱SP-H的符号随机分配-I或I。在指示不要执行随机化的随机标记RND是O的情况下,相位随机化单元74不随机化伪高频频谱的相位。相位随机化单元74向逆MDCT单元75提供将其相位随机化的伪高频频谱或未将其相位随机化的伪高频频谱。逆MDCT单元75 (组合单元)使用从逆量化单元72提供的低频包络ENV-L去规格化低频频谱SP-L。逆MDCT单元75将去规格化的低频频谱SP-L与从相位随机化单元74提供的伪高频频谱组合。逆MDCT单元75对于作为组合的结果获得的频域信号的整个频带频谱执行逆MDCT。通过如此进行,逆MDCT单元75获得作为时域信号的整个频带的PCM信号。 逆MDCT单元75输出至少解码结果的整个频带的PCM信号。如上所述,解码设备70与低频频谱SP-L的解码同时地产生伪高频频谱。因此,在解码设备70中的解码所需的时间与在仅执行解码的传统解码设备中的解码所需的时间基本上相同。即,图9的解码设备70可以在从比特流输入时起经过时间TO后输出解码的结果。换句话说,在解码设备70中的频带扩展不引起任何延迟。[在解码设备中的信号的描述]图10是用于说明从图9的解码设备70的逆MDCT单元75输出的信号的图。从逆MDCT单元75输出的信号是在对于通过使用在图10中所示的低频包络ENV-L规格化的低频频谱SP-L和根据在图10中所示的高频包络ENV-H和低频频谱SP-L产生的伪高频频谱的组合的结果执行频率变换之后获得的PCM信号。[相位随机化的效果的描述]图11至16是用于说明由图9的相位随机化单元74执行的相位随机化的效果的图。图11是用于说明在执行相位随机化的情况和不执行相位随机化的情况之间在解码结果上的差别的图。如图11中所示,图6的编码设备50编码在被称为帧的具有恒定长度的每一个区间中的PCM信号。那些帧通常彼此交迭50%。具体地说,第(J-I)帧和第J帧彼此交迭半个帧,如图11中所示。图11图示了编码具有显著的音调特性的频谱的情况,如在图11的左侧所示。在该情况下,如图11的右上部中所示,当解码第(J-I)和第J帧的频谱时未随机化频谱的相位,通过第(J-I)帧和第J帧的符号和频谱的组合来精确地恢复在第(J-I)帧和第J帧之间的交迭时间段的频谱的相位。因此,交迭时间段的恢复的频谱是具有显著的音调特性的频谱。另一方面,如在右下部分中所示,当解码第(J-I)帧和第J帧的频带时,随机化频谱的相位,第(J-I)帧和第J帧的频谱的符号不总是相同。因此,未精确地恢复交迭时间段的频谱的相位。结果,在解码设备70中的交迭时间段的恢复信号是具有比在编码前的频谱的音调特性差的音调特性的频谱。
当频谱的音调特性变差时,原始集中在特定频谱上的能量泄漏到周围的频谱内。因此,频谱的峰值(顶部)比原始频谱更被抑制,并且,频谱的底部的能量被泄漏到周围的能量提高。结果,频谱获取噪声特性。如上所述,在解码时执行相位随机化的情况下,具有编码前音调特性的频谱被变换为具有噪声特性的频谱。图12至16是用于说明高频频谱SP-H的特性的图。如图12中的A中所示,在低频频谱SP-L的音调特性显著的情况下,高频频谱SP-H的音调特性经常也显著。可以从下述情况推断这一点诸如管乐器和弦乐器的乐器发射作为基频和谐波分量的组合的声波,该谐波分量是基频的整数倍。
在其中对于使用具有显著的音调特性的低频频谱SP-L和高频频谱SP-H形成的频谱执行频带扩展编码的情况下,通过在频带扩展解码时简单地复制低频频谱SP-L而产生的伪高频频谱是具有显著的音调特性的频谱,如图12中的B中所示。因此,与解码的结果对应的声音几乎不是不顺耳的。因此,在集中度D大于预定阈值或要编码的声音的高频分量具有音调特性的情况下,图6的编码设备50将随机标记RND设置为O。因此,在解码设备70中不随机化伪高频频谱的相位。因此,与解码结果对应的声音几乎不是不顺耳的。在低频频谱SP-L具有显著的噪声特性的情况下,噪声特性变得在高频更显著,如图13中的A中和在图14中的A中所示。可以从下述情况推断这一点高频的振动在发出具有显著的噪声特性或不具有音调特性的打击声音和碰撞声音的诸如铙钹和沙锤的乐器中传播,并且,高频声音具有更显著的噪声特性,其中各个振动元素的振幅和相位复杂地交缠。在对于使用如上所述具有显著的噪声特性的低频频谱SP-L和高频频谱SP-H形成的频谱执行频带扩展编码的情况下,通过在频带扩展解码时使用低频频谱SP-L产生的伪高频频谱是具有显著的噪声特性的频谱,如在图13中的B中所示。因此,在如图13中的B中所示对于伪高频频谱不执行相位随机化的情况下或在如图14中的B中所示执行相位随机化的情况下,伪高频频谱的噪声特性显著,并且与解码结果对应的声音几乎不是不顺耳的。然而,诸如铙钹和沙锤的、具有显著的噪声特性的乐器的声音的低频分量可能包含音调振动分量。此外,诸如铙钹和沙锤的乐器的声音的频率主要是高频,并且,有可能低频分量也包含具有显著音调特性的声音。因此,即使在高频频谱SP-H的噪声特性显著的情况下,低频频谱SP-L的音调特性可能显著,如图15中的A中和图16的A中所示。在如上所述对于使用具有显著的音调特性的低频频谱SP-L和具有显著的噪声特性的高频频谱SP-H形成的频谱执行频带扩展编码的情况下,通过在频带扩展解码时使用低频频谱SP-L产生的伪高频频谱可能包含音调分量,如图15中的B中所示。因此,如果如图15的B中所示未随机化伪高频频谱的相位,则与解码的结果对应的高频声音没有原始噪声特性,而是具有像低频声音那样的音调特性,导致不顺耳的声音。另一方面,在随机化伪高频频谱的相位的情况下,即使原始伪高频频谱包含音调分量,随机化后的伪高频频谱也具有图16中的B中所示的噪声特性。因此,与解码的结果对应的声音几乎不是不顺耳的。
在高频频谱SP-H具有噪声特性的情况下,如果低频频谱SP-L也具有噪声特性,则可以执行或可以不执行随机化。然而,在该情况下,如果低频频谱SP-L具有音调特性,则需要执行随机化。因此,在高频频谱SP-H具有噪声特性的情况下,总是执行随机化,使得可以基于集中度D来实现几乎不是不顺耳的解码结果。鉴于这一点,在集中度D等于或小于预定阈值或要编码的声音的高频分量具有噪声特性的情况下,图6的编码设备50将随机标记RND设置为I。结果,在解码设备70中随机化伪高频频谱的相位。因此,与解码的结果对应的声音几乎不是不顺耳的。因为自然界几乎没有在低频具有显著的噪声特性并且在高频具有显著的音调特性的声音,所以在此不讨论使用具有显著的噪声特性的低频频谱SP-L和具有显著的音调特性的高频频谱SP-H形成的频谱。[解码设备的操作的说明]
图17是用于说明要由图9的解码设备70执行的解码操作的流程图。例如,当由编码设备50编码的比特流被输入到解码设备70时开始这个解码操作。在图17的步骤S71中,划分单元71获得由编码设备50编码的比特流,并且将该比特流划分为随机标记RND、低频包络ENV-L、低频频谱SP-L和高频包络ENV-H。划分单元71向逆量化单元72提供随机标记RND、低频包络ENV-L、低频频谱SP-L和高频包络ENV-H。在步骤S72中,逆量化单元72对于从划分单元71提供的低频包络ENV-L、低频频谱SP-L和高频包络ENV-H执行逆量化。逆量化单元72向逆MDCT单元75提供逆量化的低频包络ENV-L,并且向逆MDCT单元75和高频分量产生单元73提供低频频谱SP-L。此外,逆量化单元72向高频分量产生单元73提供高频包络ENV-H,并且向相位随机化单元74提供随机标记RND。在步骤S73中,高频分量产生单元73通过使用从逆量化单元72提供的低频频谱SP-L和高频包络ENV-H来产生伪高频频谱。高频分量产生单元73向相位随机化单元74提供所产生的伪高频频谱。在步骤S74中,相位随机化单元74确定从逆量化单元72提供的随机标记RND是否为I。如果在步骤S74中将随机标记RND确定为1,则相位随机化单元74在步骤S75中根据上述的等式(2)来随机化从高频分量产生单元73提供的伪高频频谱的相位。相位随机化单元74然后向逆MDCT单元75提供其相位被随机化的伪高频频谱,并且操作移动到步骤 S76。如果在步骤S74中随机标记RND被确定为不是I或被确定为0,则相位随机化单元74不随机化伪高频频谱的相位,并且将伪高频频谱原样提供到逆MDCT单元75。操作然后移动到步骤S76。在步骤S76中,逆MDCT单元75通过使用从逆量化单元32提供的低频包络ENV-L来去规格化低频频谱SP-L。在步骤S77中,逆MDCT单元75将去规格化的低频频谱SP-L与从相位随机化单元74提供的伪高频频谱组合,并且对于结果产生的整个频带的频谱执行逆MDCT。通过如此进行,逆MDCT单元75获得整个频带的PCM信号。逆MDCT单元75将整个频带的PCM信号输出为解码结果,并且操作结束。如上所述,解码设备70通过使用在逆MDCT前的低频频谱SP-L来产生伪高频频谱,并且根据基于高频频谱SP-H的集中度确定的随机标记RND来随机化伪高频频谱。通过如此进行,解码设备70恢复要编码的声音的频谱的高频分量。通过以上面的方式使用低频频谱SP-L,可以将与高频频谱SP-H相对类似的频谱恢复为要编码的声音的频谱的高频分量。因此,由于通过使用低频频谱SP-L来恢复要编码的声音的频谱的高频分量,可以对于低频频谱SP-L同时执行解码操作和频带扩展操作,并且可以缩短由频带扩展引起的延迟时间。结果,像在未执行频带扩展操作的解码设备中那样,在已经经过大体相同的时间段后,未低沉化并且美好和顺耳的声音的整个频带的PCM信号作为解码的结果被输出。此外,解码设备70随机化通过使用低频频谱SP-L产生的伪高频频谱的相位,以产生具有噪声特性的伪高频频谱。因此,解码设备70可以产生比其中简单地产生任意的频谱作为伪高频频谱的情况更类似于高频频谱SP-H的伪高频频谱。 此外,解码设备70产生在逆MDCT前的频谱的低频分量和高频分量。因此,解码设备70不必包括用于频带扩展操作的频带划分滤波器41和频带组合滤波器43,就像图3的解码设备30那样。因此,与图3的解码设备30中的那些作比较,可以减少用于频带扩展操作的处理和诸如电路大小和代码大小的资源。〈第二实施例〉[解码设备的第二实施例的示例结构]图18是示出应用了本发明的解码设备的第二实施例的示例结构的框图。在图18中所示的部件中,通过在图3和图9中所使用的相同的附图标记来表示与在图3和图9中所示的那些相同的部件,并且将不重复相同的说明。图18的解码设备100的结构与图9的解码设备70的结构不同在划分单元71和逆量化单元72被替换为划分单元31和逆量化单元32,并且增加确定单元101。解码设备100基于包括在由图I的编码设备10编码的比特流中的低频频谱SP-L来确定随机标记RND。具体地说,基于由逆量化单元32逆量化的低频频谱SP-L,确定单元101根据例如下面的等式(3)来确定低频频谱SP-L的集中度D’ D' =max (SP-L)/ave (SP-L) ·· · (3)在等式(3)中,max (SP-L)表示低频频谱SP-L的最大值,并且ave (SP-L)表示低频频谱SP-L的平均值。根据等式(3),在要编码的声音的低频分量的音调特性显著并且低频频谱SP-L的分布具有高偏差程度的情况下,集中度D’高。在要编码的声音的低频分量的噪声特性显著并且低频频谱SP-L的分布均匀的情况下,集中度D’低。确定单元101基于集中度D’来确定随机标记RND。具体地说,在集中度D大于预先在解码设备100中设置的阈值或低频频谱SP-L的音调特性显著的情况下,确定单元101确定随机标记RND是O。另一方面,在集中度D’等于或小于预定阈值或低频频谱SP-L的噪声特性显著的情况下,确定单元101确定随机标记RND是I。确定单元101向相位随机化单元74提供确定的随机标记RND。因此,在低频频谱SP-L的音调特性显著的情况下,不随机化伪高频频谱的相位。在低频频谱SP-L的噪声特性显著的情况下,随机化伪高频频谱的相位。结果,与解码结果对应的声音具有足够高的听觉质量。
[解码设备的操作的说明]图19是说明要由图18的解码设备100执行的解码操作的流程图。当例如由图I的编码设备10编码的比特流被输入到解码设备100时开始这个解码操作。在图19的步骤S91中,划分单元31将由编码设备10编码的比特流划分为低频包络ENV-L、低频频谱SP-L和高频包络ENV-H,低频包络ENV-L、低频频谱SP-L和高频包络ENV-H然后被提供到逆量化单元32。步骤S92和S93的过程与图17的步骤S72和S73的过程相同,并且因此,在此不重复它们的说明。在步骤S93的过程后,确定单元101在步骤S94中基于由逆量化单元32逆量化的低频频谱SP-L根据上述的等式(3)来确定低频频谱SP-L的集中度D’。
在步骤S95中,确定单元101基于集中度D’来确定随机标记RND。确定单元101向相位随机化单元74提供随机标记RND,并且操作移动到步骤S96。步骤S96至S99的过程与图17的步骤S74至S77的过程相同,并且因此,在此不重复它们的说明。〈第三实施例〉[应用了本发明的计算机的说明]可以通过硬件或软件来执行上述系列的编码过程和解码过程。在通过软件来执行系列编码过程和解码过程的情况下,在通用的计算机等中安装作为软件的程序。图20示出其中安装了用于执行上述系列的过程的程序的计算机的实施例的示例结构。可以预先在作为在计算机中设置的记录媒体的存储单元208或ROM (只读存储器)202中记录程序。替代地,可以在可装卸介质211中存储(记录)程序。这个可装卸介质211可以被设置为所谓的封装软件。在此,可装卸介质211可以例如是软盘、CD-ROM (致密盘只读存储器)、M0 (磁光)盘、DVD (数字通用盘)、磁盘或半导体存储器等。经由驱动器210从上述的可装卸介质211在计算机中安装程序。替代地,可以将程序经由通信网络或广播网络下载到计算机内,并且安装在内部存储单元208中。S卩,可以从下载站点经由用于数字卫星广播的人造卫星无线地向计算机传送程序,或者可以经由诸如LAN (局域网)或因特网的网络向计算机在线传送程序。计算机包括CPU (中央处理单元)201,并且,输入/输出接口 205经由总线204连接到 CPU 201。当通过用户经由输入/输出接口 205操作输入单元206来输入指令时,CPU 201根据指令执行存储在ROM 202中的程序。替代地,CPU 201从存储单元208向RAM (随机存取存储器)203内加载程序,然后执行该程序。利用该布置,CPU 201根据上述的流程图来执行操作或使用在上述的框图中所示的结构来执行操作。经由输入/输出接口 205,CPU 201例如在必要时从输出单元207输出操作的结果,或者从通信单元209传送结果,或者在存储单元208内记录结果。输入单元206是键盘、鼠标或麦克风等。输出单元207是IXD (液晶显示器)或扬
声器等。
在本说明书中,不必通过按照在流程图中所示的序列以时间顺序来执行要由计算机根据程序执行的过程。即,要由计算机根据程序执行的过程包括要并行地或独立于彼此而执行的过程(诸如,并行处理或通过对象的处理)。程序可以被计算机(或处理器)执行,或者可以被两个或更多的计算机分布式地执行。此外,程序可以被传送到远程计算机并且被远程计算机执行。本发明的实施例不限于上述的实施例,并且可以在不偏离本发明的范围的情况下对于它们进行各种修改。附图标记列表50编码设备52复用单元
61确定单元62提取单元63规格化单元70解码设备71划分单元73高频分量产生单元74相位随机化单元75 逆 MDCT 单元100解码设备101划分单元101确定单元
权利要求
1.一种解码设备,包括 获得单元,其被配置来获得作为编码结果的音频信号的低频包络、通过使用所述低频包络规格化的低频频谱、所述音频信号的高频包络和所述音频信号的高频频谱的集中度;产生单元,其被配置来通过使用在由所述获得单元获得的所述编码结果中的所述规格化的低频频谱和所述高频包络来产生频谱; 随机化单元,其被配置来基于所述集中度来随机化由所述产生单元产生的所述频谱的相位;以及 组合单元,其被配置来通过使用在由所述获得单元获得的所述编码结果中的所述低频包络来去规格化所述低频频谱,并且将由所述随机化单元随机化的所述频谱或由所述产生单元产生的所述频谱与去规格化的所述低频频谱组合,所述组合的结果被用作整个频带的频谱。
2.根据权利要求I所述的解码设备,其中 当所述集中度大于预定阈值时,所述随机化单元不随机化由所述产生单元产生的所述频谱的所述相位,并且 当所述集中度等于或小于所述预定阈值时,所述随机化单元随机化由所述产生单元产生的所述频谱的所述相位。
3.根据权利要求I所述的解码设备,其中 所述获得单元获得随机标记,所述随机标记是用于指示所述随机化单元是否要执行随机化的信息,基于所述低频包络、所述低频频谱、所述高频包络和所述集中度来确定所述随机标记, 当所述随机标记是用于指示要执行所述随机化的信息时,所述随机化单元随机化所述频谱的所述相位,并且向所述组合单元提供随机化的所述频谱,并且 当所述随机标记是用于指示不要执行所述随机化的信息时,所述随机化单元不随机化所述频谱的所述相位,并且向所述组合单元提供所述频谱。
4.一种在解码设备中实现的解码方法, 所述解码方法包括 获得步骤,获得作为编码结果的音频信号的低频包络、通过使用所述低频包络规格化的低频频谱、所述音频信号的高频包络和所述音频信号的高频频谱的集中度; 产生步骤,通过使用在所述获得步骤中获得的所述编码结果中的所述规格化的低频频谱和所述高频包络来产生频谱; 随机化步骤,基于所述集中度来随机化在所述产生步骤中产生的所述频谱的相位;以及 组合步骤,通过使用在由所述获得步骤中获得的所述编码结果中的所述低频包络来去规格化所述低频频谱,并且将在所述随机化步骤中随机化的所述频谱或在所述产生步骤产生的所述频谱与去规格化的所述低频频谱组合,所述组合的结果被用作整个频带的频谱。
5.—种程序,用于使得计算机执行操作,所述操作包括 获得步骤,获得作为编码结果的音频信号的低频包络、通过使用所述低频包络规格化的低频频谱、所述音频信号的高频包络和所述音频信号的高频频谱的集中度; 产生步骤,通过使用在所述获得步骤中获得的所述编码结果中的所述规格化的低频频谱和所述高频包络来产生频谱; 随机化步骤,基于所述集中度来随机化在所述产生步骤中产生的所述频谱的相位;以及 组合步骤,通过使用在由所述获得步骤中获得的所述编码结果中的所述低频包络来去规格化所述低频频谱,并且将在所述随机化步骤中随机化的所述频谱或在所述产生步骤产生的所述频谱与去规格化的所述低频频谱组合,所述组合的结果被用作整个频带的频谱。
6.一种解码设备,包括 获得单元,其被配置来获得作为编码结果的音频信号的低频包络、通过使用所述低频包络规格化的低频频谱和所述音频信号的高频包络; 产生单元,其被配置来通过使用在由所述获得单元获得的所述编码结果中的所述规格化的低频频谱和所述高频包络来产生频谱; 确定单元,其被配置来基于在由所述获得单元获得的所述编码结果中的所述规格化的低频频谱来确定所述低频频谱的集中度; 随机化单元,其被配置来基于由所述确定单元确定的所述集中度来随机化由所述产生单元产生的所述频谱的相位;以及 组合单元,其被配置来通过使用在由所述获得单元获得的所述编码结果中的所述低频包络来去规格化所述低频频谱,并且将由所述随机化单元随机化的所述频谱或由所述产生单元产生的所述频谱与去规格化的所述低频频谱组合,所述组合的结果被用作整个频带的频谱。
7.根据权利要求6所述的解码设备,其中 当所述集中度大于预定阈值时,所述随机化单元不随机化由所述产生单元产生的所述频谱的所述相位,并且 当所述集中度等于或小于所述预定阈值时,所述随机化单元随机化由所述产生单元产生的所述频谱的所述相位。
8.根据权利要求6所述的解码设备,其中 当所述低频频谱的所述集中度大于预定阈值时,所述确定单元将随机标记确定为用于指示所述随机化单元不要执行随机化的信息,所述随机标记是用于指示所述随机化单元是否要执行所述随机化的信息, 当所述低频频谱的所述集中度等于或小于所述预定阈值时,所述确定单元将所述随机标记确定为用于指示所述随机化单元要执行所述随机化的信息, 当所述随机标记是用于指示要执行所述随机化的所述信息时,所述随机化单元随机化所述频谱的所述相位,并且向所述组合单元提供所述随机化的频谱,并且 当所述随机标记是用于指示不要执行所述随机化的所述信息时,所述随机化单元不随机化所述频谱的所述相位,并且向所述组合单元提供所述频谱。
9.一种在解码设备中实现的解码方法, 所述解码方法包括 获得步骤,获得作为编码结果的音频信号的低频包络、通过使用所述低频包络规格化的低频频谱和所述音频信号的高频包络; 产生步骤,通过使用在所述获得步骤中获得的所述编码结果中的所述规格化的低频频谱和所述高频包络来产生频谱; 确定步骤,基于在所述获得步骤中获得的所述编码结果中的所述规格化的低频频谱来确定所述低频频谱的集中度; 随机化步骤,基于在所述确定步骤中确定的所述集中度来随机化在所述产生步骤产生的所述频谱的相位;以及 组合步骤,通过使用在所述获得步骤中获得的所述编码结果中的所述低频包络来去规格化所述低频频谱,并且将在所述随机化步骤中随机化的所述频谱或在所述产生步骤中产生的所述频谱与去规格化的所述低频频谱组合,所述组合的结果被用作整个频带的频谱。
10.一种程序,用于使得计算机执行操作,所述操作包括 获得步骤,获得作为编码结果的音频信号的低频包络、通过使用所述低频包络规格化的低频频谱和所述音频信号的高频包络; 产生步骤,通过使用在所述获得步骤中获得的所述编码结果中的所述规格化的低频频谱和所述高频包络来产生频谱; 确定步骤,基于在所述获得步骤中获得的所述编码结果中的所述规格化的低频频谱来确定所述低频频谱的集中度; 随机化步骤,基于在所述确定步骤中确定的所述集中度来随机化在所述产生步骤产生的所述频谱的相位;以及 组合步骤,通过使用在所述获得步骤中获得的所述编码结果中的所述低频包络来去规格化所述低频频谱,并且将在所述随机化步骤中随机化的所述频谱或在所述产生步骤中产生的所述频谱与去规格化的所述低频频谱组合,所述组合的结果被用作整个频带的频谱。
11.一种编码设备,包括 确定单元,其被配置来基于音频信号的高频频谱来确定所述高频频谱的集中度; 提取单元,其被配置来从所述音频信号的频谱提取低频频谱的包络和所述高频频谱的包络; 规格化单元,其被配置来通过使用所述低频频谱的所述包络来规格化所述低频频谱;以及 复用单元,其被配置来通过复用由所述确定单元确定的所述集中度、由所述提取单元提取的所述低频频谱的所述包络和所述高频频谱的所述包络以及由所述规格化单元规格化的所述低频频谱来获得编码结果。
12.根据权利要求11所述的编码设备,其中 当所述集中度大于预定阈值时,所述集中度确定单元进一步确定随机标记是用于指示不要执行随机化的信息,所述随机标记是用于指示当产生作为所述高频频谱的预定频谱时解码所述编码结果的解码设备是否要随机化所述预定频谱的信息, 当所述集中度等于或小于所述预定阈值时,所述确定单元将所述随机标记确定为用于指示要执行所述随机化的信息,并且 所述复用单元通过复用所述随机标记、所述低频频谱的所述包络、所述高频频谱的所述包络和所述规格化的低频频谱来获得所述编码结果。
13.一种在编码设备中实现的编码方法, 所述编码方法包括确定步骤,基于音频信号的高频频谱来确定所述高频频谱的集中度; 提取步骤,从所述音频信号的频谱提取低频频谱的包络和所述高频频谱的包络;规格化步骤,通过使用所述低频频谱的所述包络来规格化所述低频频谱;以及复用步骤,通过复用在所述确定步骤中确定的所述集中度、在所述提取步骤中提取的所述低频频谱的所述包络和所述高频频谱的所述包络以及在所述规格化步骤中规格化的所述低频频谱来获得编码结果。
14.一种程序,用于使得计算机执行操作,所述包括 确定步骤,基于音频信号的高频频谱来确定所述高频频谱的集中度; 提取步骤,从所述音频信号的频谱提取低频频谱的包络和所述高频频谱的包络;规格化步骤,通过使用所述低频频谱的所述包络来规格化所述低频频谱;以及复用步骤,通过复用在所述确定步骤中确定的所述集中度、在所述提取步骤中提取的所述低频频谱的所述包络和所述高频频谱的所述包络以及在所述规格化步骤中规格化的所述低频频谱来获得编码结果。
全文摘要
本发明涉及可以缩短在解码时由频带扩展引起的延迟时间并且抑制解码侧在资源上的增加的解码设备、解码方法、编码设备、编码方法和程序。高频分量产生单元(73)通过使用低频频谱(SP-L)和高频包络(ENV-H)来产生伪高频频谱。相位随机化单元(74)基于随机标记(RND)来随机化伪高频频谱的相位。逆MDCT单元(75)通过使用低频包络(ENV-L)来去规格化低频频谱(SP-L),并且将从相位随机化单元(74)提供的伪高频频谱与去规格化的低频频谱(SP-L)组合。组合结果被用作整个频带的频谱。本发明可以被应用到例如执行频带扩展解码的解码设备。
文档编号G10L21/04GK102812513SQ20118001518
公开日2012年12月5日 申请日期2011年3月15日 优先权日2010年3月31日
发明者铃木志朗, 松村祐树, 松本淳, 前田祐儿, 户栗康裕 申请人:索尼公司

喜欢就赞一下

上一篇
下一篇

相关推荐

    用于改进的音频的集成心理声学低音增强(pbe)的制作方法【专利摘要】将心理声学低音增强PBE与例如有源噪声消除ANC和或接收语音增强RVE等一种或一种以上其它音频处理技术集成,从而利用每一技术来实现改进的音频输出。此方法可有利地改进经常缺乏

    专利发布时间:2025-05-15阅读:(68)

    专利名称:一种新型彩灯灯串的制作方法技术领域:本实用新型涉及一种彩灯灯串。背景技术:节日灯串由于造型多种多样且灯光闪烁多彩,极具夜间照明装饰效果而成为人们在节日里作为增添节日气氛的首选,但是现在市场上普遍使用的节日灯串通常由一条电源线将所有

    专利发布时间:2025-05-15阅读:(68)

    专利名称:K歌方法及系统的制作方法技术领域:本发明涉及K歌技术领域,具体涉及一种K歌方法及系统。背景技术:K歌系统是音乐播放器和录音软件的结合体,既可以播放原唱,也可以把用户的歌声融入歌曲的伴奏中,还可以对用户的歌声进行音频效果处理,最后通

    专利发布时间:2025-05-15阅读:(96)

    专利名称:便携式电子装置实现卡拉ok评分功能的方法及装置的制作方法便携式电子装置实现卡拉OK评分功能的方法及装置技术领域:本发明提供一种实现卡拉OK评分功能的方法及装置,,尤指一种便携式电子装置 实现卡拉OK评分功能的方法及装置。背景技术:

    专利发布时间:2025-05-15阅读:(77)

    专利名称:一种铜管乐器练习用号嘴的制作方法技术领域:本实用新型涉及铜管乐器的技术领域,特别是一种适合各种铜管乐器用 的练习用号嘴。 背景技术:铜管乐器能产生缭亮悦耳的音乐效果且容易学习,所以越来越被广大青 少年朋友所喜爱。由于吹奏中嘴唇的振

    专利发布时间:2025-05-15阅读:(70)

    专利名称:变焦透镜系统和装有这种透镜系统的照相机的制作方法技术领域:本发明涉及用于移动式手机等设备的照相机组件和照相机。更特别的是,本发明涉及一种用于上述照相机组件和照相机进行变焦的变焦单元。背景技术: 变焦单元通常包括至少两种透镜,即用于

    专利发布时间:2025-05-15阅读:(86)