当前位置:网站首页>专利 >正文

编码设备、编码方法和包括该方法的计算机程序产品的制作方法

专利名称:编码设备、编码方法和包括该方法的计算机程序产品的制作方法
技术领域
本发明涉及编码设备、编码方法和包括编码方法的程序产品。
背景技术
传统上,已对用于压缩/解压縮作为语音、音乐等的声音源的音频信 号的音频编码技术进行了各种研究。例如,针对用于通过转换为频域来 编码音频信号的方案进行了各种研究。
例如,这些音频编码技术将在高级音频编码(ACC)方法、高效高 级音频编码(HE-ACC)方法中出现。ACC和HE-ACC方法是ISO/IEC MPEG-2/4音频标准中的方法,并且广泛用于数字广播(例如数字地面、 BS数字和通信卫星,以及日本的一段式广播)中。
在这些音频编码技术中,用于实现音频编码技术的常规编码设备通 过修正离散余弦变换(MDCT)转换将音频信号转换为频谱,对频谱进 行量化,然后执行编码。
常规编码设备利用听觉遮蔽属性(auditory masking property)来对频 谱进行量化。具体地说,常规编码设备仅对可由人类听觉感受所听到的 声音进行量化。在量化中,使用作为阈值的遮蔽阈值,即,用于是否可 听到声音的阈值,来确定在听觉上不能被听到的声音分量。
例如,常规编码设备执行音质分析,这是用于针对音频信号(要编 码的声音源)分析是否可在听觉上听到声音的方案。然后对于每个频率 确定遮蔽阈值。其后,对于具有预定频率宽度的每个频带,常规编码设 备确定误差界限。误差界限是基于确定的遮蔽阈值而在量化期间所允许 的容许误差功率。然后,使用该容许误差功率,常规编码设备仅对作为 在听觉上可听到的声音源的频谱进行量化。
日本特开第2006-18023号的第5到11页和图1公开了用于调整遮蔽阈值的方案,日本特开第2001-7704号的第5到9页和图1公开了用于 改进编码期间的效率以减少编码期间使用的比特使用量的方案。另外, 日本特开第7-202823号的第3到5页和图1以及日本特开第7-295594号 的第2到3页和图1公开了用于指定比特分布量的方案。
同时,上述常规技术具有在编码音调高的音频信号期间声音质量劣 化的问题。
更详细地说,因为常规编码设备在编码音调音频信号期间不能可靠 地对与峰值相邻的频谱进行量化,所以该设备不能令人满意地执行编码 同时维持足够的声音质量。
上述的日本特开未公开用于可靠地量化与峰值相邻的频谱的方案并 且不能在编码音调音频信号期间充分地改善声音质量。

发明内容
本发明的一个目的是提供能够以令人满意的状态操作的编码设备。 根据本发明的一个方面,提供了现在的编码设备,其用于将音频信 号转换为频谱并且对该频谱进行量化和编码,该编码设备包括功率校正 单元和量化单元,该功率校正单元用于当从频谱检测到音调频谱(tonal fr叫uency spectrum)时校正根据音频信号确定的容许误差功率,该量化 单元用于对具有比由功率校正单元校正的容许误差功率大的功率的每个 频谱进行量化。
根据本发明的另一方面,提供了一种用于对音频信号进行编码的编 码设备,其包括用于将音频信号转换为频谱的频率转换单元、用于根据 音频信号确定容许误差功率的功率确定单元、用于从由频率转换单元转 换的频谱中检测音调频谱的检测单元、用于利用检测单元执行的检测的 结果和功率确定单元确定的容许误差功率来校正容许误差功率的功率校 正单元,以及用于对具有比由功率校正单元校正的容许误差功率大的功 率的每个频谱进行量化的量化单元。


图1例示了示出根据第一实施方式的编码设备的基础技术的图2例示了示出根据第一实施方式的编码设备的基础技术的图3A到3C例示了示出根据第一实施方式的编码设备的基础技术的
图4例示了示出根据第一实施方式的编码设备的基础技术的图; 图5例示了示出根据第一实施方式的编码设备的概况和结构的图; 图6例示了示出根据第一实施方式的编码设备的结构的框图; 图7A到7D例示了示出根据第一实施方式的编码设备的音调检测单 元的图8A和8B例示了示出根据第一实施方式的编码设备中的音质分析 单元的图9例示了示出根据第一实施方式的编码设备中的容许误差功率校 正单元的图IOA到IOD例示了示出根据第一实施方式的编码单元中的容许误 差功率校正单元的图11A和11B例示了示出根据第一实施方式的编码单元中的縮放因 子校正单元的图12例示了示出根据第一实施方式的编码设备的处理流程的流程
图13例示了示出根据第一实施方式的编码设备的縮放因子校正单 元执行的处理流程的流程图14A例示了音频信号的波形,图14B例示了经编码的信号,并且 图14C例示了经编码的信号的频率特性;
图15例示了与音调频谱相邻的频谱;
图16A例示了原始声音,图16B例示了在使用已知方案进行量化期 间生成的异常声音的生成,并且图16C例示了异常声音的减少; 图17例示了示出根据第二实施方式的编码设备的图; 图18A到18C例示了示出根据第二实施方式的编码设备的图; 图19例示了根据第二实施方式的编码设备中的縮放因子校正处理的流程图20例示了示出根据第三实施方式的编码设备的图; 图21例示了示出根据第三实施方式的编码设备的图; 图22例示了用于根据第一实施方式的编码设备的程序的图;以及
图23A到23C例示了对于基础技术的考虑。
具体实施方式
[对于基础技术的考虑]
参考图23A到23B,描述了对编码音频信号的常规技术的考虑,以 弄清在对与音调音频信号的峰值相邻的频谱进行量化时造成的缺点。当 编码音调音频信号,例如正弦波、扫描波等时,以dB为单位的强度或功 率集中在相比于其它频带展示出相对大的峰值的特定频带中。即,特定 频带具有如图23A中所示具有高强度的频谱,图23A例示了通过对音调 音频信号执行MDCT转换而获得的频谱。
而且,如图23B中所示,在常规编码设备中,针对与包括峰值的频 带相邻的频带而确定的容许误差功率也增大了。具体地说,因为包括峰 值的频带中的频谱在功率上大于其它频谱,所以常规编码设备也具有为 相邻频带和包括峰值的频带确定的较大遮蔽阈值。结果,容许误差功率 也增大了。传统上,如图23C中所示,与峰值相邻的频带中的频谱为小 于或等于容许误差功率的频谱。因为相邻频带中的频谱被认为是不要量
化的频谱,所以不量化该频谱。
当通过MDCT转换音频信号时,合成频谱由都包含音频信号的振幅 和相位信息的各个MDCT系数组成,虽然图23A、 23B和23C中的每一 个仅仅示出了单独的振幅。例如,当与峰值相邻的频谱未被量化时,频 谱中包含的信息丢失了。因此,相位和振幅的减少影响了声音源中与峰 值关联的分量,并且造成声音质量劣化,例如抖音的感觉。特别是,对 于音调音频信号,相比于低音调音频信号,在具有峰值的频带中与特定 频率相邻的声音源有效地贡献于主声音源,并且由于与峰值相邻的频谱 中包含的信息的丢失而造成的影响对于经编码的声音源的声音质量有强烈的影响。
下面将参考附图详细描述编码设备、编码方法和包括该方法的程序 产品的实施方式。在下面,按顺序描述根据第一实施方式的编码设备的 基础技术、概况、特征以及处理流程,然后描述其它实施方式。
首先,利用图1到4来描述用于描述根据第一实施方式的编码设备 的基础技术。
术语"频谱"对应于系数,例如,通过例如由MDCT将音频信号(声 音源)转换为频域而获得的每个频率的MDCT系数。术语"频谱功率" 对应于频谱的平方的值。术语"音调频谱"是当频谱功率的峰值集中于 频谱的一个频率处时该频率的系数。例如,具有比所有频谱功率的平均 值大的功率的频谱对应于音调频谱。对应于"音调频谱"的转换源的音 频信号称为"音调声音源"。
另外,术语"量化"是用于对小数点后的数值向下舍入取整的处理 (例如,将"1.8"和"2.1"分别改变为例如"1"和"2"的整数)。术 语"量化值"表示通过量化频谱而获得的值。
术语"量化误差"是通过量化频谱而在每个频谱中造成的误差。具 体地说,如图1中所示,量化前的频谱和逆量化后的频谱之间的差异对 应于量化误差,其中将逆量化后的频谱称为"逆量化频谱"。
这里,术语"逆量化频谱"是根据量化值获得的频谱。下面描述频 谱、量化值和逆量化频谱的关系。通过下面描述的处理序列,编码设备 量化频谱以获得量化值,然后根据所述量化值获得逆量化频谱。因为频 谱的动态范围通常较大,所以编码设备首先使用预定的"縮放因子"执 行縮放以减小范围,如图1中的(1)所示。其后,如图1中的(2)所 示,编码设备执行量化以获得量化值。然后,如图1中的(3)所示,编 码设备利用所述预定的縮放因子来再縮放(执行图1中的(1)处执行的 縮放的逆处理)所获得的量化值,以获得逆量化频谱。
在该情况下,由图2中所示的公式1中所示的表达式给出逆量化频谱,并且由图2中所示的公式2给出量化值。这些公式根据表达式1导
出,表达式l是表示频谱、量化值和縮放因子之间的关系的表达式。"2a (縮放因子)"表示"2的縮放因子次幂"。 表达式h频谱=量化值乂2^ (縮放因子)
分析音频信号的频谱的频率范围分为多个作为频带的具有预定频率 宽度的更小频率范围。对于每个频带,给出单独的"縮放因子"。例如, 在图1中所示的示例中,将一个縮放因子设置给图1中所示的包含频谱 (4)和(5)的频带"b"。由编码设备确定縮放因子使得量化误差功率 小于容许误差功率。
术语频谱的"频带功率"指频带中包含的频谱的功率总和。
术语频谱的"量化误差功率"指量化误差的平方的值。而且,在一 个频带中的量化误差功率指根据在对频带中包含的频谱进行量化期间生 成的量化误差而确定的量化误差功率的总和。具体地说, 一个频带中的 量化误差功率和量化误差之间的关系由表达式2给出,其中A2表示平方。
表达式2: —个频带中的量化误差功率=2{(频带中包含的频谱中的 量化误差)A2〉。
而且,术语"容许误差功率"是在量化期间所允许的最大量化误差 功率。容许误差功率是在量化经縮放的频谱期间造成的量化误差功率中 的容许最大量化误差功率。更详细地说,对于每个频带根据对应于该频 带的遮蔽阈值的变换而导出容许误差功率,其中遮蔽阈值表示是否可在 听觉上听到它。例如,作为用于根据遮蔽阈值确定容许误差功率的方案, 可以使用ISO/正C 13818-7中描述的方案,或者可以使用其它方案。
具体地说,容许误差功率是"容许量化误差功率的界限"。例如,一 个频带中的容许误差功率是针对该频带确定的量化误差功率,并且展示 了作为在量化该频带中的频谱期间生成的误差所允许的最大值。换言之, 根据第一实施方式的编码设备对频谱进行量化,使得一个频带中的量化 前频谱的功率和逆量化频谱的功率之间的差异功率小于容许误差功率。
而且,用于每个频带的容许误差功率根据单独的遮蔽阈值导出。还 将导出的容许误差功率与单独的功率频谱进行比较,以选择要对哪个频带中的频谱进行量化。在确定要量化的频谱期间与容许误差功率比较的 是频带功率。
而且,术语"编码"是用于通过例如使用霍夫曼编码将量化值和/或 縮放因子转换为其它值(编码)的处理。
下面简要描述縮放因子和量化误差功率之间的关系。如上所述,将 每个縮放因子分配给各个相应频带,并且使用所分配的缩放因子来量化 一个频带中包含的每个频谱。
当关注频带中的一个频谱时,如图3A所示给出量化值和縮放因子之 间的关系,并且下面的表达式3和表达式4所示的关系成立。 表达式3:较大縮放因子O较小量化值
表达式4:较小縮放引子O较大量化值
现在关注频带中包含的频谱。如图3B中所示,当縮放因子设置为较 大时,量化值根据频带中的小功率频谱变为"0",因而量化误差增大。
艮口,如图3C所示,对于縮放因子和量化误差功率,下面的表达式5 和表达式6中的关系成立。
表达式5:较大縮放因子<=>较小量化值4量化误差增大
表达式6:较小縮放引子G较大量化值—量化误差减小
当用量化值"0"量化频带中包含的所有频谱时(即,不量化),量 化误差功率具有最大值并且下面的表达式7中的关系成立。
表达式7:量化误差功率=频带功率
另外,现在将简要描述縮放因子、量化误差功率和容许误差功率的 关系。首先,当频带功率大于容许误差功率时,编码设备将该频带视为
要量化的频带。而且,如图4中所示,编码设备使用使量化误差功率小 于容许误差功率的縮放因子来量化频谱。因而,如图4中所示,编码设 备使用满足"容许误差功率>量化误差功率"的縮放因子来执行量化。 现在,再次总结量化误差功率、容许误差功率和频带功率的关系。
即,关系为
(1) 量化误差功率的最大值是频带功率(表达式7),
(2) 当用量化值"0"量化所有频谱(即,未量化)时给出表达式7中的关系,并且
(3)使用满足容许误差功率>量化误差功率的情况的縮放因子执行 量化值(这称为"表达式A")。现在,当表达式7中的关系成立时,表 达式A由下面的表达式B给出。
表达式B:容许误差功率〉量化误差功率,其中量化误差功率=频带 功率。
频带功率等于量化误差功率的情况对应于频谱的量化值为"0"的情 况(即,频谱未被量化)。换言之,容许误差功率用作为用于确定是否要 量化频带中的所有频谱的阈值。
接下来将使用例示出根据第一实施方式的编码设备的概况和特征的 图5,来描述根据该实施方式的编码设备的概况和特征。
图5例示了设置有多个主单元的编码设备,并且示出为在每个单元 中处理信号以对音频信号进行编码。当要编码的声音源(音频信号)输 入到编码设备中时,该设备如图5所示对音频信号进行编码。该编码设 备的主要特征在于,它可以改善音调音频信号的编码声音质量,如下所 述。
艮P,频率转换单元将输入的音频信号转换为频谱,如图5中的(1) 所示。频率转换单元为具有预定频率宽度的各频带确定频谱功率,如图5 中的(2)所示。例如,频率转换单元确定与频带中包含的每个频谱的单 独功率的总和对应的总功率(频带功率)。在图5中的(2)所示的示例 中,各无阴影的条表示各频带中的频谱。
如图5中的(3)所示,功率确定单元根据音频信号确定各个频带的 容许误差功率(参考上述的[基础技术])。在图5中的(3)所示的示例中, 各阴影条表示各频带中的(基于频带的)容许误差功率。
如图5中的(4)所示,检测单元从频率转换单元转换的频谱中检测 音调频谱,并且也检测包含该音调频谱的频带。例如,检测单元将图5 中的(4)中的频带"5"检测为包含音调频谱的频带。
然后,功率校正单元使用检测单元所检测到的结果和功率确定单元所确定的容许误差功率两者来校正容许误差功率。具体地说,功率校正 单元对与包含音调频谱的频带相邻的频带的容许误差功率中的每一个容 许误差功率进行单独校正,使得该容许误差功率小于频带中的频谱功率 的总和。
如图5中的(5)所示,功率校正单元校正与频带"5"相邻的频带 "4"和"6"的频谱的功率,使得频带"4"和"6"中的每一个频带的 容许误差功率小于频带"4"和"6"的频谱功率中的每一个。为了阐明 校正,图5中的(6)中的频带"4"和"6"中的条中的阴影部分示出了 针对各频带的经校正的容许误差功率。即,在图5中的(6)中,频带"4" 和"6"中的各无阴影部分例示了由功率校正单元校正的量。
然后,在编码设备中,如图5中的(7)所示,量化单元对具有比功 率校正单元所校正的容许误差功率大的功率的频谱进行量化。例如,量 化单元对包含音调频谱的频带"5"中包含的频谱和具有经功率校正单元 所校正的容许误差功率的频带"4"和"6"中包含的频谱进行量化,如 图5中(7)中所示。
具体地说,因为校正了容许误差功率,使得与峰值功率相邻的频谱 被量化,所以能够可靠地对与峰值功率相邻的频谱进行量化,并且能够 改善音调音频信号的编码声音质量。
〖编码设备的结构]
接下来将使用图6到11来描述图5中示出的编码设备的结构。这里, 图6是示出根据第一实施方式的编码设备的结构的框图。图7是用于描 述第一实施方式中的音调检测单元的图。图8是用于描述第一实施方式 中的音质分析单元的图。图9是用于描述第一实施方式中的容许误差功 率校正单元的图。图IO是用于描述第一实施方式中的容许误差功率校正 单元的图。图11是用于描述第一实施方式中的縮放因子校正单元的图。
如图6中所示,编码设备包括输入单元101、修正离散余弦变换 (MDCT)单元102、音调检测单元103、音质分析单元104、容许误差 功率校正单元105、量化频带检测单元106、縮放因子确定单元107、縮 放因子校正单元108、量化单元109、编码单元IIO、以及输出单元lll。MDCT单元102、音质分析单元104、以及音调检测单元103可分别 对应于"频率转换单元"、"功率确定单元"、以及"检测单元"。此外, 容许误差功率校正单元105和量化单元109可分别对应于"功率校正单 元"和"量化单元"。縮放因子确定单元107可对应于"第一縮放因子确 定单元"和"第二縮放因子确定单元"。縮放因子校正单元108可对应于 "第三縮放因子确定单元"。
作为要编码的声音源的音频信号由输入单元101接收,然后被馈送 到下面描述的MDCT单元102和音质分析单元104两者。
MDCT单元102将从输入单元101发送的音频信号转换为频谱。具 体地说,通过MDCT转换,MDCT单元102执行用于将从输入单元101 发送的音频信号转换为频谱的时间频率转换。例如,这里的时间频率转 换是指将作为时间变量的函数的音频信号转换为频率变量的频谱。
MDCT单元102为通过按照预定频率带宽划分频谱的整个预定宽度 而获得的每个频带确定频谱功率。例如,在图7A所示的示例中,宽度W 内的频谱被划分为表示为频带"0"到"6"的七个子频带,并且每个频 带中包含的频谱的功率总和被确定为频带功率,例如Eo到E6。
而且,MDCT单元102将转换后的频谱和频带功率的数据发送到下 述的音调检测单元103和量化频带检测单元106两者。
在从MDCT单元102接收到频谱的数据的情况下,音调检测单元103 针对该频谱分析音调,检测音调频谱,并且检测包含该音调频谱的频带。
而且,例如,如图7B所示,音调检测单元103根据所确定的各个频 带中的功率来确定所有频带中的功率的平均值(换言之,所有频谱的功 率的平均值)。具体地说,当用"band"表示(例如,"band"在图7B所 示的示例中是7个)频带号(划分的频带的数量)并且用"Eband"表示每 个频带功率时,音调检测单元103根据图7C所示的表达式确定所有频带 中的频谱的平均功率"Eave"。
而且,如图7D所示,当频带具有在它的频带宽度上平均的功率并且 该平均的功率大于阈值时,音调检测单元103确定该频带是音调频带, 其中,所述阈值是在要计算的整个范围上平均的功率。具体地说,对于图7B所示的示例,音调检测单元103将频带3检测为包含音调频谱的频
带,因为频带3是具有大于所确定的平均功率Eave的平均频谱功率的频 带。
而且,音调检测单元103将检测到的包含音调频谱的频带的数据发 送到下述的容许误差功率校正单元105和縮放因子校正单元108两者。 此外,音调检测单元103发送标志信息和用于标识所检测到的频带的信 息,它们分别表示为tone—flag和tone_band。表示为tone—flag的标志指 示检测了音调,而表示为tone—band的信息指示在图7B所示的示例中频 带3具有频带功率E3。 tone_flag和tone—band这两条信息都被发送到下述 的容许误差功率校正单元105和縮放因子校正单元108。当音调检测单元 103未检测到包含音调频谱的频带时,单元103不发送tone—flag和 tone—band信息。
音调检测单元103也将从MDCT单元102接收的频谱和频带功率的 数据发送到下述的容许误差功率校正单元105。
在从输入单元101接收到音频信号的情况下,音质分析单元104根 据该音频信号确定容许误差功率(参考基础技术)。音质分析单元104将 该音频信号中包括的频率的预定带宽划分为更小的预定宽度的频带,并 且针对各个划分的频带确定容许误差功率,而优选的是使用MDCT单元 102确定的频带。
如图8A中所示,音质分析单元104为从输入单元101发送的音频信 号确定遮蔽阈值。而且,如图8B中所示,单元104转换所确定的遮蔽阈 值以确定容许误差功率。
这里提及的术语"频带"对应于MDCT单元102使用的频带。换言 之,音质分析单元104优选地使用MDCT单元102确定的频带和各个频 带功率来为每个频带确定容许误差功率。为了易于理解,图8A和8B中 的每一个都结合频谱例示了遮蔽阈值或容许误差功率。
音质分析单元104还将所确定的容许误差功率的数据发送到下述的 容许误差功率校正单元105。
容许误差功率校正单元105具有频带数存储单元(图6中未示出),该频带数存储单元用于存储预定频带数。如图9所示,容许误差功率校
正单元105从音调检测单元103接收"tone—band"禾B "tone—flag"的检 测结果,从音质分析单元104接收容许误差功率的数据,并且还从音调 检测单元103接收频带功率的数据。"tone—band"和"tone—flag"在图9 中所示的示例中示出为"检测结果"。使用检测结果和频带功率的数据, 容许误差功率校正单元105校正了容许误差功率的数据。所述频带数存 储单元可对应于"频带数存储单元"。
具体地说,它在容许误差功率校正单元105中执行,使得音质分析 单元104针对与音调检测单元103所检测的频带相邻的频带而确定的容 许误差功率小于针对该相邻频带的频带功率。
例如,容许误差功率校正单元105将位于由频带数存储单元所存储 的预定频带数的范围中且以包含音调检测单元103检测到的音调频谱的 频带作为其中心的频带,检测为相邻频带。
下面通过举例具体描述音调检测单元103检测第"b"个频带并且频 带数存储单元中存储的预定频带宽度是校正带宽"B"的情况的示例。如 图10A中所示,容许误差功率校正单元105将与频带"b"相邻的"B" 个频带检测为要校正的相邻频带,其中第"b"个频带为这些频带的中心。 换言之,容许误差功率校正单元105将第"b-B"到第"b+B"个频带检 测为要校正的相邻频带。例如,在图IOA中所示的示例中,对于"b=16" 和"B=4",容许误差功率校正单元105将频带"12"到"20"检测为要 校正的相邻频带。
而且,如图10B中所示,容许误差功率校正单元105针对所检测的 相邻频带校正容许误差功率。如图10B中所示,作为所检测的相邻频带 的频带"12"到"20"(不包括频带"16")中的校正前容许误差功率大 于所检测的相邻频带中的频带功率。因此,容许误差功率校正单元105 通过均等地衰减频带"12"到"20"(不包括频带"16")的容许误差功 率以使得这些容许误差功率小于频谱的功率来执行校正。 一种衰减方法 确定"M,b-l-gXMw"(衰减量"g"〈1.0),如图IOC中所示,其中"MV, 表示第"b-l"个频带的校正后容许误差功率,并且"Mw"表示第"b-1"个频带的校正前容许误差功率。
容许误差功率校正单元105还向量化频带检测单元106发送由音 质分析单元104确定的容许误差功率的数据;和校正后的容许误差的数
据。当容许误差功率校正单元105未从音调检测单元103接收到标志 (tone—flag)和用于标识所检测的频带的信息时,校正单元105不执行用 于校正容许误差功率的处理,并且将音质分析单元104确定的容许误差 功率发送到下述的量化频带检测单元106。
量化频带检测单元106在接收到频谱和容许误差功率时,从频谱的 频带中检测要量化的频带。该频谱来自于MDCT单元102,并且容许误 差功率(包括由容许误差功率校正单元105校正的容许误差功率)来自 于容许误差功率校正单元105。
具体地说,量化频带检测单元106逐频带地比较从MDCT单元102 发送的频带功率和从容许误差功率校正单元105发送的容许误差功率。 由此确定要量化的频带。更具体地说,针对具有经容许误差功率校正单 元105校正后的容许误差功率的频带,量化频带检测单元106比较校正 后的容许误差功率和频带的频带功率。而且,针对不具有单元105校正 的容许误差功率的频带,单元106比较音质分析单元104确定的容许误 差功率和频带的频带功率。单元106还检测频带功率比容许误差功率大 的每个频带,作为要量化的频带。单元106还检测用于标识所检测的频 带的信息。
量化频带检测单元106还向缩放因子确定单元107发送用于标识要 量化的检测频带的信息、从容许误差功率校正单元105发送的容许误差 功率的数据、以及从MDCT单元102发送的频谱的数据。
在从量化频带检测单元106发送了用于标识要量化的频带的信息、 容许误差功率以及频谱的情况下,縮放因子确定单元107对于各个频带 确定使量化误差功率小于容许误差功率的縮放因子。
当容许误差功率校正单元105针对与包含音调检测单元103所检测 的音调频谱的频带相邻的频带校正了容许误差功率时,縮放因子确定单 元107确定使量化误差功率小于针对该相邻频带的校正后的容许误差功率的縮放因子。
縮放因子确定单元107还向下述的缩放因子校正单元108发送用于 标识要量化的频带的信息、以及为各个频带确定的容许误差功率、频谱 和縮放因子的数据集合。
如图11A中所示,縮放因子校正单元108从音调检测单元103接收 音调检测结果的数据,从縮放因子确定单元107接收用于标识要量化的 频带的信息,以及各个频带的容许误差功率(图11中未示出所述信息和 容许误差功率)、频谱和縮放因子的各数据集合。在接收到这些数据时, 缩放因子校正单元108校正包含音调频谱的频带的縮放因子。如上所述, 音调检测结果包括包含音调频谱的频带和音调检测信号的数据。具体地 说,縮放因子校正单元108把包含音调频谱的频带的縮放因子校正为使 得从构成频带的频谱中最大的一个获得的量化值成为量化值中的最大值 的縮放因子。
现在,将具体描述其中包含音调频谱的频带是频带"b"并且縮放因 子确定单元107针对频带"b"确定的縮放因子是"Sb"的情况的示例。 縮放因子校正单元108搜索频带"b"中包含的最大频谱(在图11A中所 示的示例中,对应于"最大频谱搜索")。最大频谱称为"maX_pow—spec", 并且这里提及的术语"最大频谱"是指频谱中的构成包含音调频谱的频 带的最大功率的频谱。
而且,例如,在检测到最大频谱时,縮放因子校正单元108确定使 得通过量化最大频谱而获得的量化值成为"MAX—QUANT"的縮放因子 "S,b"。 "MAX一QUANT"指量化值中的最大值。在图11A中所示的示 例中,在"校正縮放值确定"中确定縮放因子"S'b",并且将其设置为 包含音调检测单元103所检测的音调频谱的频带的縮放因子。例如,根 据图11B中所示的表达式,縮放因子校正单元108用缩放因子"S'b"代 替"Sb",即,将縮放因子"Sb"校正为縮放因子"S,b"。量化值的最大 值是由编码技术标准定义的值,并且在先进音频编码(AAC)的标准中 定义了 MAX—QUANT=8191。
縮放因子校正单元108还向量化单元109发送用于标识要量化的频带的信息、以及各个频带的容许误差功率、频谱和縮放因子的各集合。 縮放因子的数据包括由縮放因子校正单元108为包含音调频谱的频带所 检测的縮放因子。
在接收到用于标识要量化的频带的信息、以及各个频带的容许误差
功率、频谱和縮放因子的各个数据集合时,量化单元109对具有比容许 误差功率大的功率的每个频谱进行量化。具体地说,针对量化频带检测 单元106所检测的每个频带,量化单元109将频谱的动态范围减小到縮 放因子唯一指定的动态范围,并且对构成减小后的动态范围中的每个频 带的各个频谱进行量化。在该过程中,量化频带检测单元106所检测的 频带中的每一个由用于标识要量化的频带的信息所标识。
更具体地说,通过使用縮放因子校正单元108确定的縮放因子,量 化单元109对縮放因子校正单元108确定了其縮放因子的频带中包含的 每个频谱进行量化。此外,通过使用縮放因子确定单元107确定的縮放 因子,量化单元109对縮放因子校正单元108未确定其縮放因子的频带 中包含的每个频谱进行量化。
在该情况下,量化单元109使用縮放因子确定单元107和縮放因子 校正单元108所确定的縮放因子,来逐频带地(对于每个频带)改变动 态范围。其后,在执行量化期间,量化单元109对于构成每个频带的频 谱逐个地(对于每个频谱)执行量化,而不是逐频带地执行量化。艮P, 量化单元109获得各个频谱的量化值。
量化单元109还将量化获得的量化值的数据和縮放因子发送到下述 的编码单元110。
在从量化单元109接收到量化值和缩放因子时,编码单元110对量 化值和縮放因子进行编码。例如,编码单元110使用霍夫曼编码来对量 化值和縮放因子进行单独编码。编码单元110将经编码的信息发送到下 述的输出单元lll。
在从编码单元110接收到经编码的信息时,输出单元111输出从编 码单元110接收的信息,作为输入单元101输入的音频信号的编码信息。
编码设备还可通过将上述的MDCT单元102、音调检测单元103、音质分析单元104、容许误差功率校正单元105、量化频带检测单元106、 縮放因子确定单元107、縮放因子校正单元108、以及量化单元109的功 能合并到信息处理设备如已知的个人计算机、工作站、便携式电话、PHS 终端、移动通信终端、或PDA中来实现。 [编码设备执行的处理]
接下来将使用图12和13来描述编码设备执行的处理。这里,首先 使用图12来描述编码设备执行的整个处理的流程,然后,使用图13来 描述由縮放因子校正单元108执行的处理的流程。图12是示出根据第一 实施方式的编码设备的整个处理的流程的流程图,而图13是示出根据第 一实施方式的縮放因子校正单元执行的处理的流程的流程图。
如图12中所示,在公开的编码设备中,当存在音频信号时(步骤 S101:"是"),即当输入单元101接收到音频信号时,MDCT单元102执 行MDCT转换(步骤S102)。即,MDCT单元102将从输入单元101发 送的音频信号转换为频谱。MDCT单元102然后划分频带(步骤S103) 并且确定频带功率(步骤S104)。 g卩,MDCT单元102确定频谱功率, 并且还确定通过按照预定宽度进行划分而获得的各频带中的频谱功率的 总和。
音调检测单元103然后检测包含音调频谱的频带(步骤S105)。艮P, 当存在具有比阈值(该阈值是所有频带的频谱的平均功率)大的频谱功 率的频带时,音调检测单元103将该频带检测为具有高音调的频带。
音调分析单元104然后确定容许误差功率(步骤S106)。目卩,在从 输入单元101发送了音频信号时,音质分析单元104根据该音频信号确 定容许误差功率。
在该情况下,当存在音调时(步骤S107:"是"),换言之,当音调 检测单元103在上述的步骤S105中检测到音调频带时,容许误差功率校 正单元105校正容许误差功率(步骤S108)。即,在从音调检测单元103 发送了检测结果时,容许误差功率校正单元105校正针对相邻频带的容 许误差功率。例如,容许误差功率校正单元105将针对相邻频带的容许误差功率校正为小于针对该相邻频带的频带功率的容许误差功率。
因此,容许误差功率校正单元105校正容许误差功率(步骤S108)。 另外,当不存在音调时(步骤S107:"否"),量化频带检测单元106检测 要量化的频带(步骤S109)。即,在从MDCT单元102发送了频谱并从 容许误差功率校正单元105发送了容许误差功率时,量化频带检测单元 106从频谱的频带中检测要量化的频带。
縮放因子确定单元107然后确定縮放因子(步骤SllO)。即,在从 量化频带检测单元106发送了用于标识要量化的频带的信息、容许误差 功率和频谱时,縮放因子确定单元107对于每个频带确定使得量化误差 功率小于或等于容许误差功率的縮放因子。
在该情况下,当存在音调时(步骤S111:"是"),縮放因子校正单元 108校正縮放因子(步骤S112)。即,当从音调检测单元103发送了包含 音调频谱的频带,并从縮放因子确定单元107发送了用于标识要量化的 频带的信息、以及各个频带的容许误差功率、频谱和縮放因子时,縮放 因子校正单元108校正包含音调频谱的频带的縮放因子。
縮放因子校正单元108然后校正缩放因子(步骤S112)。另外,当 不存在音调时(步骤S111:"否"),量化单元109对频谱进行量化(步骤 S113)。即,在从縮放因子校正单元108发送了用于标识要量化的频带的 信息、以及各个频带的容许误差功率、频谱和縮放因子时,量化单元109 对由量化频带检测单元106所检测的每个频带中的每个频谱进行量化。
然后,编码单元110执行编码(步骤S114)。即,在从量化单元109 发送了由量化获得的量化值时,编码单元IIO对这些量化值进行编码。
如图13中所示,在所公开的编码设备,当校正了縮放因子时(步骤 S201:"是"),即当从音调检测单元103发送了包含音调频谱的频带,且 从縮放因子确定单元107发送了用于标识要量化的频带的信息、以及各 个频带的容许误差功率、频谱和缩放因子时,縮放因子校正单元108检 测最大频谱(步骤S202)。
然后,例如,縮放因子校正单元108对于量化值最大的情况确定缩放因子(步骤S203)。即,縮放因子校正单元108确定这样的缩放因子, 该縮放因子使得根据频谱中构成包含由音调检测单元103所检测的音调 频谱的频带的最大一个而获得的量化值为最大值。
縮放因子校正单元108然后校正縮放因子(步骤S204)。即,縮放 因子校正单元108把縮放因子确定单元107所确定的縮放因子校正为针 对从中检测到音调频谱的频带确定的縮放因子。
如上所述,根据第一实施方式,公开的编码设备将音频信号转换为 频谱,对于通过按照预定宽度划分该音频信号的频谱而获得的各个频带 确定容许误差功率。编码设备还从该频谱中检测音调频谱,并且检测包 含该音调频谱的频带。使用该检测结果和容许误差功率,编码设备执行 校正,使得针对与检测单元所检测的频带相邻的频带而确定的容许误差 功率小于针对该相邻频带的频谱的功率。此外,编码设备对具有比校正 后的容许误差功率大的功率的每个频谱进行量化。因此,可以改善音调 音频信号的编码声音质量。
具体地说,因为按校正与峰值功率相邻的每个频谱的方式来校正容 许误差功率,所以能够可靠地对与峰值功率相邻的每个频谱进行量化。 此外,能够改善音调音频信号的编码声音质量。
艮口,当要以已知方案对音调音频信号进行编码时,不能可靠地对与 音调频谱相邻的频谱进行量化,从而丢失了相邻的频谱。因此,在如图 14A所示的原始声音中,编码声音的相位特性如图14B所示失真了,这 会导致振幅波动并且导致声音振动或抖音。
而且,例如,在已知方案中,振幅波动得溢出(例如,超过PCM的 最大值(16比特)),这导致生成削波。因此,如图14C中所示,生成了 异常的声音,例如chi,ri,chi'ri的声音(例如,削波噪声)。而且,如图 14B所示,振幅的变化导致声音的感受振动。
相比于这些常规方案,根据所公开的编码设备,能够可靠地对与音 调频谱相邻的频谱进行量化,如图15所示。因此,在对图16A中所示的 原始声音进行编码期间,在如图16B所示使用已知方案进行量化期间生 成的感受振动的声音和异常声音chi'ri'chi'ri的生成减少了,如图16C所示,并且可以改善音调音频信号的编码声音质量。
而且,根据第一实施方式,在所公开的编码设备中,针对与包含检 测到的音调频谱的频带相邻的频带,縮放因子校正单元108按使得根据 作为在对该相邻频带中包含的频谱进行量化期间生成的误差的量化误差
而确定的量化误差功率小于容许误差功率校正单元105针对该相邻频带
而确定的容许误差功率的方式,确定针对该相邻频带的縮放因子,作为
用于该相邻频带的縮放因子,并且量化单元109通过使用縮放因子校正 单元108确定的縮放因子,对由縮放因子校正单元108确定了其縮放因 子的频带中包含的每个频谱进行量化。因此,即使校正了容许误差功率 时,也能够使用合适的縮放因子来执行量化。
而且,根据第一实施方式,在所公开的编码设备中,音调检测单元 103检测包含音调频谱的频带。其后,确定该频带的縮放因子,以使得根 据频谱中构成包括该音调频谱的频带的最大一个而获得的量化值为最大 值。因此,能够最小化量化误差。具体地说,因为根据具有音调的峰值 而获得的量化值取基于标准设置的最大值,所以能够最小化量化误差。
而且,根据第一实施方式,所公开的编码设备存储预定频带数,并 且确定在所存储的预定频带数的范围内且以包含所检测到的音调频谱的 频带为中心的相邻频带。其后,编码设备校正该相邻频带的容许误差功 率。因此,能够容易地检测到要校正容许误差功率的频带。
根据第一实施方式的编码设备采用这样的方案,其中縮放因子校正 单元108校正用于音调检测单元103所检测的频带的缩放因子,以使得 通过对频带的频谱中的最大一个进行量化的值成为基于标准的最大值。 然而本发明不限于该方案。例如,根据第二实施方式的编码设备可以是 这样的,即,该编码设备搜索使所生成的量化误差功率较小的縮放因子, 并且使用通过搜索而获得的縮放因子。
根据第二实施方式的编码设备将由縮放因子确定单元107确定的縮 放因子和从将縮放因子改变预定值而获得的改变縮放因子中选择的縮放 因子确定为縮放因子。然后,编码设备使用两个縮放因子中的减小量化期间生成的量化误差(或者量化误差功率)的一个。下面,简要地给出 或者省略与第一实施方式中的编码设备相同之处的描述。
在根据第二实施方式的编码设备中,对应于"误差确定单元"的縮 放因子校正单元108通过使用缩放因子确定单元107针对频带确定的縮 放因子,来确定在对该频带中包含的频谱进行量化期间生成的量化误差
功率。此外,縮放因子校正单元108使用通过改变縮放因子确定单元107 确定的縮放因子而获得的改变縮放因子,来确定量化误差功率。
因此,如图17中所示,根据第二实施方式的縮放因子校正单元108 不同于根据第一实施方式的图11B所示的縮放因子校正单元。即,在縮 放校正值搜索中,根据第二实施方式的縮放因子校正单元108使用容许 误差功率(在第二实施方式中,由容许误差功率校正单元105校正的容 许误差功率和校正前容许误差功率)。
具体地说,在根据第二实施方式的编码设备中,针对音调检测单元 103所检测的频带,縮放因子校正单元108通过使用縮放因子确定单元 107确定的縮放因子,对构成频带的频谱中的每一个进行量化。然后,编 码设备确定量化期间生成的量化误差功率(参考对于基础技术的考虑)。
具体地说,以下说明了这样的情况音调检测单元103检测出频带 "b",縮放因子确定单元107确定用于频带"b"的縮放因子"Sb",并 且构成频带"b"的频谱数量是"Nb"。
首先,在根据第二实施方式的编码设备中,縮放因子校正单元108 通过使用縮放因子"Sb",来对构成频带"b"的每个频谱进行量化以确 定量化值。然后,单元108通过使用所确定的量化值和縮放因子"Sb" 来执行逆量化以确定逆量化频谱。例如,在AAC编码方法中,缩放因子 校正单元108根据图18A和18B中所示的表达式,确定从频带"b"中 包含的第i个频谱"speci"获得的量化值"quanti"和逆量化频谱"ispeci"。
然后,在编码设备中,縮放因子校正单元108根据量化前频谱和逆 量化频谱确定频带的量化误差功率。例如,縮放因子校正单元108根据 图18C中所示的表达式确定频带"b"中的量化误差功率"error—eb"。图 18C中所示的表达式中的"Nb"表示频带"b"中包含的频谱数量。而且,具体地说,縮放因子校正单元108将縮放因子确定单元107 确定的縮放因子改变了预定值。然后单元108使用改变后的縮放因子(改 变縮放因子)来确定在针对音调检测单元103所检测的频带的量化期间 生成的量化误差功率。
例如,縮放因子校正单元108将縮放因子"Sb"改变了预定值"A", 并且使用所产生的改变縮放因子"S,b (例如"S,b" = "Sb" + "A")", 来确定在对频带"b"的量化期间生成的量化误差功率。
而且,具体地说,在根据第二实施方式的编码设备中,縮放因子校 正单元108比较两个量化误差功率(一个称为"第一"量化误差功率, 另一个称为"第二"量化误差功率),来确定"第二"量化误差功率是否 更小。第一量化误差功率通过使用縮放因子确定单元107所确定的縮放 因子而生成,而第二量化误差功率通过使用改变縮放因子而生成。在该 情况下,当"第二"量化误差功率小于"第一"量化误差功率时,缩放 因子校正单元108将用于音调检测单元103所检测出的频带的縮放因子 (例如"Sb")校正为改变缩放因子(例如"S'b")。另一方面,当"第 二"量化误差功率不小于"第一"量化误差功率时,縮放因子校正单元 108不校正縮放因子。
而且,縮放因子校正单元108通过使用各种"A"来针对多个縮放因 子确定量化误差功率,并且将縮放因子校正为使得生成最小量化误差功 率的縮放因子。它作为示例示出,其中縮放因子校正单元108分别使用 "Sbl"和"Sb2"作为第一量化期间和第二量化期间的改变縮放因子。 当单元108针对第一操作使用改变縮放因子"Sbl"来校正单元107确定 的缩放因子"Sb"时,单元108然后比较使用"Sbl"生成的量化误差功 率和使用"Sb2"生成的量化误差功率。
而且,例如,縮放因子校正单元108确定是否针对所有预定的改变 縮放因子(例如,根据预定的"A "确定的縮放因子(改变縮放因子候选)) 执行了比较。然后,縮放因子校正单元108继续縮放因子校正处理,直 到针对所有改变縮放因子执行了比较。
尽管已对根据第二实施方式的编码设备描述了縮放因子校正单元108逐个地比较量化误差功率的方案,但本发明不限于此。可以设置为, 分别针对多个縮放因子确定量化误差功率,同时对所确定的多个(例如 三个或更多个)量化误差功率执行比较,并且使用使所生成的量化误差 功率最小的一个縮放因子。
"A"的值是任意的,并且"A"不仅采用大于"0"的值,而且"A" 也可采用小于"0"的值。而且,縮放因子校正单元108可以预先存储关 于用作为改变縮放因子的值的数量(用于确定和比较量化误差功率的次 数)的设置,并且可以基于该设置执行缩放因子校正处理。
本发明不限于使用各种"A"(使用多个改变縮放因子)的方案。例 如,可将由縮放因子确定单元107确定的縮放因子与仅一个改变縮放因 子比较。例如,可以预先选择被估计会减小量化误差的一个值,并且将 其用作为改变縮放因子。这使得可以快速地执行縮放因子校正处理。
现在不描述根据第二实施方式的编码设备中的縮放因子校正单元 108执行的详细处理的流程的一个示例,而在后面进行描述。
在根据第二实施方式的编码设备中,量化单元109通过使用縮放因 子(或者改变縮放因子)对频带中包含的每个频谱进行量化。縮放因子 (或者改变縮放因子)是使縮放因子校正单元108确定的量化误差功率 最小的縮放因子。例如,縮放因子校正单元108确定针对縮放因子确定 单元107确定的縮放因子"Sb"和通过将縮放因子改变了 "A"而获得 的值"S,b"的量化误差功率。然后,当使用"S,b"而生成的量化误差功 率最小时,使用縮放因子"S'b"对构成由音调检测单元103检测的频带 的每个频谱进行量化。
接下来将使用图19来描述第二实施方式中縮放因子校正单元执行 的处理。图19是示出根据第二实施方式的编码设备执行的縮放因子校正 处理的流程的流程图。
作为示例,使用这样的情况给出下面的描述,其中,除非另有特别 说明,否则音调检测单元103检测出频带"b",縮放因子确定单元107 确定用于频带"b"的縮放因子"Sb",并且构成频带"b"的频谱数量是"Nb"。
如图19中所示,在所公开的编码设备中,当縮放因子校正单元108 要校正縮放因子时(步骤S301:"是"),它确定量化误差功率(步骤S302)。 即,縮放因子校正单元108通过使用縮放因子确定单元107确定的縮放 因子"Sb"来执行量化,并且确定在对频带"b"的量化期间生成的量化 误差功率。
然后,縮放因子校正单元108改变该縮放因子(步骤S303)。艮P, 例如,縮放因子校正单元108将縮放因子"Sb"改变了预定值"A"。縮 放因子校正单元108然后通过使用改变后的縮放因子来确定量化误差功 率(步骤S304)。即,例如,縮放因子校正单元108通过使用所获得的改 变縮放因子"S,b"来确定在对频带"b"的量化期间生成的量化误差功 率。
然后,縮放因子校正单元108比较量化误差功率(步骤S305)。艮P, 例如,针对在对频带"b"的量化期间生成的量化误差功率,縮放因子校 正单元108比较"第一"量化误差功率和"第二"量化误差功率。"第一" 量化误差功率是在使用縮放因子确定单元107确定的縮放因子"Sb"时 生成的。"第二"量化误差功率是在使用改变縮放因子"S,b"时生成的。
然后,縮放因子校正单元108比较通过使用縮放因子确定单元107 确定的縮放因子和通过使用改变縮放因子导出的两个量化误差功率,来 确定当使用改变縮放因子时量化误差功率是否更小(步骤S306)。 g卩,例 如,縮放因子校正单元108确定"第二"量化误差功率是否小于"第一" 量化误差功率。在该情况下,当"第二"量化误差功率小于"第一"量 化误差功率时(步骤S306:"是"),縮放因子校正单元108校正縮放因子 (步骤S307)。 g卩,例如,縮放因子校正单元108将缩放因子"Sb"校正 为改变縮放因子"S'b"。
然后,当縮放因子校正单元108校正縮放因子时(步骤S307),或 者当"第二"量化误差功率不小于"第一"量化误差功率时(步骤S306: "否"),縮放因子校正单元108确定是否已针对所有改变缩放因子候选 执行了比较(步骤S308)。在该情况下,当已针对所有縮放因子候选执行了比较时(步骤S308:"是"),处理结束。另一方面,当尚未针对所有改
变縮放因子候选执行了比较时(步骤S308:"否"),重复上述从步骤S303 到S307的处理,直到已针对所有改变縮放因子候选执行了比较。
如上所述,根据第二实施方式,在公开的编码设备中,縮放因子校 正单元108通过使用縮放因子确定单元107确定的縮放因子并且还使用 改变縮放因子来确定量化误差功率。然后,编码设备通过使用当确定了 所确定的量化误差功率中最小的一个时使用的縮放因子(或改变縮放因 子)来执行量化。
尽管上面已描述了第一和第二实施方式,本发明还可以按不同于上 述第一和第二实施方式的各种其它形式来实现。因此,下面将描述其它 实施方式。
己在上述的第一和第二实施方式中描述了縮放因子校正单元108校 正仅针对由音调检测单元103检测的频带的縮放因子的方案。本发明不 限于此,而可以针对所有频带校正縮放因子。这允许根据第三实施方式 的编码设备减小针对其它频带的量化误差。
而且,例如,量化单元109可以通过使用縮放因子校正单元108确
定的縮放因子来对所有频带中包含的每个频谱进行量化。具体来说,缩 放因子校正单元108确定仅针对由音调检测单元103检测的频带的縮放 因子,并且校正该縮放因子。此外,单元108将针对其它频带的縮放因 子校正为针对音调检测单元103检测的频带而确定的縮放因子。量化单 元109然后通过使用音调检测单元103针对音调检测单元103所检测的 频带而确定的縮放因子,来对所有频带中的每个频谱进行量化。
这允许根据第三实施方式的编码设备减少在对縮放因子进行编码期 间使用的比特数量。具体地说,在编码期间,通过与相邻缩放因子的差 来表示一縮放因子。在该情况下,相比于为各个频带设置不同縮放因子 的方案,将所有的縮放因子设为相同的縮放因子使得可以减少在对用于 单独频带的縮放因子集合进行解码期间所需的比特数量。[相邻频带]
尽管在上述第一实施方式中已描述了以预定频带宽度存在且以音调 检测单元103所检测的频带作为其中心的频带用作为相邻频带的方案, 但本发明不限于此,而可以使用以相对于峰值功率的预定功率宽度存在 的频带。
换言之,如图20中所示,首先,基于频带功率和音调检测单元103 的检测结果,使用预置功率宽度来确定要校正容许误差功率的频带宽度, 然后校正容许误差功率。
具体地说,在根据第三实施方式的编码设备中,容许误差功率校正 单元105具有功率宽度存储单元。该功率宽度存储单元中存储有预定功 率宽度。例如,容许误差功率校正单元105在功率宽度存储单元中存储 "G"。
然后,在编码设备中,音调检测单元103检测包含音调频谱的频带。 此外,容许误差功率校正单元105关注具有以下功率值且包括该包含音 调频谱的频带的相邻频带。所述功率值大于或等于从音调检测单元103 检测的频带的功率值衰减了功率宽度存储单元中存储的预定功率宽度后 的功率值。容许误差功率校正单元105校正相邻频带的容许误差功率, 如图21中所示。
例如,使用图21中所示的示例具体地给出描述。在该情况下,假设 音调频带中的频谱功率是"Epeak",功率宽度存储单元存储"G",并且存 在七个频带,来进行描述。在根据第三实施方式的编码设备中,容许误 差功率校正单元105确定作为通过从"Epeak"衰减了 "G"而获得的功率 的"Eth/',并且使用"Eth/'作为用于确定要校正容许误差功率的频带的 功率阈值。
例如,在根据第三实施方式的编码设备中,容许误差功率校正单元 105在与音调频带相邻的频带中检査功率比功率阈值大的频带。例如,在 图21中所示的示例中,因为频带"2"和"4"展示了比功率阈值大的功 率,所以容许误差功率校正单元105确定要校正容许误差功率的频带宽 度是"B1 (相比于与音调频带相邻的频带在更低频率侧的频带数量)=1"和"B2 (相比于与音调频带相邻的频带在更高频率侧的频带数量)=1"。 以该方式,根据第三实施方式的编码设备可以容易地检测要校正容许误差功率的频带。 [系统结构]在本实施方式中描述的处理中,作为自动执行描述的处理的整体或 一部分可以手动执行,或者作为手动执行描述的处理的整体或一部分可 由已知方法自动执行。另外,除非另有特别说明,否则说明书和附图(例如,图5到13和图17到21)中例示的处理过程、控制过程、特定名称 和包括各种类型数据和参数的信息,可被任意修改。 [实施方式的组合]而且,例如,已对于上述第一实施方式中的描述给出这样的情况, 其中,在校正容许误差功率期间一起实现了 (1)用于校正縮放因子的方 案,(2)使用使量化值成为最大值的縮放因子的方案,和(3)在检测相 邻频带期间使用预定带宽的方案。然而,本发明不限于该情况,并且在 校正容许误差功率期间,(1)到(3)不必一起实现,而也可仅实现(1) 到(3)中的一个或某些。而且,类似地,针对上述第二实施方式和第三实施方式中描述的方 案,本发明不限于实现方案之一的情况,而也可一起实现多个方案。[程序]同时,尽管已在上述第一实施方式中描述了通过硬件逻辑实现各种 类型处理的情况,但本发明不限于此,而也可通过使计算机执行准备好 的程序来实现处理。因此,下面将使用图22来描述用于执行具有与上述 第一实施方式中例示的编码设备相同的功能的编码程序的计算机的一个 示例。图22是描述用于根据第一实施方式的编码设备的程序的图。如图中所示,第一实施方式中的编码设备3000具有这样的结构,其 中,操作单元3001、麦克风3002、扬声器3003、显示器3005、通信单 元3006、 CPU 3010、 ROM 3011、 HDD 3012、以及RAM 3013通过总线 3009等连接起来。ROM 3011预先存储控制程序,例如输入程序3011a、 MDCT程序301 lb、音调检测程序3011c、音质分析程序3011d、容许误差功率校正程 序3011e、量化频带检测程序3011f、縮放因子确定程序3011g、縮放因 子校正程序3011h、量化程序3011i、编码程序3011j、以及输出程序3011k。 每个预先存储的控制程序分别提供与上述第一实施方式中例示的输入单 元101、 MDCT单元102、音调检测单元103、音质分析单元104、容许 误差功率校正单元105、量化频带检测单元106、缩放因子确定单元107、 縮放因子校正单元108、量化单元109、编码单元110、以及输出单元111 相同的功能。这些程序3011a到3011k可以根据需要而集成在一起或者分 散开,类似于图6中示出的构成编码设备的部件。CPU 3010从ROM 3011读取这些程序301 la到301 lk并且执行它们, 由此使得程序3011a到3011k用作输入处理3010a、 MDCT处理3010b、 音调检测处理3010c、音质分析处理3010d、容许误差功率校正处理3010e、 量化频带检测处理3010f、缩放因子确定处理3010g、縮放因子校正处理 3010h、量化处理3010i、编码处理3010j、以及输出处理3010k,如图22 中所示。处理3010a到3010k分别对应于图6中示出的输入单元101、 MDCT单元102、音调检测单元103、音质分析单元104、容许误差功率 校正单元105、量化频带检测单元106、縮放因子确定单元107、縮放因 子校正单元108、量化单元109、编码单元IIO、以及输出单元lll。[其它]本实施方式中描述的编码设备可以通过使计算机例如个人计算机或 工作站执行准备好的程序来实现。该程序可分布于网络例如因特网上。 该程序也可记录到计算机可读存储介质,例如硬盘、软盘(FD)、CD-ROM、 MO、以及DVD,并且还可以通过使计算机从记录介质读取程序而被执 行。针对包括上述实施方式的例示性实施方式进一步公开了以下附录。 本申请基于并且要求2008年2月19日提交的在先日本专利申请第2008-037991号的优先权,通过引用将该日本专利申请的全部内容合并于此。
权利要求
1、一种编码设备,其用于将音频信号转换为多个频谱并且用于对每个频谱进行量化和编码,该编码设备包括功率校正单元,其用于当从所述频谱中检测到音调频谱时多次校正根据所述音频信号确定的容许误差功率,各容许误差功率对应于各相应频谱的量化误差;和量化单元,其用于对具有比由所述功率校正单元校正的容许误差功率大的功率的每个频谱进行量化。
2、 一种编码设备,其用于对音频信号进行编码,该编码设备包括 频率转换单元,其用于将所述音频信号转换为频谱; 功率确定单元,其用于根据所述音频信号确定多个容许误差功率,各容许误差功率表示对各相应频谱的量化;检测单元,其用于根据由所述频率转换单元转换的频谱来检测音调频谱;功率校正单元,其用于利用所述检测单元执行的检测的结果和所述功率确定单元确定的容许误差功率来校正容许误差功率;以及量化单元,其用于对具有比由所述功率校正单元校正的容许误差功 率大的功率的每个频谱进行量化。
3、 根据权利要求2所述的编码设备,其中,所述功率确定单元针对 通过按照预定宽度划分所述音频信号的频谱而获得的各个频带确定多个 容许误差功率,所述检测单元检测所述音调频谱,并且还检测包含该音 调频谱的频带,并且所述功率校正单元执行校正,以使得所述功率确定 单元针对与所述检测单元检测到的频带相邻的频带而确定的所述多个容 许误差功率小于针对所述相邻的频带的频谱的功率。
4、 根据权利要求2所述的编码设备,其中,所述量化单元将所述频 谱的动态范围减小为由縮放因子唯一指定的动态范围,并且对减小后的 动态范围中的每个频谱进行量化,其中,所述编码设备还包括第一縮放因子确定单元,其用于针对各个频带确定这样的縮放因子, 即,该縮放因子使得根据作为在对该频带中包含的频谱进行量化期间生 成的误差的量化误差而确定的量化误差功率小于所述功率确定单元针对 该频带确定的容许误差功率,和第二縮放因子确定单元,其用于针对与包含所述检测单元检测出的 音调频谱的频带相邻的频带确定以下针对该相邻的频带的縮放因子,艮口, 该縮放因子使得根据作为在对该相邻的频带中包含的频谱进行量化期间 生成的误差的量化误差而确定的量化误差功率小于所述功率校正单元针对该相邻的频带确定的容许误差功率;并且其中,所述量化单元利用所述第二縮放因子确定单元确定的縮放因 子,对由所述第二縮放因子确定单元确定了其縮放因子的频带中包含的 每个频谱进行量化,而利用所述第一縮放因子确定单元确定的縮放因子, 对未由所述第二縮放因子确定单元确定其縮放因子的频带中包含的每个 频谱进行量化。
5、 根据权利要求2所述的编码设备,其中,所述量化单元通过对频 谱进行量化而获得值,设置能作为所述值而获得的最大值;其中,所述编码设备还包括第一縮放因子确定单元,其用于针对各个频带确定这样的縮放因子, 即,该缩放因子使得根据作为在对该频带中包含的频谱进行量化期间生 成的误差的量化误差而确定的量化误差功率小于所述功率确定单元针对 该频带确定的容许误差功率,和第三縮放因子确定单元,其用于确定使得根据构成包含所述检测单 元检测出的音调频谱的频带的频谱中最大的一个而获得的值成为最大值 的縮放因子,作为针对该频带的縮放因子;并且其中,所述量化单元利用所述第三縮放因子确定单元确定的縮放因子, 对由所述第三縮放因子确定单元确定了其縮放因子的频带中包含的每个频 谱进行量化,而利用所述第一縮放因子确定单元确定的縮放因子,对未由 第三縮放因子确定单元确定其縮放因子的频带中包含的每个频谱进行量化。
6、 根据权利要求2所述的编码设备,该编码设备还包括第一縮放因子确定单元,其用于针对各个频带确定这样的縮放因子, 即,该縮放因子使得根据作为在对该频带中包含的频谱进行量化期间生 成的误差的量化误差而确定的量化误差功率小于所述功率确定单元针对该频带确定的容许误差功率;和误差确定单元,其用于利用所述第一縮放因子确定单元针对该频带 确定的縮放因子并且利用作为通过将所述第一縮放因子确定单元确定的 缩放因子改变了预定值而获得的縮放因子的改变縮放因子,来确定在对该频带中包含的频谱进行量化期间生成的量化误差功率;并且其中,所述量化单元利用所述縮放因子或者当所述误差确定单元确 定了量化误差功率中的最小的一个时的改变縮放因子,来对该频带中包 含的每个频谱进行量化。
7、 根据权利要求5所述的编码设备,其中,所述量化单元利用所述 第三縮放因子确定单元确定的縮放因子来对所有频带中包含的每个频谱 进行量化。
8、 根据权利要求2所述的编码设备,该编码设备还包括用于存储预 定频带数的频带数存储单元,其中,所述功率校正单元将位于所述频带数存储单元所存储的预定 频带数的范围中且以包含所述检测单元检测出的音调频谱的频带作为其 中心的频带视为相邻频带,并且校正容许误差功率。
9、 根据权利要求2所述的编码设备,该编码设备还包括用于存储预 定功率宽度的功率宽度存储单元,其中,所述功率校正单元将包括所述包含所述检测单元检测的音调 频谱的频带,且具有大于或等于从所述检测单元检测出的频带的功率值 衰减了所述功率宽度存储单元中存储的预定功率宽度后的功率值的一个 或多个连续频带视为相邻频带,并且校正容许误差功率。
10、 一种编码方法,其用于将音频信号转换为频谱并且对所述频谱 进行编码,该编码方法包括以下步骤根据所述频谱检测音调频谱,并且根据所述音频信号校正容许误差 功率;和利用经校正的容许误差功率来对所述频谱进行量化。
全文摘要
本发明公开了编码设备、编码方法和包括该方法的计算机程序产品。该编码设备将音频信号转换为频谱,确定针对按照预定宽度划分音频信号的频谱而获得的频带的容许误差功率,从频谱中检测音调频谱,并且检测包含该音调频谱的频带。使用该检测结果和容许误差功率,编码设备执行校正,使得功率确定单元针对与检测单元检测出的频带相邻的频带而确定的容许误差功率小于针对该相邻的频带的频谱的功率,并且对功率大于经校正的容许误差功率的每个频谱进行量化。
文档编号G10L19/00GK101515458SQ20091000803
公开日2009年8月26日 申请日期2009年2月19日 优先权日2008年2月19日
发明者土永义照, 白川美由纪, 铃木政直 申请人:富士通株式会社

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:镜面反射增光屏的制作方法技术领域:本实用新型涉及由铝基板为主构成的复合层,特别是一种镜面反射增光屏。背景技术:目前,市场上常见的镜面反射屏是一种贴膜铝的结构。如图1所示,它主要由薄膜层A1、粘合层A2和铝基板A3构成,其中薄膜层A

    专利发布时间:2025-07-01阅读:(117)

    专利名称:粘胶定位治具的制作方法技术领域:本发明涉及一种粘胶定位治具。背景技术:在数码相机、CCD摄像机等设备中使用的光学镜片的制备过程中,其原材料需要切成中片,粘胶后再批量切割。目前粘胶过程麻烦,镜片进入胶液下落过程中易发生平动,镜片不能

    专利发布时间:2025-07-01阅读:(104)

    专利名称:处理发送比特流以及接收处理比特流的方法和设备的制作方法技术领域:本发明涉及一种编码解码音频数据的方法和设备,更具体地说,涉及一种对音频数据分级编码解码(诸如比特时间片算术编码(BSAC))的方法和设备。背景技术:存在发送比特时间片

    专利发布时间:2025-07-01阅读:(138)

    专利名称:掩膜及其制法、掩膜制造装置、发光材料的成膜方法技术领域:本发明涉及蒸镀法等中使用的掩膜及其制造方法、制造装置,以及电光学装置、电子仪器等。背景技术: 作为做成比液晶显示器还薄的显示装置的自发光型显示器,使用了有机EL(electr

    专利发布时间:2025-07-01阅读:(157)

    专利名称:内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序的制作方法技术领域:本发明涉及内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序。例如,本发明适用于音乐再现系统,它

    专利发布时间:2025-07-01阅读:(113)

    专利名称:吉它的导向压弦器的制作方法技术领域:本发明总体涉及弦乐器,更具体涉及用于该种乐器的琴弦的导向压弦器及装置。背景技术: 传统的弦乐器采用多根能被弹奏产生期望音响的琴弦。典型地,这些琴弦设置在安装于乐器琴颈的调音旋钮与由乐器本体后表面

    专利发布时间:2025-07-01阅读:(153)