专利名称:频带扩展装置及方法、播放装置、方法、程序及记录介质的制作方法
技术领域:
本发明涉及频带扩展装置、频带扩展方法、播放装置、播放方 法、用于使计算机执行再生处理的程序、以及其上记录有程序的记 录介质,它们都能够以较高音质播放在删除高频带之后对其进行编 石马的编码凄t据。
背景技术:
近年来,提供诸如MP3 (国际标准ISO/IEC 11172-3, MPEG
音频层3)的编码数据的音乐分发服务日益流行。在大多数这些服 务中,分配其比特率降低的编码数据,从而不会浪费下载数据的时间。
通常通过删除属于人耳几乎听不到的15 kHz或更高的高频带 的信号分量来对低比特率的编码数据进行编码。结果,4吏文件大小 变小。然而,高频带信号的删除导致诸如由原始信号另外提供的"真 实性"损失和消音的问题。 为了解决这些问题,在诸如HE-AAC (国际标准ISO/IEC 14496-3,高效MPEG4AAC)的编码系统中,带扩展4支术用于生成 属于约15 kHz或更高的较高频带的信号分量,从而再生接近于原 始信号的较高频率分量。此外,近年来,后处理带扩展技术等用于 再生接近于原始信号的较高频率分量。在这种技术中,输入通过使 数据经过解码处理而获得的信号,并内插较高频带,其中,通过删 除属于较高频带的信号分量来对该数据进行编码。
例如,在曰本专利申请公开第JP 2004-184472号(专利参考文 献1)所提出的技术中,通过将输入信号与局部振荡信号混合产生 高频带信号,并通过添加输入信号和利用取决于编码系统或音乐类 型的通带特性过滤的较高频率分量来内插频带。在日本专利申请公 开第JP 2002 - 175092号(专利参考文献2)所提出的技术中,为 了附加较高频带信号分量,通过傅立叶变换将输入信号变换到频 域,根据低频带的频谱估计较高频带的包络,调整低频带的频谱增 益以适合该包络。
发明内容
然而,在专利参考文献1所提出的技术中,存在对预先了解的 高通滤波器的通带特性类型的限制,使得不能获得对于较高频带的 增益调整的灵活性。此外,在专利参考文献2所提出的技术中,对 输入信号进行傅立叶变换以在频域中对其幅值进行调整,然后,对 合成信号进行傅立叶逆变换以获得时域信号。然而,该技术产生了 取决于傅立叶变换长度的时域图形失真的问题。
此外,在日本专利第3538122号(专利参考文献3)中,通过 使用带划分滤波器来避免这些问题。图10是在专利参考文献3中 提出的现有技术的播放装置的框图。在该技术中,在带划分部101 中,将输入的PCM (脉沖编码调制)信号分解成多个子带信号。随
后,在包络估计部102中,估计基于帧的频率包络,以及在高频带
生成部103中,生成属于较高频带的子带信号。最后,将经带扩展 的子带信号提供给带合成部104,并输出经带扩展的PCM信号。
然而,在专利参考文献3中提出的上述技术产生了三个问题。 第一,由于以特定lt量的帧为单位进4于处理,所以不生成遵循在專lr 入信号的单个帧内的时间波动的较高频带信号。第二,当输入极大
的信号时,相应地,计算得到的较高频带信号也非常大,使得来自 带合成滤波器的输出可能溢出。第三,在后处理带扩展技术中(其 中,输入通过对编码数据进行解码而得到的信号并内插高频带), 用于带扩展的扩展开始频带是未知的。
考虑到上述及其它问题,期望提供一种频带扩展装置、频带扩 展方法、播放装置、播放方法、用于使计算机执行再生处理的程序、 以及在其上记录程序的记录介质,它们都能够以更高音质播放通过 删除属于较高频带的信号分量来对其进行编码的编码数据。
在本发明的一个实施例中,提供了 一种用于扩展输入信号频带 的频带扩展装置。该装置包括扩展控制装置,用于确定输入信号 的扩展开始带;以及带划分装置,用于将输入信号划分为多个子带 信号。在频带扩展装置中,基于由带划分装置对输入信号进行带划 分所得到的多个子带信号中低于扩展开始带一侧上的多个子带信 号来扩展频带。
在本发明的另 一实施例中,提供了 一种用于扩展输入信号频带 的频带扩展方法。该方法包括根据与输入信号相关的信息来确定 输入信号的扩展开始带;将输入信号划分为多个子带信号;以及基 于在带划分步骤中对输入信号进行带划分所得到的多个子带信号 之中低于扩展开始带一侧上的多个子带信号来扩展频带。
在本发明的另 一 实施例中,提供了 一种用于在对输入信号进行
带扩展之后播放输入信号的播放装置。该播放装置包括扩展控制 装置,用于根据与输入信号相关的信息来确定输入信号的扩展开始 带;以及带划分装置,用于将输入信号划分为多个子带信号。在播 放装置中,基于由带划分装置对输入信号进行带划分所得到的多个 子带信号中低于扩展开始带一侧上的多个子带信号来扩展频带。
在本发明的另 一实施例中,提供了 一种用于在对输入信号进行 带扩展之后播放输入信号的播放方法。该方法包括根据与输入信 号相关的信息来确定输入信号的扩展开始带;将输入信号划分为多 个子带信号;以及基于在带划分步骤中对输入信号进行带划分所得 到的多个子带信号中低于扩展开始带一侧上的多个子带信号来扩 展频带。
在本发明的另 一实施例中,提供了 一种用于使计算机执行在对 输入信号进行带扩展之后播放输入信号的处理的程序。该程序包 括扩展控制步骤,根据与输入信号相关的信息来确定输入信号的 扩展开始带;带划分步骤,将输入信号划分为多个子带信号;以及 频带扩展步骤,基于在带划分步骤中对输入信号进行带划分所得到 的多个子带信号中低于扩展开始带一侧上的多个子带信号来扩展 频带。
在本发明的另 一 实施例中,提供了 一种在其上记录用于使计算 机执行在对输入信号进行带扩展之后播放输入信号的处理的程序 的记录介质。该程序包括扩展控制步骤,确定输入信号的扩展开 始带;带划分步骤,将输入信号划分为多个子带信号;以及频带扩 展步骤,基于在带划分步骤中对输入信号进行带划分所得到的多个 子带信号中低于扩展开始带一侧上的多个子带信号来扩展频带。
才艮据本发明的上述实施例,可以确定输入信号的扩展开始带, 并可基于低于扩展开始带一侧上的多个子带信号扩展频带。从而, 可以再生较高音质的输入信号。
图1是示出了根据实施例的频带扩展装置配置的框图2是示出了辅助信息(side information )和扩展开始频带"sb" 之间关系的图表;
图3是示出了在代码严重劣化的情况下频率-振幅特性的示
图4是示出了用于确定用于过渡才企测的子带的处理流程的流禾呈
的示意图6是示出了用于计算基于加权平均的包络基准值的处理流程 的流禾呈图7是示出了用于限制包络基准值的处理流程的流程图8A和图8B是均示出了如何限制包络基准值的示意图9是示出了如何对低域子带信号和高域子带信号进行相位调 整的示意图;以及
图IO是示出了根据现有技术的频带扩展装置配置的框图。
具体实施例方式
以下,将参照附图详细描述本发明的具体实施例。这些实施例 能够播放具有较高音质的输入信号。
图1是示出了根据实施例的频带扩展装置10的配置的框图。 频带扩展装置10包括扩展控制部11、带划分部12、时间分类部13、 包络估计部14、带内插部15、高频生成部16、相4立调整部17、以 及带合成部18。
将与输入信号相关的辅助信息(例如,编码系统的类型、采样 率、和比特率)提供给扩展控制部11,该扩展控制部11基于该辅 助信息确定扩展开始频带,并将确定的扩展开始频带提供给带划分 部12。可选地,辅助信息可以是才艮据输入信号的编码系统类型而预 先设定的值,或者可以是用户指定的任意值。
带划分部12将输入信号划分为多个子带信号。随后,带划分 部12将在生成的多个子带信号中的低于扩展开始频带一侧上的多 个子带信号(在下文中,称为"低域子带信号")提供给带合成部 18。此外,带划分部12将在多个低域子带信号中接近扩展开始频 带一侧上的多个子带信号(在下文中,称为扩展低域子带信号)提 供纟合时间分类部13和高频生成部16。
时间分类部13在时间方向上对扩展低域子带信号执行过渡检 测,在时间方向上将扩展低域子带信号分组,为每组扩展低域子带 信号生成平均采样功率,并将平均采样功率提供给包络估计部14。
包络估计部14从在时间分类部13处生成的平均采样功率的总 和中获得每个组的组功率,并计算全部扩展低域子带信号的组功率 的平均值。随后,利用作为开始点的组功率平均值,估计等于扩展
开始频带或在高于扩展开始频带一侧的子带的包络值,并将估计的 包络值提供给带内插部15。
带内插部15根据高域侧上子带的包络值和低域侧上子带的包
络值来计算从扩展低域子带信号到高域侧上子带信号的增益调整
值,并将计算的增益调整值提供给高频生成部16。
高频生成部16将高域侧上子带信号的增益调整值与扩展低域 子带信号相乘以生成高域侧上的子带信号,并将高域侧上的生成的 子带信号提供给相位调整部17。
相位调整部17移动由高频生成部16生成的高域侧上的子带信 号的相位,并将相移后的高域侧上的子带信号提供给带合成部18。
带合成部18将从相位调整部17向其纟是供的高域侧上的子带信 号的带与从带划分部向其提供的低域子带信号进行合成,并输出合 成的带扩展信号。
通过以这种方式使用与输入信号相关的辅助信息,可以非常准 确地确定带扩展的扩展开始频带。此外,由于基于接近扩展开始频 带的扩展低域子带信号生成了在高于扩展开始频带一侧上的子带 4言号,所以可以以较高音质扩展频带。此外,通过移动所生成的高 域侧上子带信号的相位,可以防止溢出。
以下,将更详细地描述上述频带扩展装置的各个部件。
扩展控制部
扩展控制部11基于与输入信号相关的辅助信息确定扩展开始 频带。辅助信息包括编码系统的类型、釆样率、和比特率。可选地,
辅助信息可以是才艮据输入信号的编码系统类型预先设定的值,或者 可以是用户指定的任意值。
通常,输入信号所属的频带与各种辅助信息(例如,编码系统 的类型、采样率、和比特率)相关。因此,在本实施例中,通过使 用该辅助信息估计输入信号所属的频带,并确定用于内插频带的扩 展开始频带Sb。将确定的扩展开始频带Sb提供给带划分部12。
图2是示出了辅助信息和扩展开始频带sb之间关系的图表。 图2所示的实例是将输入信号所属的频带划分为十六个子带的情 况。#4居编码系统、采才羊率、和比特率确定扩展开始频带sb (sb 是从0到15范围内的任一常数)。例如,假定辅助信息表示编码系 统为B,采样率为44100 Hz,以及比特率为64 96kps,则确定扩 展开始频带sb为9。用于确定辅助信息的因素可以包括立体声/单 声道、CBR/VBR等之间的差别。
带划分部12将输入信号x (n)划分为十六个子带信号x (ib, n)(ib=0~15,其中,较大的ib表示较高域的子带信号)。在这十 六个子带信号x(ib, n)中,带划分部12将属于从子带0到子带 sb-l的范围内的子带(其是在扩展开始频带(在下文中称作"sb") 之前的一个子带)的子带信号x (ib, n )提供给带合成部18,并且 也将属于从sb-4到sb-l的子带的子带信号x (ib, n) 4是供给时间 分类部13和高频生成部16。
在本实施例中描述了将输入信号x(n)划分为十六个子带信号 x(ib, n)。然而,输入信号一皮划分成的子带lt量不限于此。
时间分类部
时间分类部13每当其在时间方向上才全测到"^者如声音升高或降 低的过渡时就将信号分成不同组,并对每个组内插高频带。利用这 种布置,可以防止具有不稳、定状态和稳、定状态以及具有不同的增益 和频率特性的自然环境中声音信号的音质恶化。同时,在专利参考
文献3所公开的技术中,执行巾贞处理,并以帧为单位执行处理以内
插高频带。即,利用该技术,在没有将自然环境中的声音信号从自 然环境中分离出来也没有考虑时间波动的情况下,也可以内4翁高频 带。因此,这可能使音质恶化。
时间划分和功率包络的计算
将由带划分部12提供的低域侧上的从sb-4到sb-l的子带信号 x (ib, n)用作输入。将子带信号x (ib, n)中的每一个都划分为 十六个段,每一段都是^皮称为时隙(slot)的单位。随后,对每个 时隙计算每次采样的平均采样功率power (ib, islot )。将每个时隙 的采样数设定为八。
/70wer(/6,/s/of) = —ZW'力力/o"8 + ")"沐/i7o"8 + ")) ( 1 )
Ww = 0,l,2'.'l5 (islot: 当前时隙)
通过过渡4全测进4于分组
在低域侧上从sb-4到sb-l的子带信号中,在时间方向上(沿 着时间轴前后)比4交所有十六个时隙中的每一个的平均采才羊功率 power (ib, islot),以执行用于检测升高或降低的过渡检测。本文 中所使用的术语"过渡4企测"是指平均采样功率在时间方向上出现 较大波动的位置的检测。
计算搜索中时隙的平均采样功率与在4叟索中时隙之前的时隙
的平均采样功率power (ib, islot-l)的比率。随后,通过将比率大 于等于16倍的情况判断为升高,以及将比率小于等于1/16 (= 0.0625 )倍的情况判断为降低,从过去时间一全测到过渡的时隙开始 到与才全测到当前过渡的时隙紧4妻的时隙的时隙形成为单个组。
当在某个子带ib中检测到上升或降低时,假设在低域侧上从 sb-4到sb-l的所有子带信号中都4企测到上升或降{氐。
.,.,.,、p,W力,油?)/ ,、
'ra"o(/6, > 16…4企测到上升 ' < ro"o(,力力/0〈 0.0625…检测到下降-0.0625 2 rato(/6,油0《16…无
(islot:当前时隙)
结果,在考虑到时间波动的情况下进行分组,使得可以生成更 接近于自然环境中的声音信号的高频带分量,因此产生较高质量的声音。
在该实施例中,在时间方向上将由带划分部才是供的低域侧上乂人 sb-4到sb-l的子带信号x (ib, n)中的每一个划分为十六个段,每 个4爻是^皮称为时隙的单位。然而,在时间方向上的划分数量不限于 此。此外,尽管单个时隙包括八个采样,但是时间方向上的划分凌t 量和单个时隙中的采样数量不限于此。此外,虽然将过渡检测的比
率大于等于16^f咅的情况判断为升高,以及将比率小于等于1/16(= 0.0625 )倍的情况判断为降低,但可以响应于带划分的数量、时间 方向上的划分凄t量等,来改变用于4企测上升或降4氐的阈值16和1/16 (=0.0625 )。
确定过渡一企测的子带
在遭受代码劣化的编码信号的组中,时间波动的精确性:取决于 经过过渡^^测的低域子带信号的劣化程度。图3是示出了在代码严 重劣化的情况下的频率-振幅特性的示图。如图3所示,严重代码 劣化"a" 一皮—见作在频率轴上的孔,并且时间分类部13将孔解释为 信号的衰减状态。因此,存在即使在不存在过渡现象的原始信号中 的位置处,时间分类部13也能^"误地4企测到过渡现象的问题。结 果,由于分组的精确性的降低而使音质降低,另外,由于这种过渡 检测而使计算量增加。
考虑到这些问题,在本实施例中,比较每个子频带的平均采样 功率的最大值,以判断是否需要对子带进行过渡检测。此后,执行 实际的过渡检测。另外,在所有子带都包括极小的信号的情况下, 不才丸4亍过渡;险测,以防止由于^合耳又了不可听范围内的时间波动而增 力口计算量。
图4是示出了用于确定过渡4企测的子带的处理流程的流程图。
在步骤S41至S43中,在低域侧上从sb-4到sb-l的四个子带 4言号中的每一个中,4叟索其全部十六个时隙的平均采才羊功率power (ib, islot)的最大^i,并将该最大偵/没定为该子带的^C表4直max power ( ib )。
在步骤S44中,在分别对〗氐域侧上的四个子带获得的四个代表 <直max power (ib ) (ib = sb-4, sb-3, sb-2, sb-l )中,爿寻具有最大 值的子带设定为父子带pb,并将剩余的子带设定为子子带cb (0)、 cb ( 1 )、 cb ( 2 )。将父子带的代表值设定为max power ( pb )(步骤 S45 )。
如果在步骤S46中判断父子带的代表值max power ( pb )等于 其不小于基于16位全标度基准(full scale reference )的—80[dBFs] 的等级,则过禾呈前进至步骤S47。
另一方面,如果父子带的代表值max power ( pb )等于其小于 基于16位全标度基准的_ 80[dBFs]的等级,则不对低域侧上四个子 带中的任一个执行在时间方向上基于过渡检测的分组。这意味着不 存在用于过渡检测的子带(步骤S48)。因此,跳过对任何小信号的 过渡4佥测,从而防止了不必要的计算量的增加。
如果在步-骤S47中判断max power( ib )等于或大于-80[dBFs], 以及相只寸于父子带pb的i^表4直max power ( pb )来i兌,某个子子带 cb (m)的4化表值max power ( cb ( m ))等于该值的小于0.0015625 倍,则过程前进至步骤S49,其中,完全不对该子带才丸行过渡检测。
另一方面,如果max power (ib)等于或大于-80[dBFs],以及 才目只于于父子带pb的4戈表1直max power ( pb )来i兌,某个子子带cb (m)的代表值max power ( cb (m))等于或大于0.0015625倍, 则处理前进至步备聚S50,以对该子带冲丸4亍过渡4全测。在用于过渡抬r 测的目标子带中也包括父子带pb。
<formula>formula see original document page 19</formula>
<formula>formula see original document page 20</formula>
结果,通过防止代码劣化引起的时间波动的错误检测以及通过 再生更接近于自然声音信号的时间包络,可以再生较高质量的声 音。在时间分类部13中所生成的4氐域侧sb-4至sb-l上的四个子带 ib的平均采4羊功率power (ib, islot) 一皮4是供症会包络估计部14。
应该注意,在本实施例中,不对具有低于0.0015625倍的过渡 冲全测率的子带4丸行过渡4企测。然而,可以响应于带划分lt量、时间 方向上的划分H量等,来改变过渡4企测的阈值0.0015625。
包^f古计部
包络估计部14首先#4居在时间分类部13生成的平均采才羊功率 power (ib, islot)的总和中获得每组的组功率,并计算低域侧上从 sb-4到sb-1的子带信号的组功率的平均值。随后,利用^f氐域侧上这 些子带的组功率平均值作为开始点,通过基于一阶直线的外插法估 计高域侧上从sb到15的子带的包络值。当将包络值的一阶直线表 示为ax+b时,通过基于后述的加权平均计算的包络基准值来获得 基准点b,并通过后述的包络斜率值a—lev来获得斜率a。
组功率的计算
包络估计部14将从时间分类部13向其提供的低域侧的四个子 带ib ( sb-4到sb-l )上的平均采才羊功率power (ib, islot)用作l命入。 在每个子频带ib中,对每组计算在每组中存在的与时隙nslot (ig) 的数量一样多的平均采样功率power (ib, isot)的总和,并将该总 和i殳定为组功率tpow (ib, ig),其中,ig表示当前组,并且最多存 在16个组。[公式4]
<formula>formula see original document page 21</formula>,tpow:组功率 " ig :当前組
、nslot:某个组中的时隙数乂 通过加权平均计算包络基准值
从通过公式4得到的各个组中的组功率tpow(ib, ig),获得在 低域侧上从sb-4到sb-1的全部子带信号的平均值。这里,通过使 用加权平均以获得平均值从而将较大的权重分配给更接近于sb的 子带,本实施例使得低域侧上的包络能够更平滑地连接到高域侧上 的包络。
图5A和5B是分别示出了基于不同平均方法的包络基准值的 示意图。这里,将描述对于于与剩余的子带的组功率相比,邻近sb 的子带sb-1的组功率tpow (sb-l, ig)4交小的情况,才艮据不同的平 均方法纟寻到的差4直,如图5A和5B中所示。
如图5A所示,由于远离sb的剩余三个子带的组功率tpow( ib, ig)的大小的影响,使用每个均具有相等加权值的平均值,将根据 平均值计算的基准点b计算成大值。结果,子带sb-l和子带sb并 没有平滑连接,从而导致音质劣化。
另一方面,在本实施例中,图5B中所示,通过将较大权重分 配纟合更4妄近于sb的子带来计算平均值,4吏得可以平滑地连4妄频率包络。
图6是示出了用于通过加权平均来计算包络基准值的处理流程
的流程图。在步骤S61至步骤S63中,分别计算低域侧上从sb-4 到sb-l的四个子带信号的组功率tpow (ib, ig)。随后,按照较接 近于sb的子带的顺序以例如8:4:2:1的比率对组功率tpow (ib, ig ) 4丸行加权平均(步骤S64),以获得加权平均值w_avg (ig)(步骤 S65 )。
w 一 avg(/g) = 1 /15 * (8 * /pcw(s6 — 1, /g)
+ 4*/pow(A-2,/g) ( 5 )
+ 2 * //7ow(W — 3, /g) +1 * ,/ww(A — 4, ,'g))
(w_avg :加权平均值)
随后,利用低域侧上从sb-4至sb-l的四个子带信号中获得的 加权平均值w—avg(ig),估计子带sb的组功率。该值等于基准值b, 并被称为"包络基准值fenv (ig)"。在本实施例中,通过与用户指 示的包络基准调整值b—lev相乘来确定该值。即,不仅唯一地确定 包络基准值,而且还纟是供用户可控制的包络基准调整功能。
々"v(/g) = w —avg(/g)*6—/ev (6)
'fenv:包络基准值 、 、b—lev:包络基准调整值乂
在本实施例中,包络基准调整值b—lev的范围为从0.25到1.0 (这两个值包括在该范围内),或者可以由用户将其i殳定为该范围 内任意值。在本实施例中,基于通过静态分析典型音乐数据而获得
的频率包络,将包络基准调整值b一lev设定为0.5来作为推荐值。 然而,可以响应于带划分凄t量、扩展开始频带sb等,来改变包络基 准调整值b一lev的范围。
包络基准值的限制
根据加权平均值w—aVg( ig )或扩展强度e—lev,包络基准值fenv (ig)可为极其大的值。因此,当带合成部合成子带信号时,所得 到的带合成输出信号很可能溢出。考虑到这种情况,在本实施例中, 通过将限幅器应用于包络基准值fenv (ig )来防止输出信号的溢出, 使得该值达不到极大值。
图7是示出了用于限制包络基准值的处理流程的流程图。同样, 图8A和8B都示出了如何限制包络基准值的示意图。
在步骤S71中,如果包络基准值fenv (ig )大于阈值-6[dBFs] (=16384A2*nslot (ig)),则过程前进至步骤S72,以强制地将该值 衰减到等于如图8B所示的阈值的等级。
另一方面,如果在步骤S71中判断包络基准值fenv (ig )小于 等于阈值-6[dBFs] (=16384A2*nslot (ig)),则过程前进至步骤S73, 以直接使用如图8A所示的包络基准值fenv (ig )。
应该注意,在本实施例中,将用于限制包络基准值fenv (ig ) 的阈值设定为-6[dBFs]。可选地,可影响应于带划分数量、扩展开 始频带sb等来改变该值。
公式7
<formula>formula see original document page 23</formula>( 7 )<formula>formula see original document page 24</formula> ( 8 )
高i或侧上包纟各^i的确定
通过将斜率a与包络基准值fenv (ig )相乘来计算高域侧上从 sb至15的子带的包络值env (ib, ig )。通过包络斜率值a—lev来确 定斜率a。在本实施例中,不仅唯一地确定斜率,而且还提供了用 户可控的包络斜率调整功能。
<formula>formula see original document page 24</formula>( 9 )
(a —lev:包络斜率值)
在本实施例中,包络斜率值a—lev的范围为,人0.25至1.0 (这 两个H均包才舌在该范围内),并可以由用户将其i殳定为该范围内的 任意值。在本实施例中,基于通过静态分析典型音乐数据获得的频 率包络,将包络斜率值a—lev i殳定为0.5来作为推荐值。然而,可 以响应于带划分数量、扩展开始频带sb等,来改变包络斜率值a—lev 的范围。
在低域子带中的包络值env (ib, ig )与组功率tpow (ib, ig )
<formula>formula see original document page 24</formula>
从时间分类部13提供的低域侧上从sb-4到sb-l的子带信号的 包络^直env (ib, ig )和/人上述处理获得的高域侧上/人sb到15的子 带的包络值env (ib, ig )被提供给带内插部15。
带内插部
在带内^翁部15处,调整j氐i或侧上/人sb-4到sb-l的子带信号的 增益,以内插高域侧上从sb到15的子带信号。由sb唯一地确定每 对子带的映射图案。
<formula>formula see original document page 25</formula>
(11)
<formula>formula see original document page 25</formula>sb —map:映射源子带
ib:当前子带
sb:扩展开始频带<formula>formula see original document page 25</formula>
通过找到由包络估计部14 4是供的高域侧上从sb到15中每个 子带的包络值env (ib, ig )除以包含子带ib的源信号的从sb-4到 sb-l的低域侧上每个子带sb—map (ib )的包络值env ( sb—map (ib ), ig)所获得的商的平方根,来获得高域侧上从sb到15的子带的增 益调整系凄丈gain (ib, ig)。
<formula>formula see original document page 25</formula>(12) (gain:增益调整系数)
随后,将从公式(12)获得的高域侧上从sb到15的子带的增 益调整系凄史gain (ib, ig )冲是供乡合高频生成部16。
高频生成部
将来自带划分部12的^f氐域侧上从sb-4到sb-l的子带信号x( ib, n)作为输入提供给高频生成部16,并且也将来自带内插部15的高 域侧上从sb到15的子带的增益调整系数gain (ib, ig )提供给高 频生成部16。通过将高域侧上从sb到15的子带的增益调整系数gain (ib, ig)与用作源信号的^f氐域侧上从sb-4到sb-l的子带信号x (sb—map (ib), n)相乘,获得高域侧上,人sb到15的子带信号x (ib, n)。
x(/6,") = ga/"(/6, /g) * x(W 一画/ (/Z)),") (13)
随后,将从公式(13)获得的从sb到15的高域侧上的子带信 号x (ib, n )提供给相位调整部17。
相位调整部
根据低域侧上从sb-4到sb-l的四个子带信号x ( sb—map (ib ), n)生成由带内插部154是供的高^/f则上,人sb到15的子带信号x(ib, n)。因此,时域信号峰值在相同时刻出现在低域子带信号和高域子 带信号中。如果通过具有在相同时刻出现的峰值的位置处进行合成 来将所有子带加到一起,则在一些情况下可能在所得到的带合成输 出信号中发生溢出。
考虑到上述原因,相位调整部17在移动其峰值之后将低域子 带信号和高域子带信号才是供给带合成部18,以防止这种溢出。
图9是示出了如何对低域子带信号和高域子带信号进行相位调 整的示意图。这里,将高域侧上从sb到15的子带信号x (ib, n) 沿时间轴向后移动了四个采样。即,在本实施例中,通过利用人的 听觉系统中^L察到的后向时间掩蔽(backward tempral masking )净争 性,在听不见的范围内将子带信号x (ib, n)在沿时间方向进行了 延迟。
<formula>formula see original document page 27</formula>应该注意,这里,4丸行四个采样的延迟。然而,可以响应于带 分划数量、扩展开始频带sb、采样频率等,来改变四个采样的延迟。
相位调整部17将通过采样移动获得的从sb到15的高域侧上 的子带信号x (ib, n )提供给带合成部18。
带合成部
带合成部18通过滤波器组将由相位调整部17向其才是供的高域 侧上从sb到15的子带信号x (ib, n)与由带划分部12向其提供 的低域侧上从0到sb-l的子带信号x (ib, n )进行带合成,以获得 带合成输出信号y (n)。
如上所述,在本实施例中,4艮据辅助信息确定sb,然后基于低 于sb—侧上的多个子带信号扩展频带。因此,可以更高音质播放删 除了属于较高频带的信号分量的信号。此外,检测低域侧上从sb-4 到sb-1的子带信号中的代码劣化,然后根据劣化检测结果对低域侧
上sb-4到sb-l的子带4言号^U亍过渡;险测。乂人而,可以防止用于过 渡检测的计算量的增加。此外,通过将4交大权重分配给更接近于高 域侧的低域侧上从sb-4到sb-l的子带信号来求频带包络的平均值, 可以将低域侧的频率包络更平滑地连4妾至高域侧的频率包络。此 外,通过在将限幅器应用于根据低域侧上从sb-4到sb-l的子带信 号计算的包络基准值的同时执行带合成,可以防止带合成输出信号 的溢出。此外,通过相对于带合成的从0到sb-l的4氐域侧上的多个 子带信号对属于,人sb到15的子带的多个信号进4于相移,可以防止 频带合成输出信号的溢出。
应该注意,本发明并不〗义限于上述实施例,而在没有背离本发 明的范围的情况下可以进行各种纟务改。在本实施例中,已经描述了 用于在解码处理之后处理信号的频带扩展装置来作为实例。可选
地,也可将本发明应用于设置有解码装置的播放装置。此外,在上 述实施例中,公开了硬件配置,但本发明并不限于此。可以通过使 CPU (中央处理单元)执行作为计算机程序的任意处理来实现本发 明。在这种情况下,可以纟是供记录在记录介质上的计算才几程序,或 者可选地,通过经由互Jf关网传输或其它传输介质l是供该计算才几程 序。
权利要求
1.一种用于扩展输入信号的频带的频带扩展装置,包括扩展控制装置,用于确定所述输入信号的扩展开始带;以及带划分装置,用于将所述输入信号划分为多个子带信号,其中,基于由所述带划分装置对所述输入信号进行带划分而得到的所述多个子带信号中低于所述扩展开始带一侧上的多个子带信号来扩展所述频带。
2. 根据权利要求1所述的频带扩展装置,包括带合成装置,用于将低于所述扩展开始带一侧上的所述 多个子带信号与大于等于所述扩展开始带的多个子带信号进 行合成。
3. 根据权利要求2所述的频带扩展装置,其中所述带合成装置通过移动低于所述扩展开始带一侧上的 所述多个子带信号的相位和大于等于所述扩展开始带的所述 多个所述子带信号的相位,对其进行合成。
4. 根据权利要求1所述的频带扩展装置,其中所述扩展控制装置通过使用与所述输入信号相关的信息 作为辅助信息来确定所述输入信号的所述扩展开始带。
5. 根据权利要求1所述的频带扩展装置,包括过渡检测装置,用于对由所述带划分装置对所述输入信 号进行带划分而得到的低于所述扩展开始带一侧上的所述多个子带信号中与所述扩展开始带相连的预定数量的子带信号中的每一个,在时间方向上进行过渡4全测;以及组划分装置,用于基于所述过渡检测装置中的过渡检测 结果,在所述时间方向上将所述预定数量的子带信号划分为多个组。
6. 根据权利要求4所述的频带扩展装置,包括功率平均值计算装置,用于基于由所述组划分装置对所 述预定数量的子带信号进行划分而得到的所述组的组功率的 平均值,来计算所述预定数量的子带信号的功率的平均值;包络估计装置,用于以由所述功率平均值计算装置算出 的所述平均值作为起点,外推大于等于所述扩展开始带的所述 多个子带信号的包络直线;以及带内插装置,用于基于所述包络直线内插大于等于所迷 扩展开始带的所述多个子带信号。
7. 根据权利要求4所述的频带扩展装置,其中所述过渡检测装置检测所述预定数量的子带信号的代码 劣化,并响应于代码劣化检测结果,对所述预定数量的子带信 号^Vf于过渡^r测。
8. 根据权利要求4所述的频带扩展装置,其中功率平均值计算装置通过将较大权重分配给更接近于高 域侧的所述预定数量的子带信号来计算所述预定数量的子带 信号的功率的平均值。
9. 根据权利要求5所述的频带扩展装置,其中如果通过所述功率平均值计算装置算出的所述平均值大 于阈值,则所述包络估计装置将所述阈值作为起点来外推所述 包络直线。
10. —种用于扩展输入信号的频带的频带扩展方法,包括根据与所述输入信号相关的信息来确定所述输入信号的 扩展开始带;将所述输入信号划分为多个子带信号;以及基于在所述带划分步骤中对所述输入信号进行带划分而 得到的所述多个子带信号中低于所述扩展开始带一侧上的多 个子带信号来扩展所述频带。
11. 一种用于在对输入信号进行带扩展之后播放所述输入信号的 播放装置,包括扩展控制装置,用于根据与所述输入信号相关的信息来 确定所述输入信号的扩展开始带;以及带划分装置,用于将所述输入信号划分为多个子带信号,其中,基于由所述带划分装置对所述输入信号进行带划 分而得到的所述多个子带信号中低于所述扩展开始带一侧上 的多个子带信号来扩展所述频带。
12. 根据权利要求11所述的播放装置,其中所述输入信号是通过对,皮编码的编码数据执行解码处理 而双才寻的4言号。
13. —种用于在对输入信号进行带扩展之后播放所述输入信号的播放方法,包括根据与所述输入信号相关的信息来确定所述输入信号的 扩展开始带;将所述输入信号划分为多个子带信号;以及基于在对所述输入信号进行带划分而得到的所述多个子 带信号中低于所述扩展开始带一侧上的多个子带信号来扩展 所述频带。
14. 一种用于使计算机执行在对输入信号进行带扩展之后播放所 述输入信号的处理的程序,包括扩展控制步骤,根据与所述输入信号相关的信息来确定 所述输入信号的扩展开始带;带划分步骤,将所述输入信号划分为多个子带信号;以及频带扩展步骤,基于在所述带划分步骤中对所述输入信 号进行带划分而得到的所述多个子带信号中低于所述扩展开 始带一侧上的多个子带信号来扩展所述频带。
15. —种在其上记录用于使计算机执行在对输入信号进行带扩展 之后播放所述输入信号的处理的程序的记录介质,所述程序包 括扩展控制步骤,确定所述输入信号的扩展开始带; 带划分步骤,将所述输入信号划分为多个子带信号;以及频带扩展步骤,基于在所述带划分步骤中对所述输入信 号进行带划分而得到的多个子带信号中低于所述扩展开始带 一侧上的多个子带信号来扩展所述频带。
16.—种用于扩展输入信号的频带的频带扩展装置,包括扩展控制装置,用于根据与所述输入信号相关的信息来确定所述输入信号的扩展开始带;带划分装置,用于将所述输入信号划分为多个子带信号;过渡检测装置,用于对由所述带划分装置对所述输入信号进行带划分而得到的低于所述扩展开始带一侧上的多个子 带信号中与所述扩展开始带相连的预定数量的子带信号,在时间方向上进4亍过-度冲企测;组划分装置,用于基于所述过渡才企测装置中的过渡4企测 结果,在所述时间方向上将所述预定数量的子带信号划分为多 个组;功率平均值计算装置,用于基于由所述组划分装置对所 述预定数量的子带信号进行划分而得到的所述组的组功率的 平均值,来计算所述预定数量的子带信号的功率的平均值;包络估计装置,用于以由所述功率平均值计算装置算出 的所述平均值作为起点,外推大于等于所述扩展开始带的多个 子带信号的包络直线;带内插装置,用于基于所述包络直线内插大于等于所述 扩展开始带的所述多个子带信号;以及带合成装置,用于将低于所述扩展开始带一侧上的所述 多个子带信号与大于等于所述扩展开始带的所述多个子带信 号进行合成, 其中,基于由所述带划分装置对所述输入信号进行带划 分而得到的所述多个子带信号中〗氐于所述扩展开始带一侧上 的多个子带信号来扩展所述频带。
17. —种用于扩展输入信号的频带的频带扩展装置,包括扩展控制器,用于确定所述输入信号的扩展开始带;以及带划分器,用于将所述输入信号划分为多个子带信号,其中,基于由所述带划分器对所述输入信号进行带划分 而得到的所述多个子带信号中低于所述扩展开始带一侧上的 多个子带信号来扩展所述频带。
18. —种用于在对输入信号进行带扩展之后播放所述输入信号的 播放装置,包括扩展控制器,用于根据与所述输入信号相关的信息来确 定所述输入信号的扩展开始带;以及带划分器,用于将所述输入信号划分为多个子带信号,其中,基于由所述带划分器对所述输入信号进行带划分 而得到的所述多个子带信号中低于所述扩展开始带一侧上的 多个子带信号来扩展所述频带。
全文摘要
一种用于在对输入信号进行带扩展之后播放该输入信号的播放装置包括扩展控制器,用于根据与输入信号相关的信息来确定输入信号的扩展开始带;以及带划分器,用于将输入信号划分为多个子带信号。在通过带划分器对输入信号进行带划分而得到的多个子带信号之中,基于低于扩展开始带一侧上的多个子带信号扩展频带。
文档编号G10L19/00GK101178898SQ20071016625
公开日2008年5月14日 申请日期2007年11月7日 优先权日2006年11月9日
发明者光藤祐基, 本间弘幸, 牧野坚一, 知念徹 申请人:索尼株式会社
频带扩展装置及方法、播放装置、方法、程序及记录介质的制作方法
相关推荐
专利名称:用于增强对语音进行三维定位的方法1、本发明的领域本发明涉及语音处理。具体地说,本发明涉及到用于增强对语音进行三维定位的方法和设备。2、对相关技术的说明正常的人类语音包含多种频率成份通常从约100Hz(赫兹)到几KHz(千赫)。例如
专利名称:一种半球型嵌入式led筒灯的制作方法技术领域:本实用新型涉及一种LED灯具,具体是提供一种半球型嵌入式LED筒灯。背景技术:现有技术下的LED灯具,尤其是嵌入天花 板内的LED灯具,其一般有以下三种I、嵌入式简灯是一种嵌入到天花板
专利名称:一种移动照明万向灯架的制作方法技术领域:本发明涉及一种灯架。 背景技术:目前现有技术, 一种收折灯架,包括底支撑架座、顶支撑杆、中空的 中支撑杆、设置在顶支撑杆上的灯架杆,底支架座由三个支撑脚杆、连接 座、中心支撑杆、紧固活动套构
专利名称:一种带有方形滤光片的镜头的制作方法技术领域:: 本实用新型涉及一种相机镜头,具体涉及一种带有方形滤光片的镜头。技术背景:现在市面上的镜头生产过程中,所需要的步骤很多,在组装镜头过程中,要用到一种滤光片,但是现在市面上生产的镜头滤光
专利名称:轴对称矢量偏振光获取方法及实现该方法的装置的制作方法技术领域:本发明涉及轴对称矢量偏振光获取方法及实现该方法的装置,属于光学领域。 背景技术:轴对称矢量偏振光的偏振形式如图1所示,光束的每一点均为一个与半径方向成 %角的偏振,轴对
专利名称:用于并行传输的光收发组件的制作方法技术领域:本发明涉及一种用于并行传输的光收发组件。 背景技术:随着光通信的飞速发展,对于光纤通信中激光器或探测器与光通道对准耦合,已经有了很多相关研究。大部分产品都是基于单一激光器对准单一光纤实现