专利名称:降混限制的制作方法
技术领域:
本文公开的发明大体上涉及模拟或数字音频信号处理技术。更具体地来说,本发明涉及将多个音频信号降混成较少量的音频信号。
背景技术:
如本文使用,降混指的是从通过M个输入音频信号(或通道)编码的信息导出N个输出音频信号(或通道)的操作,其中I ( N〈M。对高质量降混的常见期待包括在输入信号与输出信号之间具有低信息丢失、兼容对话级别和高心理声学保真度。降混通常包括通过波形叠加、变换系数增大、加权平均等等将两个信号组合成一个信号。虽然立体声至单声道降混可以表示成以下简单关系,
权利要求
1.一种将包含输入数据的多个输入音频信号降混成至少一个输出音频信号的方法, 其中预定义最大降混系数,预定义所述至少一个输出信号的至少一个范围中条件并且将所述输入信号划分成预定义的子群, 所述方法包括: 确定作为所述最大降混系数和限制因子的乘积的降混系数,以根据所述输入数据满足所述至少一个输出信号的范围中条件,其中所述限制因子在每个子群内是共同的;以及应用所述降混系数来使所述输入信号降混。
2.根据权利要求1所述的方法,其中输入信号的所述子群中的至少一个包括两个或更多个输入信号。
3.根据权利要求1所述的方法,其中子群中的输入信号对应于空间有关的音频通道。
4.根据权利要求3所述的方法,其中子群包括左通道和右通道。
5.根据权利要求4所述的方法,其中子群包括左通道、右通道和中心通道。
6.根据权利要求1所述的方法,其中以如下方式确定所述降混系数:使得所述范围中条件将按照至多20%的裕量被满足,优选地按照至多10%的裕量被满足,最优选地按照至多5%的裕量被满足。
7.根据权利要求1所述的方法,其中将所述输出信号划分成时间段,且其中对于多个时间段中的每个,确定作为所述最大降混系数和限制因子的乘积的一组分段的降混系数,以单独根据这个时间段中的所述输入数据满足输出信号上限,其中所述限制因子在每个子群内是共同的。
8.根据权利要求7所述的方法,所述多个音频信号被降混成对应于空间有关的通道的至少两个输出音频信号, 其中对于多个时间段中的每个,确定作为所述最大降混系数和限制因子的乘积的一组分段的降混系数,以单独根据这个时间段中的所述输入数据共同满足所述至少两个空间有关的输出信号中的每个的范围中条件,其中所述限制因子在每个子群内是共同的。
9.根据权利要求8所述的方法,其还包括: 定义来自所述分段的降混系数组的降混系数的一系列分段值; 使所述降混系数的所述一系列分段值平滑;和 应用所述平滑的分段值来使所述输入信号降混。
10.根据权利要求9所述的方法,其中通过应用变化率上限来使所述一系列分段值平滑。
11.根据权利要求10所述的方法,其中通过维持或减小所述分段值以满足所述变化率上限来使所述一系列分段值平滑。
12.根据权利要求1所述的方法,其中至少一个子群与该子群的所述限制因子的下限相关。
13.根据权利要求12所述的方法,其中定义准素子群和二次子群,并且与所述准素子群相关的所述限制因子的下限大于与所述二次子群相关的所述限制因子的下限。
14.根据权利要求1所述的方法,其中预定义准素子群和二次子群,并且所述准素子群与所述限制因子的上限相关,以及 其中所述确定降混系数包括准许所述准素子群的所述限制因子的所述上限作为所述准素子群的所述限制因子的值。
15.根据权利要求14所述的方法,其中预定义准素子群和二次子群,并且每个子群与所述限制因子的各自的下限和各自的上限相关K Q1 L2 ^ Ci2S U2),以及 其中所述确定降混系数包括以下子步骤: 最初尝试在限制因子的子空间中满足所述至少一个输出信号的所述范围中条件,使得所述准素子群限制因子等于其上限(a i = Up L2彡α 2彡U2); 进一步,如果所述最初尝试失败,那么尝试在限制因子的所述子空间中满足所述至少一个输出信号的所述范围中条件,使得所述二次子群限制因子等于其下限(L1 < a i < UpQ 2 = L2) ο
16.根据权利要求13至15中任一项所述的方法,其中: 所述准素子群对应于来自以下组之一的通道: (i)用于相对于听者位于前半空间中的音频源的播放的通道, (ii)用于位于与听者基本相同的高度之处的音频源的播放的通道; 以及 所述二次子群对应于除(i )或(i i )外的通道。
17.根据权利要求16所述的方法,其中: 所述准素子群对应于来自以下组之一的通道: /...\ 、产.Ν-γΤ 、V* (ill)目U通道, (iv)中心通道, (V)宽通道; 且 所述二次子群对应于除(iii)、(iv)或(V)外的通道。
18.根据权利要求1所述的方法,其中至少一个子群与所述限制因子的上限相关。
19.根据权利要求18所述的方法,其中两个或更多个子群与所述限制因子的共同上限相关。
20.根据权利要求1所述的方法,所述多个输入音频信号被降混成对应于空间有关的通道的至少两个输出音频信号, 其中确定作为所述最大降混系数和限制因子的乘积的降混系数,所述限制因子在每个子群和所有输出信号内是共同的,以共同满足所述至少两个空间有关的输出信号中的每个的所述范围中条件。
21.根据权利要求20所述的方法,其中所述确定降混系数包括以下子步骤: 对于子群中的所述输入信号贡献于其的所述输出信号中的每个,确定作为所述最大降混系数和初步限制因子的乘积的降混系数;以及 通过选择所述初步限制因子的最小值确定在所述子群内共同的限制因子。
22.根据权利要求20所述的方法,其中所述输出信号对应的所述空间有关的通道属于以下通道组之一: 前通道、环绕通道、后环绕通道、直接环绕通道、宽通道、中心通道、侧通道、高通道、垂直高通道。
23.一种将多个音频信号编码成比特流的方法,其包括:接收多个音频信号; 根据前述权利要求中任一项所述的降混方法将所述音频信号降混成降混信号;以及 将所述降混信号编码成比特流。
24.一种解码包含多个编码的音频信号和至少一个降混规格的比特流的方法,其中根据权利要求1至22中任一项所述的降混方法生成所述降混规格,所述方法包括: 接收所述比特流;以及 解码所述比特流, 其中所述解码步骤包括根据所述降混规格将所述音频信号降混成降混信号。
25.一种解码包含划分成预定义子群的多个编码的音频信号和至少一个降混规格的比特流的方法, 其中所述降混规格包括多组降混系数,其中要应用于每个子群内的音频信号的降混系数之间的比是常量,而要应用于不同子群中的音频信号的降混系数之间的比是变量, 所述解码方法包括: 接收所述比特流;以及 解码所述比特流, 其中所述解码步骤包括根据所述降混规格将所述音频信号降混成降混信号。
26.一种数据载体,其存储用于执行前述权利要求中任一项所述的方法的计算机可执行指令。
27.一种混合系统(400),其包括: 输入端口( 461),其用于接收包含输入数据的多个输入音频信号; 配置区段(420),其用于接收 最大降混系数, 所述至少一个输出信号的范围中条件,以及 所述输入信号到子群的划分; 控制器(440),其用于确定作为所述最大系数和限制因子的乘积的降混系数,以根据所述输入数据满足所述至少一个输出信号的范围中条件,其中所述限制因子在每个子群内是共同的;以及 混合器(462),其用于应用由所述控制器确定的所述降混系数来使所述多个输入音频信号降混成至少一个输出音频信号。
28.根据权利要求27所述的系统,其中输入信号的所述子群中的至少一个包括两个或更多个输入信号。
29.根据权利要求27所述的系统,其中子群中的输入信号对应于空间有关的音频通道。
30.根据权利要求29所述的系统,其中子群包括左通道和右通道。
31.根据权利要求30所述的系统,其中子群包括左通道、右通道和中心通道。
32.根据权利要求27所述的系统,其中所述控制器(440)适于以如下方式确定所述降混系数:使得所述范围中条件将按照至多20%的裕量被满足,优选地按照至多10%的裕量被满足,最优选地按照至多5%的裕量被满足。
33.根据权利要求27所述的系统,其中将所述输出信号划分成时间段;以及所述控制器(400)还适于对于多个时间段中的每个,确定作为所述最大降混系数和限制因子的乘积的一组分段的降混系数,以单独根据这个时间段中的所述输入数据满足输出信号上限,其中所述限制因子在每个子群内是共同的。
34.根据权利要求33所述的系统,其中: 所述混合器(462)适于将所述多个音频信号降混成对应于空间有关的通道的至少两个输出音频信号;以及 所述控制器(440)适于对于多个时间段中的每个,确定作为所述最大降混系数和限制因子的乘积的一组分段的降混系数,以单独根据这个时间段中的所述输入数据共同满足所述至少两个空间有关的输出信号中的每个的范围中条件,其中所述限制因子在每个子群内是共同的。
35.根据权利要求34所述的系统,其中所述控制器(440)包括: 存储器(448、449),其用于缓冲所述降混系数之一的一系列分段值;以及 正规化器(446、447),其用于基于所述一系列分段值提供将由所述混合器(462)应用的所述降混系数的一系列 平滑的分段值。
36.根据权利要求35所述的系统,其中所述正规化器(446、447)适于提供满足变化率上限的所述降混系数的一系列平滑的分段值。
37.根据权利要求36所述的系统,其中所述正规化器(446、447)适于通过维持或减小所述系列中的每个值以满足所述变化率上限来计算所述一系列平滑的值。
38.根据权利要求27所述的系统,其中所述控制器(440)适于对于至少一个子群,满足该子群的所述限制因子的下限。
39.根据权利要求38所述的系统,其中所述控制器(440)适于通过满足准素子群的所述限制因子的下限来区分所述准素子群中的输入信号与二次子群中的输入信号,所述准素子群的所述限制因子的下限大于所述二次子群的所述限制因子的下限。
40.根据权利要求27所述的系统,其中所述控制器(440)适于通过以下步骤区分准素子群中的输入信号与二次子群中的输入信号: 满足所述准素子群的所述限制因子的上限;和 准许所述准素子群的所述限制因子的所述上限作为所述准素子群的所述限制因子的值。
41.根据权利要求40所述的系统,其中所述控制器(440)适于通过以下步骤区分准素子群中的输入信号与二次子群中的输入信号: 满足所述限制因子的各自下限和各自上限(L1S Q1 ^ U1^L2 ^ a2^U2); 最初尝试在限制因子的所述子空间中满足所述至少一个输出信号的所述范围中条件,使得所述准素子群限制因子等于其上限(a i = Up L2彡α 2彡U2);以及 进一步,如果所述最初尝试失败,那么尝试在限制因子的所述子空间中满足所述至少一个输出信号的所述范围中条件,使得所述二次子群限制因子等于其下限(L1 < a i < UpQ 2 = L2) ο
42.根据权利要求39至41中任一项所述的系统,其中: 所述准素子群对应于来自以下组之一的通道: (i)用于相对于听者位于前半空间中的音频源的播放的通道,(ii)用于位于与听者基本相同的高度之处的音频源的播放的通道; 以及 所述二次子群对应于除(i )或(i i )外的通道。
43.根据权利要求42所述的系统,其中: 所述准素子群对应于来自以下组之一的通道: /...\ 、产.Ν-γΤ 、V* (ill)目U通道, (iv)中心通道, (V)宽通道; 且 所述二次子群对应于除(iii)、(iv)或(V)外的通道。
44.根据权利要求27所述的系统,其中所述控制器(440)适于对于至少一个子群,满足该子群的所述限制因子的上限。
45.根据权利要求44所述的系统,其中所述控制器(440)适于对于两个或更多个子群,满足所述子群的所述限制因子的共同上限。
46.根据权利要求27所述的系统,其中: 所述系统(400)适于应用由所述控制器(440)确定的所述降混系数来将所述多个输入音频信号降混成至少两个空间有关的输出音频信号;以及 所述控制器适于确定作为所述最大降混系数和限制因子的乘积的降混系数,所述限制因子在每个子群和所有所述输出信号内是共同的,以共同满足所述输出信号中的每个的所述范围中条件。
47.根据权利要求46所述的系统,其中所述控制器(440)包括: 构件(442、443),其用于对于子群中的所述输入信号贡献于其的所述输出信号中的每个,确定作为所述最大降混系数和初步限制因子的乘积的降混系数;和最小值提取器(444、445),其用于确定所述初步限制因子的最小值。
48.根据权利要求46所述的系统,其中所述输出信号对应的所述空间有关的通道属于以下通道组之一: 前通道、环绕通道、后环绕通道、直接环绕通道、宽通道、中心通道、侧通道、高通道、垂直高通道。
49.一种用于将多个音频信号编码成比特流的编码系统,其包括: 根据权利要求27至48中任一项所述的混合系统,其适于接收所述多个音频信号;以及 编码器,其用于将从所述混合系统获得的输出信号编码成比特流。
50.一种用于解码包含多个编码的音频信号和至少一个降混规格的比特流的解码系统,其中由根据权利要求27至48中任一项所述的输入端口、配置区段和控制器生成所述降混规格, 所述解码系统包括: 解码器,其用于将所述比特流 解码成解码的音频信号;以及 根据权利要求27至48中任一项所述的混合器,其用于将所述多个音频信号降混成降混信号。
51.一种用于解码比特流的解码系统,其包括:输入端口,其用于接收包含划分成预定义子群的多个编码的音频信号和至少一个降混规格的比特流,其中所述降混规格包括多组降混系数,其中要应用于每个子群内的音频信号的降混系数之间的比是常量,而要应用于不同子群中的音频信号的降混系数之间的比是变量; 解码器,其用于将所述比特流解码成解码的音频信号;以及 混合器,其用于应用所述降 混系数来将所述多个音频信号降混成降混信号。
全文摘要
本发明涉及降混技术,通过所述降混技术而从划分成子群的输入音频信号获得输出音频信号。可变的共同增益限制因子被应用于控制来自子群中的输入信号的贡献的所有降混系数。在保留子群内的信号值之间的比例的同时,本发明使得可能将不同输入信号子群的增益限于不同程度,使得相对较易察觉的信号可相对较少地受限制。这样,可在有增益限制和无增益限制的情况下实现一致的对话级别,同时以较不易察觉的方式在信号部分之间过渡。本发明的实施方案包括一种方法、一种混合系统和一种计算机程序产品。
文档编号G10L19/008GK103201792SQ201180054139
公开日2013年7月10日 申请日期2011年11月10日 优先权日2010年11月12日
发明者罗达·威尔逊, 迈克尔·沃德, 史蒂文·韦内齐亚, 勒格尔·德雷斯勒 申请人:杜比实验室特许公司
降混限制的制作方法
相关推荐
专利名称:一种带光控的人体感应led壁灯的制作方法技术领域:本实用新型涉及LED灯具,具体地说,涉及一种带光控的人体感应LED壁灯。背景技术:目前很多的过道、楼道都会配备有壁灯,以方便夜间行走方便;由于LED灯具有节能的特点,不少地方都应用
专利名称:一种打印机用彩色墨粉的制作方法技术领域:本发明涉及一种打印机用彩色墨粉,属于颜料领域。背景技术:印刷的颜色,为看到的纸张反射的光线,因此颜料的三原色就是能够吸收RGB的颜色,为青、品红、黄,他们就是RGB的补色。如把黄色颜料和青色
专利名称:使用电图法的凸起色粉的增强熔化的制作方法技术领域:本发明总体涉及印刷,并且尤其涉及使用电图方法以生成触觉感受(tactile feel)的凸起印刷。背景技术:用于在接收物(receiver)构件(member)上印刷图像的一种常用
专利名称:吊牌灯箱框架直角支撑的制作方法技术领域:本实用新型涉及一种吊牌灯箱框架直角支撑。背景技术:铝合金是工业中应用最广泛的一类有色金属结构材料,在航空、航天、汽车、机械制造、船舶及化学工业中已大量应用。随着近年来科学技术以及工业经济的飞
专利名称:一种新型静电像显影用电荷调节剂及其制备方法技术领域:本发明属于静电显影用电荷调节剂(Charge Control Agent,CCA)技术领域。涉及一种新型静电像显影用电荷调节剂及其制备方法,具体涉及利用多羟基芳香酸及其衍生物合成
专利名称:处理暗盒和可装配该处理暗盒的成像系统的制作方法技术领域:本发明涉及一种处理暗盒和可装配该处理暗盒的成像系统。这样的成像系统可包括诸如静电复印机、传真机、文字处理机等。在诸如复印机之类的成像系统中,通过局部地对均匀荷电的载像部件曝光