多通道音频信号的编码和解码的制作方法-品牌商务网

专利名称：多通道音频信号的编码和解码的制作方法
技术领域：
本发明涉及多通道编码和解码。更加特别地，本发明涉及将一定数量音频通道转换成更小数量音频通道(编码)的装置和方法，和将一定数量音频通道转换成更大数量音频通道(解码)的装置和方法。
使用多通道的音频系统是公知的。虽然传统的立体声系统只使用两个音频通道，但是现代的5.1系统使用6个通道左前(lf)、左后(lr)、右前(rf)、右后(rr)、中间(co)和低频音效(lfe或le)。更大数量的通道引起要被存储和/或被传输的音频数据量的增加。这个数据增加已经通过编码产生降低数据量的效果。
这些编码技术之一被称为中/侧(M/S)编码或和/差(Sum/Difference)编码，在由J.D.Johnston和A.J.Ferreira撰写的论文“Sum-difference stereo transform coding”，Proceedingsof International Conference on Acoustics and Speech SignalProcessing(ICASSP)，旧金山，美国，1992年，第569-572页中讨论。中/侧编码典型地用于编码一对立体声信号。使用M/S编码，包含第一(例如，左)信号l[n]和第二(例如，右)信号r[n]的音频信号被编码为和信号m[n]和差(或残留)信号s[n]m[n]＝r[n]+l[n] (1)s[n]＝r[n]-l[n]对于(几乎)同样的信号l[n]和r[n]，当相应的差信号s[n]接近于零时，这给出大的编码增益，而和信号实际上包含所有的信号能量。因此，在这种情形下，编码和差信号所需要的比特率接近于只编码单通道所需的比特率。
可替换地，方程(1)的中/侧编码过程可以通过旋转矩阵得到描述m[n]s[n]=ccos(π4)sin(π4)-sin(π4)cos(π4)l[n]r[n]---(2)]]>在此，左和右信号已被旋转了超过π/4的角度。和信号可以被解释为左和右样值在线l＝r上的投影，而差(或残留)信号可以被解释为左和右样值在线l＝-r上的投影。
这项技术可以归纳为允许除了π/4之外的旋转角度。对于宽等级输入信号，为了最小化残留信号中的信号功率(即，最大化编码增益)，旋转角度可以进一步为与信号相关的。下面的一元旋转可以被应用到一对通道m′[n]s′[n]=ccos(α)sin(α)-sin(α)cos(a)l[n]r[n]---(3)]]>其中m[n]和s[n]分别表示支配信号(dominant signal)和残留信号，并且选择角α来最小化残留信号的功率，由此最大化支配信号的功率。这个归纳的旋转技术常常被称为主成分分析(PCA)。
由于公式(3)的旋转最小化残留信号的功率，因此残留信号通常被认为包含很少感觉相关的信息，特别是在较高的频率。为此，传统的编码系统丢弃了在公式(3)的旋转中和在类似变换中产生的残留信号。
尽管参考上面内容的技术主要针对立体声信号，但通过重复将一对信号简化为被存储和/或被传输的支配信号和被丢弃的残留信号，可以将它们应用到具有多通道的音频信号中，诸如5.1信号。
丢弃残留信号当然引起数据简化。但是，本发明人已经意识到只有当残留信号包含相对大量的信息时，才获得明显的数据简化。在这种情况中丢弃残留信号不可避免地引起不期望的音频信号的感觉失真。
在解码装置中，上面讨论的技术被用来从编码信号中重建原始信号。例如，如果已经使用了M/S编码，那么需要支配信号和残留信号以通过反旋转来重新产生原始信号对。在现有技术解码装置中，残留信号没有被接收，因此使用解相关器从每个支配信号中导出合成残留信号。尽管这允许原始信号被近似，但合成残留信号的波形通常不同于实际残留信号的波形。结果，在解码信号和原始信号之间将会有差异。
本发明的目的是克服现有技术的这些和其它问题，并提供一种允许改进的信号质量的编码装置和解码装置。
因此，本发明提供一种编码装置，用于将第一数量的输入音频通道转换为第二数量的输出音频通道，其中该第一数量大于该第二数量，该装置包含至少两个转换单元，每个转换单元用于将第一信号和第二信号转换成第三信号和第四信号，该第三信号包含该第一和第二信号的大部分信号能量，该第四信号包含所述信号能量的剩余部分，该编码装置被布置用于使用该第三信号产生输出信号，其中该编码装置被进一步布置用于输出第四信号。
通过输出至少一个第四信号即上面提到的残留信号而不是丢弃它，可以通过解码器产生明显较好的原始信号重建。
如果编码装置包含多于两个的转换单元，那么对于每个转换单元，该第四信号优选地被输出，尽管这不是必须的，并且所选择的转换单元的该第四信号可以被用来提高在解码器的信号质量。注意到，转换单元可以被并联或串联(级联)布置，并且转换单元可以具有多于两个的输入通道，例如三个。
尽管有可能输出整个第四信号，即，对于第一和第二信号的整个持续时间，但是优选的是选择第四信号将被输出的时间段。更特别地，通过选择感觉相关时间段(例如时帧)，降低了传输或存储第四信号所需要的传输或存储容量，同时仍然提供相对于现有技术来说明显的信号质量改进。例如，只有包含低于5kHz频率的时间段可以被选择，由此使用与频率相关的选择。
在进一步优选的实施例中，通过基本上通过第四(即，残留)信号的感觉相关部分，衰减第四信号的感觉较低相关部分，并抑制第四信号最低相关部分，从而完成时间段或信号部分的选择。即，信号部分(或帧)被分成至少三组那些感觉最相关的信号部分被不衰减地充分通过，那些感觉较低相关的信号部分也被通过但被衰减，那些感觉最低相关的信号部分被抑制。这样，获得每个具有不同相关性的信号部分之间的更平滑变换，产生更高的信号质量。
可以以许多方式确定感觉相关性，例如，通过使用加权函数，该加权函数提供依赖于比率的加权(即，增益或衰减)值，例如在特定时间段期间转换单元的第四信号和第三信号的功率比。
代替或除了各个通道时间和/或频率段的选择，也可以选择第四信号被输出的通道。如果以级联的方式布置至少两个转换单元，那么优选地选择最接近于编码装置输出端的转换单元来输出它的第四信号，而(沿着信号处理方向)更加远离的一个或多个转换单元的第四信号可能被丢弃。换句话说，(沿着信号处理方向)下游的转换单元在其它转换单元之前被选择，来输出它们各自的第四信号。本发明人已经意识到，在最接近于编码装置输出端即在最后阶段产生的第四信号通常将被用于解码装置的第一阶段中，并因此具有解码信号质量的最大相关性。为此，优选的是，特别地当可用的传输容量不允许所有第四信号的传输时，这些第四信号被传输，而具有较低相关性的转换单元的第四信号可能被丢弃。
转换单元的这个选择可以是临时的或永久的。如果是临时的，那么所有的转换单元可以被提供一个选择单元，该选择单元可以根据可用传输容量或其它因素来通过或阻止各个第四信号。如果是永久的，那么可以省略通常离该装置输出端最远的某些转换单元的选择单元。
本发明还提供一种用于解码使用如上定义的编码装置编码的音频信号的解码装置。因此，本发明提供一种用于将第一数量的输入音频通道转换成第二数量的输出音频通道的解码装置，其中该第一数量小于该第二数量，该装置包含至少两个转换单元，每个转换单元用于将第一信号和第二信号转换成第三信号和第四信号，该第一信号包含第三和第四信号的大部分信号能量，该第二信号包含所述信号能量的剩余部分，该装置进一步包含至少一个解相关单元，用于解相关第一信号以便产生合成的第二信号，该解码装置被进一步布置用于接收至少一个附加第二信号。
通过接收附加第二信号(即，在编码装置中被称为第四信号的残留信号)，可以获得改进质量的解码音频信号，因为在解码装置中产生的任何合成残留信号通常不同于原始残留信号。
在一个优选实施例中，将接收的第二信号与导出的合成第二信号组合，因此馈送到转换单元的第二信号是这两个信号的组合。这具有的优势为，合成的残留信号总是可用的，而且用于没有残留信号被传输的时间段。对于那些残留信号真正被传输的时间段，由转换单元使用的残留信号是传输的残留信号和合成的残留信号的组合，并且将因此只部分地包含合成的残留信号。
在一个优选实施例中，解码装置被提供了由接收的残留信号控制的衰减单元，用于衰减合成的残留信号。这允许选择的和没被选择的残留信号之间更平滑的过渡，并且避免任何切换假象。更加特别地，这允许每个合成残留信号的振幅被相应接收的残留信号控制。因此，获得合成残留信号和实际被传输残留信号更加改进的混合。
在上述内容中，参考M/S和PCA编码。可替换地，或另外地，可以使用与振幅相关的编码技术。
注意到，本发明涉及空间音频编码，即与只包含两个通道的立体声编码相反，通常涉及多于两个通道的音频编码。
本发明进一步提供一种将第一数量的输入音频通道转换成第二数量的输出音频通道的方法，其中该第一数量大于该第二数量，该方法包含将第一信号和第二信号转换成第三信号和第四信号的至少两个步骤，该第三信号包含该第一和第二信号的大部分信号能量，该第四信号包含所述信号能量的剩余部分，还包含使用该第三信号产生输出信号的步骤，该方法包含输出第四信号的又一步骤。
本发明还进一步提供一种将第一数量的输入音频通道转换成第二数量的输出音频通道的方法，其中该第一数量小于该第二数量，该方法包含将第一信号和第二信号转换成第三信号和第四信号的至少两步骤，该第一信号包含该第三和第四信号的大部分信号能量，该第二信号包含所述信号能量的剩余部分，还包含从该第一信号中导出该第二信号的步骤，该方法包含接收附加第二信号的又一步骤。
该方法可以包含解相关第一信号，以便产生导出的合成第二信号的又一步骤。优选的，该方法包含衰减该合成第二信号的又一步骤，所述步骤被相应接收的第二信号控制。有利地，该方法可以包含将该合成的第二信号和该接收的第二信号组合的步骤，以及在该转换步骤中使用该组合信号的再一步骤。
本发明另外提供一种计算机程序产品，用于执行上面所定义的编码和/或解码方法。计算机程序产品可以包含存储在数据载体诸如CD或DVD上的一组计算机可执行指令。该组计算机可执行指令(其允许可编程计算机执行如上定义的方法)也可以从远程服务器上下载使用，例如通过因特网。
参考在附图中举例说明的典型实施例，本发明将在下面得到进一步的解释，其中

图1示意性地示出根据本发明的编码装置的一部分。
图2示意性地示出根据本发明的解码装置的一部分。
图3示意性地示出根据现有技术的信号选择函数。
图4示意性地示出根据本发明的第一信号选择函数。
图5示意性地示出根据本发明的第二信号选择函数。
图6示意性地示出根据现有技术的编码装置的第一实施例。
图7示意性地示出根据现有技术的典型解码装置的第一实施例。
图8示意性地示出根据本发明的编码装置的第一实施例。
图9示意性地示出根据本发明的解码装置的第一实施例。
图10示意性地示出根据现有技术的编码装置的第二实施例。
图11示意性地示出根据现有技术的解码装置的第二实施例。
图12示意性地示出根据本发明的编码装置的第二实施例。
图13示意性地示出根据本发明的解码装置的第二实施例。
在图1中仅仅通过非限制性例子示出的本发明装置10包含2-1转换单元12和选择与衰减(S&A)单元15。转换单元12可以是传统的转换单元，其被布置用于将第一对信号转换成第二对信号，第二对由包含大部分信号能量的支配信号和包含剩余信号能量的残留信号组成。可以使用信号旋转或类似技术、例如使用上述的公式(3)从第一对中导出第二对信号(即，支配和残留信号)。
在图1的例子中，转换单元12接收左信号l[k]和右信号r[k]，它们一起构成立体声信号。指数k表示频带或频率仓(frequencybin)，使用短时傅里叶变换(STFT)或类似变换从时间信号l[n]和r[n]中优选地导出信号l[k]和r[k]。因此，信号l[k]和r[k]表示时间段诸如时帧的频率分量。
在现有技术的装置中，支配信号m[k]用于编码，而残留信号s[k]被丢弃，转换单元12产生支配信号m[k]和一组与该转换相关联的参数(Pars)。2004年7月5日提交的欧洲专利申请EP04103168.3(PHNL040762)记述了一种编码器装置，其中使用了残留信号s[k]的一部分。更特别地，在更早申请的装置中，使用了一种选择器，该选择器选择残留信号的感觉相关部分，而丢弃感觉不相关部分。因此，一些部分(其可以是时帧的频率表示)或者被选择，或者被丢弃。欧洲专利申请EP04103168.3，其整个内容在本文献中被引用，记述了在立体声编码器和解码器中部分残留信号的选择。但是，没有记述多通道编码和解码装置诸如5.1装置中部分残留信号的选择。
根据上述欧洲专利申请的选择在图3中被示意性地阐明，图3表示加权函数W’。分配给部分残留信号的权值w依赖于相关因数z，其可以是残留信号s[k]的功率和支配信号m的功率的比值z＝P(s[k])/P(m[k])，或是指示残留信号(相对)感觉相关性的其它因数，特别地与支配信号相比较。当残留信号的相对功率超过了某个阈值z0时，权重因数w等于1，这意味着残留信号部分被完全编码和传输。当残留信号的相对功率小于阈值z0时，权重因数w等于0，并且残留信号的相关部分被丢弃。
本发明人已经意识到，这种选择太粗糙，可能引起听觉切换假象。特别地，解码信号的质量可以被改进，而没有明显地增加传输数据量。因此，本发明提供一种(部分)残留信号的选择，该选择不仅区分相关和不相关部分，而且也识别较低相关部分即不是像(最)相关部分那么相关，也不是不相关的部分。
根据本发明的加权函数W的例子示意性地示于图4和5中。在图4的例子中，加权函数W具有两个阈值z0和z1。如果z小于z0，权重因数w等于零。如果z大于z0但小于z1，权重因数w(在本例中)等于0.5(可以理解，也可以使用诸如0.25或0.67的其它值)。如果z大于z1，w等于1。因此，在图4的例子中，使用了三个不同的权重因数值。
在图5的例子中，权重因数w逐渐地从0(在z＝z0)经由0.5(在z＝z1)增加到1.0(在z＝1)。结果，只有最相关信号部分(z＝1)具有等于1的权重因数，具有大于z0的相关因数z的所有信号部分具有非零的权重因数w。在图5的例子中，理论地使用无穷数的不同权重因数值。加权函数W的逐渐增加导致不同衰减级之间的平滑“切换”。
当然，可以使用除了图4和5中所阐明之外的其它函数。通常，加权函数将具有这样的特性，即对原始信号对l[k]、r[k]的重建没有明显贡献的那些部分残留信号被移除，具有中间相关的部分残留信号被衰减，而高度明显的部分被基本上不衰减地通过。
注意到，不使用功率比，可以使用其它的标准诸如带宽。例如，可以决定选择具有低于某个阈值频率的频率的信号部分，而不考虑它们的信号功率。
图1中所示根据本发明的选择与衰减(S&A)单元15不仅选择信号部分，而且衰减某些选择的信号部分。除了残留信号s[k]以外，选择与衰减单元15接收支配信号m[k]。在所示的实施例中，选择与衰减单元15还接收由2-1转换单元12产生的信号参数(Pars)、和原始信号对l[k]和r[k]。将原始信号对馈送到选择与衰减单元15提供了在选择和衰减决定中包含原始信号对的相对功率(或其它特征)的可能性，除了或代替支配信号和残留信号的相对功率(或其它特征)。将信号参数馈送到选择与衰减单元15允许进一步的信号特征被使用在选择和衰减处理中。
选择与衰减单元15输出加权过的残留信号ws[k]，其结合支配信号m[k]可以被编码。将会理解，加权过的残留信号ws[k]包含比原始残留信号s[k]少的信息，因此降低了传输编码信号对所需的比特率。在另一方面，与其中残留信号被丢弃的现有技术装置相比，包含加权过的残留信号ws[k]提供了信号质量的明显改进。选择与衰减单元15使用如图4和5所阐明的加权函数W，或用于选择和其中是合适的用于衰减该残留信号s[k]的任何等价工具。
依据本发明的用于解码装置的装置示意性地阐明于图2。仅仅是示范性的装置20包含混合单元24和加权单元29。该装置20接收支配信号m[k]、加权过的残留信号ws[k]和信号参数(Pars)。将支配信号m[k]馈送给解相关器(D)23，以导出合成残留信号sd[k]，就象在其中残留信号不被传输的现有技术装置中进行的一样。将这个合成残留信号sd[k]馈送给衰减器26，其中该信号在加权过的残留信号ws[k]的控制下被衰减。也可以将信号参数馈送给衰减器26，来另外地控制合成残留信号的衰减。因而产生的衰减的合成残留信号和加权的残留信号在组合单元27中组合，组合单元27在本实施例中由加法器构成。将因而产生的组合残留信号sh[k]馈送给混合单元24的输入。将支配信号m[k]馈送给混合单元24的另一个输入，同时，例如通过如上公式(3)中所规定的信号旋转，或通过任何其它合适的技术，将信号参数(例如包括IID和ICC)馈送给混合单元24的控制输入，从而将信号对m[k]、sh[k]转换成信号对1’[k]、r’[k]。
因此，在本发明的装置20中，馈送给混合单元24的残留信号sh[k]是(解码)残留信号ws[k]和衰减形式的合成残留信号的组合。如果没有(被传输的)残留信号ws[k]是可用的，那么使用基本上没有被衰减的解相关信号sd[k]。如果残留信号ws[k]是可用的，那么解相关信号sd[k]相应地被衰减。
将在下面参考图8、9、12和13讨论根据本发明的编码和解码装置。但是，首先将参考图6和7讨论根据现有技术的编码装置和解码装置。
现有技术的编码装置1’被设计用于将六通道音频输入信号诸如所谓的5.1信号编码成两通道音频输出信号。在所示的例子中，输入通道是lf(左前)、lr(左后)、rf(右前)、rr(右后)、co(中间)和le(低频音效)。所有这些信号假定是数字时间信号，并可以被写为lf[n]、lr[n]等，n是采样号。
音频输入信号被输入到分割与变换(T)单元11，该单元11将信号分成时间段，然后使用FFT(快速傅里叶变换)将该时间段变换到例如频域。时间信号被分成的时间段优选地部分重叠，正如在现有技术中所公知的。
分割与变换单元11产生变换信号Lf、Lr、Rf、Rr、Co和Le，它们是时间段的频域表示，并且可以被写为Lf[k]、Lr[k]等。K是频率指数。将这些变换信号馈送到2-1转换器12，该转换器将每一对输入信号(例如Lf和Lr)转换成支配信号(例如L)和残留信号，同时产生相关联的信号参数组(例如PS1)。这个转换典型地涉及信号旋转，因此支配信号包含大部分信号能量，而残留信号包含信号能量的剩余部分。
在图6的现有技术装置中，当将支配信号馈送给3-2转换单元13时，残留信号被丢弃。正如所能看到的，每个2-1转换单元12分别产生支配信号L、R和C，以及相关联的参数组PS1、PS2和PS3。该参数组包含与由单元12执行的转换有关的参数，诸如旋转角α、通道间强度差参数IID和/或通道间相关参数ICC。
3-2转换单元13将三个输入信号L、R和C转换成两个输出信号L0和R0，同时产生相关联的参数组PS4。注意到，输入信号L和R可以分别与上面定义的第一和第二信号相同，而信号L0和C0可以分别与上面定义的第三和第四信号相同。
将(变换域)信号L0和R0馈送到逆变换(T-1)与重叠相加(OLA)单元14，该单元输出时域信号l0和r0。逆变换是单元11的变换的相似变换，典型地是逆快速傅里叶变换。重叠相加操作基本上是单元11分割操作的逆，并且相加部分重叠时帧。
由此可以看到，现有技术编码器1’将六个输入音频(时间)信号转换成两个输出音频(时间)信号加上四组参数。在每个转换单元12或13中，输出信号被丢弃，从而降低信号数量以及因此降低所需要的传输率数量。
根据现有技术的兼容解码装置阐明于图7。解码装置2’，其被设计用于将两个音频输入通道变换成六个音频输出通道，包含分割与变换(T)单元21，用来分割与变换输入(时间)信号l0和r0。如在编码装置中，可以使用短时傅立叶变换(STFT)。将产生的(变换域)信号L0和R0馈送给2-3转换单元22，还向该转换单元22提供(第四)参数组PS4(比较图6)。该2-3转换单元22将两个信号L0和R0转换成三个信号L、R和C，它们每一个被馈送给解相关(D)单元23和混合(M)单元24。解相关单元23分别产生信号L、R和C的解相关形式Ld、Rd和Cd。这些解相关信号用作合成残留信号，有效地代替在编码装置中被丢弃的信号。
这三个混合单元24每一个接收控制(向上)混合操作的各个参数组PS1、PS2和PS3。如果使用PCA(主成分分析)，信号旋转被执行超过包含在信号参数组中的角度α。其它合适的参数例如是在上面提到的IID和ICC。不是所有这些参数都是需要的，可以使用下式从参数IID和ICC中导出角度αα=12tan-1(2ICC·cc2-1)---(4)]]>c=10IID20---(5)]]>由混合单元24产生的信号分别是信号对Lf和Lr、Rf和Rr、Co和Le。这些信号被逆变换与重叠相加单元25逆变换(T-1)，该单元执行合适的逆变换诸如逆傅里叶变换，然后重构时间信号对lf和lr、rf和rr、co和le。由此可以看到现有技术解码器2’将一对音频输入信号(l0和r0)转换成六个音频输出信号。
已知解码装置2’的缺陷在于输出信号质量必定受到限制。而且，可用传输容量中的任何增加不会导致输出信号质量的相应提高。这主要是由于被混合单元24使用的残留信号是合成的，即，是从支配信号中导出的事实。本发明，如已参考附图1-5所阐明的，通过也传输残留信号的选择部分解决这些问题。
图8中所阐明的根据本发明的编码装置1类似于图6中所示的现有技术的编码装置1’，除了处理由三个2-1单元12和单个3-2单元13产生的残留信号。在现有技术装置中，由单元12的信号处理(通常是信号旋转)操作产生的残留信号被丢弃，因此参考“2-1”单元。但是，在本发明的装置中，这些残留信号没有被丢弃，而是被单元12输出，并随后被选择与衰减单元15处理。这与图1的装置10相一致，该装置包含2-1单元12和选择与衰减单元15。因此将能够理解，由分割与变换单元11产生的变换输入信号(诸如Lf和Lr)、和/或由单元12产生的信号参数(在图8中指示为PS1..PS3)也可以被馈送到选择与衰减单元15。
每个选择与衰减单元15产生各自的残留信号Ls、Rs和Cs，它们被编码器装置1输出。那些本领域技术人员将理解，这些残留信号，还有参数组PS1，...，PS4，可以在由该编码装置输出之前被适当地编码和/或量化。
由3-2单元13产生的附加残留通道E0也可以被可选择地输出。这个残留通道E0表示参考图6提到的残留通道C0的预测误差。该预测误差等于残留通道C0和它的预测值的差值，该差值又可以是L0和R0的线性组合。附加残留通道E0优选地不接受选择和衰减操作(单元15)，尽管这毫无疑问是可能的。在所示的实施例中，逆变换(T-1)与重叠相加单元14输出除常规的输出(时间)信号l0和r0之外的残留(时间)信号e0。
如果附加的传输容量(位预算)是可用的，那么可以使用附加的残留通道。因此，附加的传输容量可以在所有附加的残留通道上分配。可以规定一些分配优选选择
-附加通道被对称地指配给左侧音频通道区和右侧音频通道区(区例如是一些与通道相关联的单元)；-附加通道首先被指配给离编码装置的输出最近的区；和-在尽可能多的附加通道上分配可用的传输容量。
而且，可以限制附加通道的带宽，例如，限制到2kHz。
根据本发明的典型兼容解码装置示于图9中。本发明的解码装置2类似于图7的现有技术解码装置2’，除了单元26和27，使用附加残留通道Ls、Rs和Cs和可选择使用又一残留通道e0。
如图9中所示，图9的解码装置2包含三个加权单元(图2中的29)，每个加权单元包含解相关单元23、衰减单元26和组合单元27。这些加权单元的每个接收各个残留信号Ls、Rs和Cs，和各个参数组PS1、PS2和PS3。每个包含解相关单元23、被控衰减单元26和组合单元27的加权单元29，通过提供合成残留信号和被传输残留信号的加权，允许解码信号lf、lr、...、le明显改进的质量。
能够理解，解码装置2不仅能够解码已被图8编码装置1编码的信号，而且能够结合其它产生残留信号的编码装置。换句话说，对于这些残留信号不需要用如图1中所阐明的装置10来加权，尽管这种加权将是有优势的。因此解码装置2能够解码已被现有技术编码装置例如图6的现有技术编码装置编码的信号。
可以设想根据本发明的解码装置2的实施例，其中省略衰减单元26，并且将解相关形式的通道L、R和C直接馈送到组合单元27。在这些实施例中，它们仍然在本发明的范围内，与图7中所示的现有技术解码器2’相比，使用附加残留通道Ls、Rs和Cs仍将带来改进的信号质量。但是，通过提供衰减单元26，附加残留通道Ls、Rs和Cs构成更好的应用。
可选择的又一残留通道e0可以使用在2-3单元22中，作为第三通道，由此提供三个而不是两个输入通道。当例如通过调整残留通道C0的预测值从(变换的)输入通道L0、R0和参数组PS4中导出信号L、R和C时，这改进了信号质量。
现有技术6-1编码装置1’示于图10中。这个编码装置包含三个分割与变换单元11、五个2-1单元12、13a和13b、以及逆变换与重叠相加单元14。当与图6的现有技术编码装置1’相比时，可以看到第一阶段(单元11和12)是相同的，但图6的3-2单元13已被两个2-1单元13a和13b所替代，这两个单元一起产生单一信号M和两个参数组PS4和PS5。该单一(变换域)信号M被逆变换，并优选地也经受重叠相加操作，以产生单一音频输出(时间)信号m，该信号可以被存储和/或被传输。
相应的现有技术1-6解码装置示于图11中。使用五个上混合(upmix)(M)单元22a、22b和24，图11的解码装置2’将单一音频输入(时间)信号m解码成六个音频输出(时间)信号。与图7的现有技术2-6解码装置相比，可以看到2-3(上混合)单元22已被上混合单元22a和22b替代，每个上混合单元接收各个参数组PS5、PS4，以将单个输入信号m转换成三个中间信号L、R和C。
图10的现有技术编码装置1’可以依据本发明被修改来形成图12的本发明的6-1编码装置1。在图12的仅仅是示范性的实施例中，已增加选择与衰减(S&A)单元15、16a和16b来产生附加残留通道Ls、Rs、Cs、LRs和Ms。因此，图12的编码装置1产生除了输出信号m之外的五个参数组PS1...PS5和五个残留通道Ls、Rs、Cs、LRs和Ms，这些残留通道优选地被加权。
如上面已经指示的，选择与衰减单元15可以被省略，由此提供没有被加权的附加通道Ls、Rs和Cs。在一些实施例中，选择与衰减单元16a和16b可以被省略。但是，优选的是所有的S&A单元15、16a和16b是存在的，如在图12中所阐明的。
例如当传输容量不够时，从五个可用的残留通道中选择残留通道是可能的。在那种情况下，优选的是选择和传输最接近于编码装置1的输出端即最接近于变换单元14的残留通道。这些残留通道是被用于相应的解码装置中并因此具有对解码处理和解码信号质量的最大影响的第一通道。在图12的例子中，将首先选择由2-1单元13b产生的残留通道Ms，然后选择由2-1单元13a产生的残留通道LRs。只有当更多传输容量是可用时，残留通道Ls、Rs和/或Cs会被选择。
兼容1-6解码器在图13中被阐明。在图13的仅仅是示范性的实施例中，使用五个参数组PS1...PS5和五个残留通道Ms、LRs、Ls、Rs、Cs，单一音频输入(时间)通道m被转换成六个音频输出(时间)通道。使用如图2中所阐明的装置20处理每个残留通道，每个装置包含解相关单元23(或23a/b)、衰减单元26(或26a/b)、组合单元27和上混合单元22a、22b或24。衰减单元和组合单元允许残留通道控制合成残留通道的振幅，并提供接收残留通道和合成残留通道的适当混合。因此，在所示的例子中每个转换单元被布置来接收相应的第二信号。但是，这不是必须的，只有选择数目的转换单元24可以被布置来接收第二信号，例如只有转换单元22a和22b。
本发明基于这样的理解，即，当编码时残留信号可以被细分为至少三种感觉相关、较低相关和不相关，以及残留信号可以被相应地衰减。本发明受益于进一步的理解，即，当解码时，解码残留信号可以被用来控制合成残留信号的衰减，从而产生重建的残留信号。
本发明可以被用在涉及音频编码的任何应用中，诸如因特网无线电、因特网流、电子音乐分配(EMD)、固态(例如MP3或AAC)音频播放器、用户音频系统、专业音频系统等。
应该注意的是，在本文献中使用的任何术语都不应该解释为用来限制本发明的范围。特别地，单词“包含”不意味着排除没有专门规定的任何元件。单(电路)元件可以用多级(电路)元件或以它们的等价物来代替。
那些本领域技术人员将会理解，本发明不限于上面阐明的实施例，并且可以进行许多修改和添加，而不偏离如在所附权利要求中所限定的本发明的范围。
权利要求
1.一种编码装置(1)，用于将第一数量(M)的输入音频通道转换成第二数量(N)的输出音频通道，其中该第一数量(M)大于该第二数量(N)，该装置包含至少两个转换单元(12)，每一个用于将第一信号(Lf；Rf；Co)和第二信号(Lr；Rr；Le)转换成第三信号(L；R；C)和第四信号(Ls；Rs；Cs)，该第三信号包含该第一和第二信号的大部分信号能量，第四信号包含所述信号能量的剩余部分，该编码装置被布置用于使用该第三信号(L；R；C)产生输出信号，其中该编码装置被进一步配置用于输出第四信号(Ls；Rs；Cs)。
2.根据权利要求1所述的编码装置，进一步包含用于选择输出第四信号的时间段的选择单元(15，16a，16b)。
3.根据权利要求2所述的编码装置，其中该选择单元(15，16a，16b)被进一步布置为，基本上通过第四信号的感觉相关部分，衰减该第四信号的感觉较低相关部分，抑制该第四信号的最低相关部分。
4.根据权利要求1所述的编码装置，包含至少三个并联布置的转换单元(12)，每个转换单元被与各个用于产生转换时间段的分割与变换单元(11)耦合，该装置进一步包含用于产生输出时间信号(m；l0，r0)的逆变换与重叠相加单元(14)。
5.根据权利要求1所述的编码装置，包含至少两个级联的转换单元(12，13a，13b)，其中选择最接近于该编码装置输出端的转换单元(13b)以输出它的第四信号(Ms)，其它转换单元(12)的该第四信号被丢弃。
6.一种解码装置，用于将第一数量(N)的输入音频通道转换成第二数量(M)的输出音频通道，其中该第一数量(N)小于该第二数量(M)，该装置包含至少两个转换单元(24)，该转换单元(24)用于将第一信号(L；R；C)和第二信号(Ld；Rd；Ld)转换成第三信号(Lf；Rf；Co)和第四信号(Lr；Rr；Le)，该第一信号包含该第三和第四信号的大部分信号能量，该第二信号包含所述信号能量的剩余部分，该装置进一步包含至少一个解相关单元(23a，23b，23)，用于解相关第一信号以便产生合成第二信号，该解码装置被进一步布置用于接收至少一个附加第二信号(Ls；Rs；Cs)。
7.根据权利要求6所述的解码装置，其中每个转换单元(24)被布置用于接收相应的第二信号。
8.根据权利要求6所述的解码装置，进一步包含至少一个由接收的第二信号控制的衰减单元(26，26a，26b)，用于衰减相应的合成第二信号。
9.根据权利要求8所述的解码装置，进一步包含至少一个组合单元(27)，用于组合合成的第二信号和接收的第二信号，以便在该转换单元中使用该产生的组合信号。
10.根据权利要求6所述的解码装置，包含三个并联布置的转换单元(24)。
11.根据权利要求6所述的解码装置，进一步包含至少一个分割与变换单元(21)、至少两个逆变换与重叠相加单元(25)。
12.一种音频系统，包含根据权利要求1所述的编码装置(1)。
13.一种音频系统，包含根据权利要求6所述的解码装置(2)。
14.一种将第一数量(M)的输入音频通道转换成第二数量(N)的输出音频通道的方法，其中该第一数量(M)大于该第二数量(N)，该方法包含将第一信号(Lf；Rf；Co)和第二信号(Lr；Rr；Le)转换成第三信号(L；R；C)和第四信号(Ls；Rs；Cs)的至少两步骤，该第三信号包含该第一和第二信号的大部分信号能量，该第四信号包含所述信号能量的剩余部分，该方法还包含使用该第三信号(L；R；C)产生输出信号的步骤，该方法包含输出第四信号(Ls；Rs；Cs)的又一步骤。
15.根据权利要求14所述的方法，包含至少两个级联的转换步骤，其中在该级联下游的转换步骤的第四信号(Ms)被传输，其它转换步骤的该第四信号被丢弃。
16.一种将第一数量(N)的输入音频通道转换成第二数量(M)的输出音频通道的方法，其中该第一数量(N)小于该第二数量(M)，该方法包含将第一信号(L；R；C)和第二信号(Ld；Rd；Ld)转换成第三信号(Lf；Rf；Co)和第四信号(Lr；Rr；Le)的至少两步骤，该第一信号包含该第三和第四信号的大部分信号能量，该第二信号包含所述信号能量的剩余部分，该方法还包含从该第一信号(L；R；C)导出该第二信号(Ld；Rd；Cd)的步骤，该方法包含接收附加第二信号(Ls；Rs；Cs)的又一步骤。
17.根据权利要求16所述的方法，包含解相关第一信号以便产生合成的第二信号的又一步骤。
18.根据权利要求17所述的方法，包含衰减该合成的第二信号的又一步骤，所述步骤由相应的接收第二信号控制。
19.根据权利要求18所述的方法，包含组合该合成的第二信号和该接收的第二信号以及在该转换步骤中使用该组合信号的又一步骤。
20.一种计算机程序产品，用于执行根据权利要求14或16所述的方法。
全文摘要
一种编码装置(1)，用于将第一数量(M)的输入音频通道转换成第二、较小数量(N)的输出音频通道，包含至少一个转换单元(12)，用于将第一信号(Lf；Rf；Co)和第二信号(Lr；Rr；Le)转换成第三信号(L；R；C)和第四信号(Ls；Rs；Cs)。该第三、支配信号包含该第一和第二信号的大部分信号能量，而第四、残留信号包含所述信号能量的剩余部分。该编码装置被布置用于使用该第三信号(L；R；C)产生输出信号，和用于输出该第四信号(Ls；Rs；Cs)。一种解码装置(2)，用于将第一数量(N)的输入音频通道转换成第二、较大数量(M)的输出音频通道，包含至少一个转换单元(24)，用于将第一信号(L；R；C)和第二信号(Ld；Rd；Ld)转换成第三信号(Lf；Rf；Co)和第四信号(Lr；Rr；Le)。该第一、支配信号包含该第三和第四信号的大部分信号能量，而该第二、残留信号包含所述信号能量的剩余部分。该编码装置被布置用于接收至少一个第二信号(Ld；Rd；Cd)。
文档编号G10L19/008GK101053017SQ200580037909
公开日2007年10月10日申请日期2005年10月31日优先权日2004年11月4日
发明者G·H·霍索, F·P·迈堡, D·J·布里巴特申请人:皇家飞利浦电子股份有限公司

本文推荐多通道音频信号的编码和解码的制作方法仅代表作者观点，不代表本网站立场。本站对作者上传的所有内容将尽可能审核来源及出处，但对内容不作任何保证或承诺。请读者仅作参考并自行核实其真实性及合法性。如您发现图文视频内容来源标注有误或侵犯了您的权益请告知，本站将及时予以修改或删除。未经允许不得转载：http://www.pinpai35.com/1656438215.html

当前位置：网站首页>专利 >正文

多通道音频信号的编码和解码的制作方法

相关推荐