当前位置:网站首页>专利 >正文

音频信号解相关器的制作方法

专利名称:音频信号解相关器的制作方法
技术领域
本发明一般地涉及音频信号解相关器、多声道音频信号处理器、 五声道音频信号处理器、用于从输入音频信号导出输出音频信号的方
法以及计算机程序。具体地,本发明的目的是用于声学回声消除(AEC) 的收敛增强。
背景技术
在电信和其他应用环境中,发射声音的扬声器与同时有效地从相 同的声学环境中拾取(pickup)声音的麦克风之间的声学串扰问题是 众所周知的。作为一种解决方案,过去己经提出了声学回声消除(AEC) 技术,该技术用于单声道的重现("单声道AEC")以及双声道的重现 ("立体声AEC")。
对于单声道AEC,参考以下出版物,本申请的附录中包括了其详 细列表[Hae92]、 [Bre99]、 [Kel84]。对于立体声AEC,参考以下出 版物[Shi95]、 [Gae00]、 [Buc01]、 [Sug01]。
图9示出了 AEC应用的总体图。图9描述了一种典型的立体声 AEC场景。图9的系统其整体被标记为900。通过两个麦克风920、 922拾取来自发送室910的声源(例如扬声器912)。扬声器912发送 的声音与两个麦克风920、 922接收的声音之间的关系由传递函数 g,(k)、 g2(k)来描述。换言之,例如,传递函数g,(k)、 g2(k)受发送室 910的声学特性(例如反射)的影响,并受扬声器912与两个麦克风 920、 922之间的距离的影响。麦克风信号x,(k)、 xp(k)被传送至接收室 930,并通过两个扬声器932、 934来重现。
同时,设置接收室930中的麦克风940以拾取来自出现在接收室中的另一个用户942的话音。第一扬声器932发射的声音信号与麦克 风940耦合,其中,使用h《k)来标记第一扬声器932与话筒940之间 的传递特性。同样,第二扬声器934产生的声学信号与麦克风940耦 合,其中,使用hp(k)来标记第二扬声器934与话筒940之间的传递特 性。
为了防止从两个扬声器932、934发射的声音耦合入输出麦克风信 号(例如,由远端收听者,例如人和/或机器回送的信号),AEC 950 试图通过从输出信号(例如从麦克风940的麦克风信号y(k))中减去 输入信号x,(k)、 Xp(k)的滤波版本,以从输出信号e(k)中消除输入信号
X,(k)、 Xp(k)的任何贡献。
换言之,使用滤波器函数&(k)来对接收的信号x,(k)进行滤波,并 从麦克风信号y(k)中减去滤波的结果。同样,使用滤波器函数;(k)来 对信号xp(k)进行滤波。从麦克风信号y(k)中还减去该滤波的结果,使 得通过从麦克风信号y(k)中减去信号x,(k)、 xp(k)的滤波版本来获得校 正的麦克风信号e(k)。从输出信号e(k)中消除(或至少减少)输入信
号X,(k)、 Xp(k)的贡献一般需要使用自适应算法动态调节消除滤波器
952、 954,以实现最小误差信号e(k),从而实现最优的消除。
已经知道,当自适应的消除滤波器952、 954是发射扬声器932、 934和麦克风940之间的传递特性的精确模型(传递函数hp(k)、 h,(k) 或冲击响应)时,正是如此。
AEC的两个重要应用领域是免提电话(其中远端收听者是位于该 电话的远程端的另一个人)或用于自动语音识别(ASR)的麦克风信 号增强。在后一种情况下,目的是从麦克风信号中移除在室内重现的 其他声音的影响,以使自动语音识别器的操作具有较低的识别误差率。 作为一个示例,可以从话音命令模块的输入中移除HiFi设置的音乐, 以允许所说出的用户命令进行特定功能的可靠控制。
进一步表明,对于立体声AEC的情况,存在一种所谓的"非唯一 性问题"[Son95]:如果两个扬声器信号强相关,则自适应滤波器一般 地收敛至方案(;(k),纟《k)),该方案不能对扬声器932、 934与麦克风 940之间的传递函数hp(k)、 h,(k)进行正确建模,而是仅对给定的特定扬声器信号优化了回声消除。由此,扬声器信号X《k)、 Xp(k)的特性的 改变(例如由于发送室910中的声源912的几何位置的改变)导致了 回声消除性能的下降,并需要对消除滤波器进行新的自适应。
作为该非唯一性问题的解决方案,已经提出了各种技术,以在接
收室930中重现来自发送室910的信号之前,对其进行预处理,以对 其"解相关",并按照这种方式来避免之前所讨论的不定性。
对这样的预处理方案的要求概括如下
*收敛增强预处理必须能够有效地对输入信号进行解相关,以 确保即使对高度相关/单声道(输入)信号也能进行快速而正
确的AEC滤波器收敛。
*主观声音质量由于经预处理的信号随后通过扬声器来重现,
并由接收室930中的用户942来收听,因此,预处理必须不对 所使用的音频信号类型引入任何令人反感的人工效应。例如, 音频信号类型对于免提电信应用可以是仅有语音,或对于 ASR输入增强可以使用包括音乐的任何类型的音频素材。 *实现复杂度为了在不昂贵的消费设备中实现经济的预处理的
使用,希望非常低的计算和存储器复杂度。 预处理技术的另一个区别特性是推广至多声道操作的能力,即处 理多于两个的重现音频声道的能力。
以下描述用于声学回声消除(AEC)的现有技术的预处理概念。 第一种用于立体声AEC的简单预处理方法由Benesty等人提出 (参考[Ben98]、 [MorOl]),该方法通过向信号加入非线性失真来实现 信号的解相关。例如,使用半程整流(halfway rectification)、全程整 流(full-way rectification)或通过形成平方根来创建该非线性失真。
图IO示出了通过非线性预处理的示意框图和传递函数。图10的 图形表示其整体被标记为1000。第一图形表示1010示出了使用半程 整流单元1020、 1022的预处理单元的示意框图。换言之,图10示意
了在半程整流的通常情况下的信号X,(k)、 X2(k)的解相关。
第二图形表示1050描述了输入信号A、 X2与输出信号xr、 &,之 间的传递特性。橫坐标1060描述了输入值xp x2。纵坐标1062描述
15了输出值xr、 X2,。第一曲线107o包括在&、 xr坐标系统的原点上的
尖锐弯曲,反映了输入至^与对应的输出值X,'之间的关系。第二曲 线1072包括在X2、 X2,坐标系统的原点上的尖锐弯曲,描述了输入信 号X2与对应的输出值X 之间的传递特性。
换言之,图IO示出了在半程整流的通常情况下,向输入信号xp
X2加入非线性失真,以形成输出信号Xr、 X2'。
虽然所描述的方案(加入非线性失真的方案)具有极其低的复杂 度,但是,依赖于所处理的音频信号的类型,引入的失真产物可能变 得容易听见和令人反感。典型地,对于语音或通信应用,声音质量的 退化被认为是可接受的,而对于音乐信号的高质量应用则是不可接受 的。
第二种现有技术方法包括向信号(例如向两个输入信号X" X2)
加入不相关的噪声。在[Gae98]中,通过信号的感知音频编码/解码实 现了这一点,该方法将不相关的量化失真引入每个信号,使得由于在 根据心理声学模型的感知音频编码器内执行的噪声整形将其掩蔽。为 了将不相关的噪声引入两个声道,不得使用联合立体声编码。
通过使用在感知上控制的水印方案,例如基于扩频调制(参照 [Neu98]),可以实现类似的效果。在这种情况下,将不相关的扩频数 据信号替代量化噪声来嵌入原始信号中。
对于上述两种方法,对任意类型的音频信号,清楚的心理声学模 型与分解/合成滤波器组的结合使用能够防止可听见的失真。然而,相 关的实现复杂度和引入的延迟致使该方法在经济上对多数应用没有吸 引力。
第三种公开的AEC预处理方法是对两个输入信号使用互补梳状 滤波,该方法抑制了信号中的互补频谱部分,并按照这种方式破坏了 其间的相关性(参照[Beb98])。然而,这种类型的预处理一般地导致 人类收听者感知到的立体声图像的不可接受的退化,这使得所述处理 不适合高质量的应用。
另一种其他方法采用能够开启和关闭的时变延时或滤波(参照 [Sug98]、 [Sug99]),或时变的全通滤波(参照[AU05])来产生立体声AEC的两个信号之间的时变的相移/信号延迟,从而对两个信号进行 "解相关"。
US 6,700,977 B2和US 6,577,731 Bl (也标记为[Sug98]和[Sug99])
描述了预处理系统,在该系统中,输出信号在原始信号及其时延/滤波 版本之间切换。其一个缺点是,该切换过程可能将不希望的人工效应 引入音频信号中。
US 6,895,093 Bl (也标记为[Ali05])描述了一种预处理系统,其 中,在其可变的全通滤波器变量中随机地调制全通预处理器。
与其他方法相比,尽管这些类型的预处理在其对音频信号的效果 上总体而言并不明显,但是难以在保证引入左右声道之间的(变化的) 时间/相位差不导致所感知的立体声图像的感知偏移/改变的同时,实 现最大解相关。

发明内容
因此,本发明的目的是创建一种对两个音频信号进行解相关的概 念,允许在限制计算复杂度的同时,最小化所感知的立体声图像的改 变。
这个目的是通过根据权利要求1所述的音频信号解相关器、根据 权利要求15所述的多声道信号处理器、根据权利要求22所述的音频 信号处理器、根据权利要求27、 28或29所述的方法或根据权利要求 30所述的计算机程序来实现的。
本发明创建了一种用于从输入音频信号导出输出音频信号的音频 信号解相关器。所述音频信号解相关器包括频率分解器,用于从所述 输入音频信号中提取第一部分信号和第二部分信号,所述第一部分信 号描述第一音频频率范围中的音频内容,所述第二部分信号描述第二 音频频率范围中的音频内容。与所述第二音频频率范围相比,所述第 一音频频率范围具有更高的频率。
所述音频信号解相关器还包括部分信号修改器,用于修改所述第 一部分信号,以获得第一已处理部分信号,并用于修改所述第二部分 信号,以获得第二已处理部分信号,使得应用至所述第一部分信号的
17时变相移或时变延迟的调制幅度比应用至所述第二部分信号的时变相 移或时变延迟的调制幅度更高,或用于仅(时变地)修改所述第一部 分信号,使得将时变相移或时变延迟应用至所述第一部分信号。所述 音频信号解相关器还包括信号组合器,用于将所述第一己处理部分信 号和所述第二己处理部分信号组合,或用于将所述第一己处理部分信 号与所述第二部分信号组合,以获得输出音频信号。
本发明的音频信号解相关器允许对音频信号进行适于人类听觉感 知的解相关,其在于执行音频信号的解相关,使得相对于输入音频信 号的收听印象,输出音频信号的收听印象不严重退化。此外,当与具 有类似性能的其他音频信号解相关器相比时,本发明的音频信号解相 关器包括较低的计算复杂度。
本发明的关键思想在于,由于已经发现,与较高频率的音频频率 范围相比,人类的听觉感知对较低频率的音频频率范围中的相移更加 敏感,因此,将较大的延迟调制或相移调制引入第一音频频率范围是 有利的,与仅包括较低频率的第二音频频率范围相比,该第一音频频 率范围包括较高的频率。
本发明的另一个关键发现在于,可以通过以下方式来实现适于人 类听觉的音频信号解相关分解输入音频信号,以从输入音频信号中 提取至少第一部分信号和第二部分信号,并对第一部分信号和第二部 分信号应用不同的时变延迟或相移调制。
应注意,在本申请中,使用"两个" 一词来表示"至少两个"的 意思。此外,使用"多声道" 一词来表示立体声信号(或双声道信号) 或包括多于两个声道的信号。
在第一种实现中,将第一时变相移或第一时变延迟应用至第一部 分信号,将第二时变相移或第二时变延迟应用至第二部分信号,其中, 所述第一时变相移或时变延迟的最大调制幅度大于所述第二相移或延 迟的调制幅度。由此,所述第一部分信号包括比所述第二部分信号更 大的时变相移或延迟的调制幅度,这反映在通过组合所述第一部分信 号和所述第二部分信号而形成的输出音频信号中。因此,与第二频率 范围相比,所述输出音频信号在第一频率范围中包括更大的时变相移的幅度。相应地,由于在第一音频频率范围(包括比第二音频频率范 围更高的频率)中,人类感知对相位变化比在第二音频频率范围(其 中假定第二音频频率范围包括比第一音频频率范围更低的频率)中更 不敏感,因此输出音频信号呈现出最大解相关影响,而不超过人类听 觉感知的阈值。因此,由于将时变相移或时变延迟应用至表示输入音 频信号的不同音频频率范围中的音频内容的多个部分信号,因此本发 明允许对时变相移或时变延迟进行依赖于频率(或频率范围选择性) 的调节。
在第二实施例中,仅将时变相移或时变延迟应用至第一部分信号, 而第二部分信号仅经历时不变处理(或完全不处理)。按照这种方式, 与第二音频频率范围相比,实现了在第一音频频率范围中引入更大的 时变相移或时变延迟(其中,在第二音频范围中不引入时变相移或时 变延迟)。如果第二音频频率范围包括低于特定频率阈值(例如400Hz 或lkHz数量级)的频率,则该实施例尤为有利,其中,己经发现, 对于这样特别低的频率,相移的引入对人类听觉感知具有尤为强烈的 影响。
换言之,与第二音频频率范围相比,本发明允许选择性地将更大 的时变相移或时变延迟应用至第一音频频率范围,从而允许根据人类 听觉感知,还根据实现最大解相关的要求,将时变相移或时变延迟的 幅度设定为频率的函数。
通过允许依赖于频率的时变相移或时变延迟的幅度,可以充分利 用感知上可容许的时变相移或时变延迟的潜力。相应地,在设计本发 明的音频信号解相关器时,可以容易地考虑人类对相位差的敏感度严 重依赖于频率这一事实,该敏感度在低频时非常高,并随着频率增大
而逐渐减小,直至在约4kHz以上的频率完全消失。
在优选实施例中,所述频率分解器包括分解滤波器组,所述分解 滤波器组适于将输入音频信号分解为至少两个频谱系数,第一频谱系 数描述所述第一音频频率范围中的音频内容,所述第一频谱系数形成 所述第一部分信号,第二频谱系数描述所述第二音频频率范围中的音 频内容,所述第二频谱系数形成所述第二部分信号。所述部分信号修
19改器适于时变地修改至少所述第一频谱系数,以获得所述第一已处理 部分信号。可选地,所述部分信号修改器适于时变地修改所述第一频 谱系数的相位,以获得所述第一已处理部分信号,并时变地修改所述 第二频谱系数的相位,以获得所述第二已处理部分信号。
所述信号组合器包括合成滤波器组,所述合成滤波器组适于对已 处理的第一部分信号和第二部分信号进行转换(和/或组合),以获得 作为时域信号的输出音频信号,或对已处理的第一部分信号和己处理 的第二部分信号进行转换(和/或组合),以获得作为时域信号的输出 音频信号。
换言之,在优选实施例中,将输入音频信号分解为包括至少第一 频谱系数和第二频谱系数的频域表示,所述第一频谱系数和第二频谱 系数描述了不同的音频频率范围。因此,该频谱系数描述了第一音频 频率范围中和第二音频频率范围中的音频信号内容的幅度和相位。因 此,不同的频谱系数构成了用于引入时变相移的尤为适合的中间量。 仅通过修改频谱系数,可以引入任意的相移,而不需要提供可调节的 延迟操作(对于在时域中实现相移可能是必需的)。
在另一个优选实施例中,所述频率分解器适于提供作为复值的频 谱系数。在这种情况下,所述部分信号修改器适于通过将所述第一频 谱系数乘以(或除以)具有预定的、相同的时不变幅度和时变相位的 第一多个时变复值中的复值,来时变地修改所述第一频谱系数的相位。 换言之,通过使用复值(即复值的频谱系数)来表示不同音频频率范 围中的音频信号内容,仅通过执行乘法或除法运算,就可以实现时变 相移的引入。因此,所需的硬件或软件代价尤为低。
在另一个优选实施例中,所述音频信号解相关器包括调制函数产 生器,所述调制函数产生器产生时变的调制函数。在这种情况下,所 述音频信号解相关器适于从所述调制函数在不同时刻的值中导出所述 第一多个时变复值中的复值的时变相位。因此,所述调制函数确定了 被引入第一音频频率范围的时变相移。
在另一个优选实施例中,所述调制函数产生器适于产生平滑的调 制函数。由于己经发现,被引入第一部分信号或第二部分信号的相移
20的突然改变将导致可听见的人工效应(例如强烈的频率调制或可听见 的滴答声),因此这是尤为有利的。
在另一个优选实施例中,所述部分信号修改器适于通过将所述第 二频谱系数乘以(或除以)具有预定的、相同的时不变幅度和时变相 位的第二多个时变复值,来时变地修改所述第二部分信号的相位。优 选地,所述音频信号解相关器适于从所述调制函数在不同时刻的值中 导出所述第二多个时变复值中的复值的时变相位。换言之,优选地, 通过相同的调制函数来确定第一频谱系数的相位的时间变化和第二频 谱系数的相位的时间变化。
此外,如之前所讨论的,第一频谱系数的时变相位变化应大于第 二音频系数的相位的时间变化。因此,与应用至第一频谱系数的相移 (或相移值相比),典型地,以不同的方式从调制函数中导出应用至第 二频谱系数(或第一频谱系数)的时变相移(或相移值)。
因此,在优选实施例中,所述音频信号解相关器包括縮放器,所 述縮放器适于使用第一时不变縮放值来对周期性调制函数(其是时间 的函数,因此也被标记为"时间函数")进行縮放,以获得第一多个时 变复值中的复值的时变相位。此外,所述縮放器适于使用第二时不变 缩放值来对周期性调制(时间)函数进行縮放,以获得第二多个时变 复值中的复值的时变相位。优选地,第一缩放值的绝对值或幅度大于 第二縮放值的绝对值或幅度,使得应用至第一部分信号的相移大于应 用至第二部分信号的相移。因此,仅通过使用第一縮放值和第二縮放 值对调制时间函数的值进行縮放(或相乘),可以以有效的方式实现各 自(第一部分信号和第二部分信号)的时变相移。由此,被引入第一 音频频率范围的相移与被引入第二音频频率范围的相移成正比(但更 大)。这导致了输出音频信号的尤为好的感知印象,还导致了尤为有效 的实现结构。
本发明还包括一种多声道音频信号处理器,用于对第一声道音频 信号和第二声道音频信号进行解相关,以获得两个解相关的音频信号。 所述多声道音频信号处理器包括如上所述的第一音频信号解相关器。 所述第一音频信号解相关器适于接收所述第一声道音频信号作为其输入音频信号。如果所述第一声道音频信号和所述第二声道音频信号包 括在第一音频频率范围内和第二音频频率范围内的时间恒定或逐渐减 小的相移,则所述多声道音频信号处理器和所述第一音频信号解相关 器适于使得所述第一音频信号解相关器的输出音频信号和所述第二声 道音频信号(或从所述第二声道音频信号中导出的信号)的第一音频 频率范围中的音频内容与所述第一音频信号解相关器的输出音频信号 和所述第二声道音频信号(或从所述第二声道音频信号中导出的信号) 的第二音频频率范围中的音频内容相比,具有更大的时变相移调制。
换言之,本发明的多声道音频信号处理器(例如可以是立体声音 频信号处理器)包括本发明的音频信号解相关器,因此允许在不同的 频带中(例如在第一音频频率范围和第二音频频率范围中)频率选择 性地引入时变相移调制。此外,为了适于人类听觉感知,所述多声道 音频信号处理器适于使得在第一音频频率范围中的所述多声道音频信 号处理器的输出信号之间的时变相移或延迟的调制幅度大于在第二音 频频率范围中的所述多声道音频信号处理器的输出信号之间的时变相 移或延迟的调制幅度。
因此,通过将第一声道音频信号(也可能和第二声道音频信号) 分解为多个音频频率范围,实现了频率选择性处理,该处理允许将多 声道音频信号处理器的两个输出信号之间的相移调节为在第一音频频 率范围中比在第二音频频率范围中更大。
因此,例如,多声道音频信号处理器允许立体声信号(包括第一 声道音频信号和第二声道音频信号)的解相关,使得被引入两个立体 声声道之间的时间或相位偏移的调制幅度对较高频率比对较低频率更 大。由于将立体声信号中的至少一个(例如第一声道音频信号)分离 为不同的音频频率范围,不同音频频率范围中的相移幅度的灵活调节 成为可能,可以实现多声道音频信号处理器的有效实现。
在另一个优选实施例中,所述多声道音频信号处理器包括第二音 频信号解相关器,所述第二音频信号解相关器接收所述第二声道音频 信号并输出第二解相关的音频信号。因此,所述第一音频信号解相关 器处理所述第一声道音频信号来获得第一解相关的输出音频信号,所处理所述第二声道音频信号来获得第二解相
关的输出音频信号。第一音频信号解相关器和第二音频信号解相关器
对第一声道音频信号和第二声道音频信号并行操作,其中,假定第一
声道音频信号和第二声道音频信号在第一音频频率范围和第二音频频
率范围中表现出时间恒定或逐渐减小的相移(例如,如果第一声道音
频信号和第二声道音频信号相同),则可以确保第一解相关的输出音频 信号与第二解相关的输出音频信号的第一音频频率范围中的音频内容
之间的时变相移的调制幅度大于第一解相关的输出音频信号与第二解 相关的输出音频信号的第二音频频率范围中的音频内容之间的时变相 移的调制幅度。换言之,本发明的多声道信号处理器确保了两个声道 中较高频率音频内容之间的时变相移的调制幅度大于两个声道中较低 频率音频内容之间的时变相移的调制幅度。
在另一个优选实施例中,所述第一音频信号解相关器适于基于第 一相移值来调节其第一音频频率范围中的时变延迟或时变相移,并适 于基于第二相移值来调节其第二音频频率范围中的时变延迟或时变相 移。所述第二音频信号解相关器适于基于第三相移值来调节其第一音 频频率范围中的时变延迟或时变相移,并适于基于第四相移值来调节 其第二音频频率范围中的时变延迟或时变相移。所述多声道信号处理 器还包括縮放器,所述缩放器适于从公共调制时间函数中通过縮放调 制时间函数来导出所述第一相移值、所述第二相移值、所述第三相移 值和所述第四相移值。换言之,在优选实施例中,从一个公共的调制 时间函数来导出被引入两个音频信号解相关器的时变延迟或时变相 移。因此,可以实现将时间上协调或对称(或反对称)的相移引入多 声道音频信号处理器的两个声道,产生尤为良好平衡的或对称(或反 对称)的输出信号。在两个音频声道之间,对不同频率范围的相位变 化进行同步。这是尤为重要的,由于相位变化可以被感知为信号的频 率调制。然而,在两个音频信号声道(例如左立体声声道和右立体声 声道)中不相同的不协调频率调制可能导致尤为强烈可感的失真。此 外,由于人类感知对频率关系尤为敏感,因此在单音频声道中的不同 音频频率范围中的不协调频率调制也可能导致很容易听见的人工效应。因此,由单个调制时间函数来协调的不同音频频带中的同步的相 移是避免可听见人工效应的重要措施。
本发明还包括一种音频会议系统。所述音频会议系统包括用于接 收第一声道音频信号和第二声道音频信号的音频输入。所述音频会议 系统还包括如上所述的多声道信号处理器。此外,所述音频会议系统 包括第一电声换能器,用于输出所述第一音频信号解相关器的输出音 频信号;第二电声换能器,用于输出所述第二音频信号或由其导出的
信号;以及麦克风,与所述第一电声换能器和所述第二电声换能器声
学耦合,所述麦克风提供描述所接收的声学信号的麦克风信号。所述 音频会议系统还包括回声消除单元,用于从所述麦克风信号中减小或 移除所述第一电声换能器输出的音频内容,并用于从所述麦克风信号 中减小或移除所述第二电声换能器输出的音频内容。所述回声消除单 元适于基于所述麦克风信号、所述第一电声换能器输出的信号以及所 述第二电声换能器输出的信号的比较来调节回声消除参数。
根据本发明,声学消除单元以尤为好的消除特性来操作,这是由 于使用了本发明的多声道音频信号处理器,从而第一电声换能器输出 的第一解相关的输出音频信号和第二电声换能器输出的第二解相关的 输出音频信号包括尤为好的解相关特性。此外,由于本发明的音频会 议系统使用本发明的多声道音频信号处理器,因此,第一电声换能器 和第二电声换能器输出的音频信号不包含由解相关过程引起的较强的 可听见的人工效应。同样,由于在本发明的多声道音频信号处理器中 以频率选择性的方式引入相移,因此,较低音频频率范围中的相移(或 相移的调制幅度)小于较高音频频率范围中的相移(或相移的调制幅 度)。因此,尽管第一解相关的输出音频信号与第二解相关的输出音频 信号进行了解相关,但是第一电声换能器和第二电声换能器输出的信 号的立体声感知没有可听见的退化。因此,感知第一电声换能器和第 二电声换能器产生的信号的用户不会受到被引入信号的相移的严重影 响,这是由于它们是以适于人类听觉感知的方式来引入的。此外,本 发明的音频会议系统包括尤为简单的结构,这是由于认识到与提供相 当性能的其他方案相比,可以以相对低的代价来实现本发明的多声道信号处理器。
本发明还包括一种用于从输入音频信号中导出输出音频信号的方 法。所述方法包括从所述输入音频信号中提取第一部分信号和第二 部分信号,所述第一部分信号描述第一音频频率范围中的音频内容, 所述第二部分信号描述第二音频频率范围中的音频内容。与所述第二 音频频率范围相比,所述第一音频频率范围包括更高的频率。所述方 法还包括修改所述第一部分信号,以获得第一已处理部分信号,并 修改所述第二部分信号,以获得第二已处理部分信号,使得将时变相 移或时变延迟的调制幅度应用至所述第一部分信号,所述调制幅度比 应用至所述第二部分信号的时变相移或时变延迟的调制幅度更高。本 发明的方法还包括将所述第一 已处理部分信号和所述第二已处理部分 信号组合。
可选地,本发明的方法包括仅修改所述第一部分信号,使得将时 变相移或时变延迟应用至所述第一部分信号。所述方法还包括将所述 第一已处理部分信号与所述第二部分信号组合,以获得输出音频信号。 本发明的方法包括与本发明的设备相同的特征和优点。
本发明包括一种对第一声道音频信号和第二声道音频信号进行解 相关,以获得两个解相关的输出音频信号的方法。所述方法包括从 所述第一声道音频信号中导出第一解相关的信号,使得如果所述第一 声道音频信号和第二声道音频信号包括在第一音频频率范围内和第二 音频频率范围内的时间恒定或逐渐减小的相移,则所述第一解相关的 输出音频信号和第二声道音频信号(或从所述第二声道音频信号中导 出的信号)的第一音频频率范围中的音频内容与所述第一解相关的输 出音频信号和所述第二声道音频信号(或从所述第二声道音频信号中 导出的信号)的第二音频频率范围中的音频内容相比,具有更大的时 变相移调制。
此外,本发明包括一种计算机程序,当所述计算机程序在计算机 上运行时,用于执行本发明的方法。


25随后将参照附图来描述本发明的优选实施例,附图中 图1示出了根据本发明的第一实施例的本发明的音频信号解相关 器的示意框图2示出了根据本发明的第二实施例的本发明的多声道音频信号 处理器的示意框图3示出了根据本发明的第三实施例的本发明的音频信号解相关 器的示意框图4示出了根据本发明的第四实施例的本发明的多声道音频信号 处理器的示意框图5示出了根据本发明的第五实施例的本发明的多声道音频信号 处理器的示意框图6示出了根据本发明的第六实施例的本发明的五声道音频信号 处理器的示意框图7示出了根据本发明的第七实施例的本发明的音频会议系统的 示意框图8a示出了各种用于环绕声音的处理方法的主观声音质量的图 形表示;
图8b示出了根据本发明的第八实施例的本发明的用于对输入音 频信号进行解相关的方法的流程图9示出了现有技术的音频会议系统的示意框图;以及 图IO示出了使用非线性的预处理方法的图形表示。
具体实施例方式
图l示出了根据本发明的第一实施例的本发明的音频信号解相关
器的示意框图。图i的音频信号解相关器其整体被标记为ioo。音频信
号解相关器100包括接收输入音频信号112的频率分解器(frequency analyzer) 110。频率分解器110对输入音频信号112进行分解,并产生 第一部分信号120和第二部分信号122。第一部分信号120描述第一音频 频率范围中的音频内容,并且第二部分信号122描述第二音频频率范围 中的音频内容。
26与第二音频频率范围相比,第一音频频率范围包括更高的频率。
例如,第一音频频率范围和第二音频频率范围可以是约10Hz至30kHz
的音频频率范围内的相邻频率范围。
例如,第一音频频率范围可以覆盖第一频率&和第二频率f2之间的 音频频率。第二音频频率范围还可以覆盖第三频率f3和第四频率f4之间 的音频频率。这里,&表示第一音频频率范围的频率下界,其中,优
选地,第一音频频率范围的频率下界被选为大于或等于l.lkHz。甚至 更优选地,第一音频频率范围的频率下界被选为大于2kHz。在另一个 优选实施例中,第一音频频率范围的频率下界大于4kHz。换言之,频 率下界f,典型地被选为使得第一音频频率范围不包括低于l.lkHz (或 低于2kHz)的低频率范围,在该低频率范围中,人类对相移尤为敏感。 例如,第一音频频率范围和第二音频频率范围可以重叠。在这种
情况下,第一频率f,小于第二频率f2,第三频率f3小于第四频率f4。此 外,第三频率f3小于第一频率fp且第四频率f4位于第一频率f,和第二
频率f2之间。图1中的使用130来标记的图形表示示出了各自的频率范
围配置。
可选地,第一音频频率范围和第二音频频率范围可以是相邻的频
率范围。第一音频频率范围在第一频率&和第二频率f2之间延伸,并且 第二音频频率范围在第三频率f3和第四频率f4之间延伸。在相邻音频频 率范围的情况下,第一频率&小于第二频率f2,并且第三频率f3小于第 四频率f4。此外,第四频率f4与第一频率f,相同,如图1的图形表示132 所示。
可选地,第一音频频率范围和第二音频频率范围可以不相邻,如
图1的图形表示134所示。对于不相邻音频频率范围的情况,频率关系
与相邻音频频率范围的情况类似,其差别在于,第四频率f4小于第一 频率f,。
音频信号解相关器100还包括部分信号修改器140,用于修改第一 部分信号120以获得第一已处理部分信号150,并修改第二部分信号122 以获得第二已处理部分信号152,使得应用至第一部分信号120的时变 相移或时变延迟的调制幅度大于应用至第二部分信号122的时变相移或时变延迟的调制幅度。换言之,部分信号修改器140适于对第一部分 信号120应用比对第二部分信号122所应用的更大的时变相移(或相移
调制)或时变延迟(或延迟调制)。因此,当与第二音频频率范围的频
率相比时,第一音频频率范围的频率受到在部分信号修改器140中所引
入的时变相移(或相移调制)或延迟(或延迟调制)的影响更强。可
以分离地调节应用至不同部分信号120、 122的相移或延迟的幅度或调 制幅度。
还应注意,部分信号修改器140分离地或独立地处理第一部分信 号120和第二部分信号122,使得在部分信号修改器140中,第一部分信 号120的信号值与第二已处理部分信号152的信号值隔离(或对其没有 影响),并使得第二部分信号122的信号值与第一已处理部分信号150 的信号值隔离(或对其没有影响)。换言之,部分信号修改器140适于 对输入音频信号的两个不同表示,即对第一部分信号120和第二部分信 号122独立地应用时变相移(或时变相移调制)或时变延迟(或延迟调 制)。
音频信号解相关器100还包括信号组合器160。信号组合器160接 收第一已处理部分信号150和第二已处理部分信号152,并适于将第一 己处理部分信号150与第二已处理部分信号152组合来形成输出音频信 号170。
因此,在向第一部分信号120和第二部分信号122分离地引入时变
相移或时变延迟(或时变相移调制,或时变延迟调制)之后,对第一 己处理部分信号150和第二已处理部分信号152进行重新结合或组合来 形成输出音频信号170。
在可选实施例中,部分信号修改器适于仅对第一部分信号120操 作,并适于不对第二部分信号122引入时变相移或时变延迟(或时变相 移调制,或时变延迟调制)。在这种情况下,第二已处理部分信号152 可以与第二部分信号122相同,或可以与第二部分信号122的区别(仅)
在于时不变相移或时不变延迟。在这种情况下,典型地,信号组合器 160适于将第一已处理部分信号150(当与第一部分信号120相比时,其
还包括时变相移或时变延迟或时变相移调制或时变延迟调制)或与第
28二部分信号122组合,或与从第二部分信号122导出而未引入时变相移 或延迟或相移调制或延迟调制的信号(例如通过时不变延迟或滤波操 作)组合。
图2示出了根据本发明的第二实施例的多声道音频信号处理器的 示意框图。图2的多声道音频信号处理器其整体被标记为200。音频信 号处理器200接收多声道音频信号,例如两声道音频信号。例如,多声 道音频信号处理器200接收第一声道音频信号210和第二声道音频信号 212。多声道音频信号处理器200还包括第一音频信号解相关器220。例 如,第一音频信号解相关器220与参照图1描述的音频信号解相关器100 相同。
第一音频信号解相关器220在其输出处提供了第一解相关的输出 音频信号230。多声道音频信号处理器200还在输出处提供了第二解相 关的输出音频信号232,其中,第二解相关的输出音频信号232或与第 二声道音频信号212相同,或由第二声道音频信号导出。
如果第一声道音频信号210和第二声道音频信号212包括在第一
音频频率范围内和第二音频频率范围内的时间恒定或逐渐减小的相移 (相比之下),则多声道音频信号处理器200还适于使得第一解相关的 输出音频信号230与第二解相关的输出音频信号232的第一音频频率范 围(如上定义)中的音频内容包括与第一解相关的输出音频信号和第 二解相关的输出音频信号的第二音频频率范围(如上定义)中的音频 内容相比更大的时变相移(或时变延迟)的调制幅度。
换言之,多声道音频信号处理器适于使得在第一音频频率范围中 引入比第二音频频率范围中更大的时变相移或延迟。换言之,被引入
第一音频频率范围的时变相移的调制幅度比被引入第二音频频率范围 的相移更大。这是通过合适地设置多声道音频信号处理器200中的第一
音频信号解相关器220和可选的另外的处理装置来实现的。
可选地,多声道音频信号处理器200包括第二音频信号解相关器,
其接收第二声道音频信号并输出第二解相关的输出音频信号232。
可选地,第一音频信号解相关器220和第二音频信号解相关器250
耦合至时间同步,使得被引入第一声道音频信号210和被引入第二声道
29音频信号212的时变相移和时变延迟在时间上协调。
图3示出了根据本发明的第三实施例的本发明的音频信号解相关
器的示意框图。图3的音频信号解相关器其整体被标记为300。音频信 号解相关器300接收输入音频信号310。分解滤波器组(analysis filterbank) 312接收输入音频信号310并提供至少两个(优选地多于两 个)部分信号314、 316、 318。部分信号314、 316、 318描述了输入音 频信号310的不同音频频率范围中的音频内容,其中,如参照图l所描 述的,音频频率范围可以重叠、相邻或分离。分解滤波器组312将音频 信号310分为覆盖不同(但可能重叠)的音频频率范围的多个部分信号。 例如,部分信号314、 316、 318可以包括从输入音频信号310的不同音 频频率范围提取的带通时间信号。可选地,部分信号314、 316、 318 也可以包括描述输入音频信号310的频谱组成的频谱系数或频谱系数 系列。
例如,分解滤波器组312可以适于提供部分信号314、 316、 318, 其中,单个部分信号是基于在给定音频频率范围中的输入音频信号的 变换(例如离散傅立叶变换)。因此,不同的部分信号包括针对不同频 率范围的相应信息。同样,分解滤波器组312可以适于将输入音频信号 310分为时间段(或时间帧、或时隙),并提供针对多个时间段的频谱 系数的集合(一个频谱系数集合与一个时间段相对应)。在这种情况下, 部分信号314、 316、 318中的每一个包括针对后续时间间隔或时间段的 频谱系数序列。
换言之,第一部分信号312可以包括以下序列针对第一频率范 围的第一频谱系数、针对第一时间间隔的第一频谱系数、针对第一频 率范围且针对第二时间间隔的第二频谱系数、以及针对第一频率范围 且针对第三时间间隔的第三频谱系数。类似地,第二部分信号316可以 包括以下序列针对第一时间间隔中的第二音频频率范围的第一频谱 系数、针对第二时间间隔中的第二音频频率范围的第二频谱系数、以 及针对第三时间间隔中的第二音频频率范围的第三频谱系数。
音频信号解相关器300还包括相位修改单元330,其适于接收部分 信号314、 316、 318。相位修改单元330包括三个独立的部分信号修改器332、 334、 336。第一部分信号修改器332接收第一部分信号314和第 一相移值^。第一部分信号修改器适于通过对第一部分信号应用时变
相移(或时变延迟)来产生第一已处理部分信号342,该相移的幅度由 第一相移值^来定义。第二部分信号修改器334通过对第二部分信号
316应用由第二相移值^所描述的时变相移(或时变延迟)来产生第
二己处理部分信号344。第三部分信号修改器336通过对第三部分信号 318应用由第三相移值^所描述的时变相移(或时变延迟)来产生第
三己处理部分信号346。因此,第一部分信号修改器332、第二部分信 号修改器334和第三部分信号修改器336适于独立地处理第一部分信号 314、第二部分信号316和第三部分信号318,以获得第一已处理部分信 号342、第二已处理部分信号344和第三已处理部分信号346。
音频信号解相关器300还包括合成滤波器组350,用于将第一已处 理部分信号342、第二已处理部分信号344和第三已处理部分信号346 组合为单个输出音频信号352。例如,在这些已处理信号是时间信号的 情况下,该合成滤波器组适于通过第一己处理部分信号342、第二已处 理部分信号344和第三已处理部分信号346的线性组合来获得输出音频 信号352。然而,如果这些己处理部分信号是例如频谱系数序列,则合 成滤波器组350适于基于该频谱系数序列,将输出音频信号352合成为
时间信号(例如通过应用反离散傅立叶逆变换)。
音频信号解相关器300还包括调制函数产生器360。在所示的实施 例中,调制函数产生器360产生取时变值的3个调制函数(也称为调制
时间函数)。第一调制时间函数362提供(或表示,或确定)第一相移 值^,第二调制时间函数364提供(或表示,或确定)第二相移值^,
以及第三调制时间函数366提供(或表示,或确定)第三相移值^。
调制时间函数362、 364、 366可以互相独立,或可以同步。优选地,被 引入第一部分信号314的相移调制幅度或延迟调制幅度大于被引入第 二部分信号316的相移调制幅度或延迟调制幅度。此外,优选地,被引 入第二部分信号316的相移调制幅度或延迟调制幅度大于被引入第三 部分信号318的相移调制幅度或延迟调制幅度。
在优选实施例中,三个调制时间函数362、 364、 366互相成正比,并都是通过縮放从单个调制函数导出的。
图4示出了根据本发明的第四实施例的多声道音频信号处理器的 示意框图。图4的多声道音频信号处理器其整体被标记为400。多声道
音频信号处理器400接收第一声道音频信号410和第二声道音频信号 412。例如,第一声道音频信号表示立体声音频信号的左声道,以及第 二声道音频信号表示立体声音频信号的右声道。多声道音频信号处理 器包括第一支路420,用于处理第一声道音频信号,以基于第一声道(输 入)音频信号410来提供第一解相关的输出音频信号420;以及第二支 路424,用于基于第二声道(输入)音频信号412来提供第二解相关的 输出音频信号426。第一支路420包括第一分解滤波器组430,其与参照 图3描述的分解滤波器组类似。第一分解滤波器组430接收第一声道输 入音频信号410,并基于第一声道输入音频信号410来产生第一部分信 号432。这里应注意,在图4中,为了简单,仅示出了分解滤波器组430 的一个输出信号。然而,应注意,分解滤波器组430可以输出多个(两 个或优选地多于两个)部分信号。
优选地,第一部分信号432包括优选地为复值的频谱系数序列。 在乘法器434中,将第一部分信号432与复值相移值(或复值相移值的 时间序列)436相乘,复值相移值436由调制函数产生器438产生,其幅 度优选为l。相乘的结果,即乘法器434的输出信号形成了已处理部分 信号440,并将其输入合成滤波器组442。典型地,已处理部分信号440
是频谱系数的时间序列。
应注意,典型地,合成滤波器组442接收多个(两个或优选地多 于两个)已处理或未处理的部分信号。因此,合成滤波器组442适于将 已处理部分信号440与图4中未示出的附加的已处理或未处理部分信号 组合,以形成第一解相关的输出音频信号422。
第二支路424包括第二分解滤波器组450。第二分解滤波器组接收 第二声道输入音频信号412作为输入信号。基于此,第二分解滤波器组 450产生第二部分信号452。与第一分解滤波器组430类似,第二分解滤 波器组450可以产生另外的部分信号(图4中为了简单而未示出)。除法 器454接收第二部分信号452和复值相移值436。除法器454适于将第二部分信号452除以相移值436来产生第二已处理部分信号460。第二合成 滤波器组462接收第二已处理部分信号460,将第二已处理部分信号460
与附加的已处理或未处理部分信号组合来产生第二解相关器的输出音 频信号426。第二合成滤波器组462的功能与第一合成滤波器组442的功
能相当。
此外,应注意,优选地,第一分解滤波器组430和第二分解滤波 器组450相同。同样,在优选实施例中,第一合成滤波器组442与第二 合成滤波器组462具有相同的结构和参数。
以下描述图4的多声道音频信号处理器400的功能。首先应注意, 如果第一声道输入音频信号410和第二声道输入音频信号412已被解相 关,则第一解相关的输出音频信号422与第二解相关的输出音频信号 426自动被解相关。
然而,以下将分析第一声道输入音频信号和第二声道输入音频信 号410、 412相同的情况。假定分解滤波器组430、 450相同,使得在第 一部分信号432和第二部分信号452描述了相同音频频率范围中的音频 内容的情况下,第一部分信号432和第二部分信号452也相同。进一步
假定由针对所考虑的音频频率范围(例如第一音频频率范围)的频谱 系数序列来表示第一部分信号432和第二部分信号452,其中,假定分
解滤波器组430、450将第一声道输入音频信号410和第二声道输入音频 信号412分解至离散(和/或可能重叠)的时间间隔中。每个时间间隔 中的第一频率范围内的音频信号内容由对应的频谱系数来描述。换言 之,乘法器434和除法器452每个都接收时间上离散的频谱系数序列, 即形成第一部分信号432的第一频谱系数序列和形成第二部分信号452
的第二频谱系数序列。
此外,根据上述假设,第一频谱系数序列与第二频谱系数序列相 同。乘法器434也接收复值Zi (或时变复值436的时间系列),该复值zt 是根据以下等式从相移值p导出的
Zl= 一
在上述等式中,e表示复指数函数,j表示虚数单位,即-l的平方根。换言之,(复值)乘法器434适于将频谱系数与幅度为l的复值Zj 相乘。由此,沿逆时针方向将各自频谱系数的相位改变了角度^。
相反,复值除法器452接收频谱系数,并将其除以值z,(或除以复 值436的时间系列)。按照这种方式,沿顺时针方向将各自频谱系数的 相位旋转角度p。
换言之,己处理部分信号440是复值频谱系数的系列,其相位相 对于第一部分信号432的值沿逆时针方向旋转。相反,当与第二部分信 号452的值相比时,第二己处理部分信号460的值的相位沿顺时针方向 旋转角度p。换言之,当与第二部分信号中的相对应的频谱系数相比 时,对于给定的时间间隔,第一部分信号432中的频谱系数的相位以相 反的方向旋转。优选地,对于给定的时间间隔,第一部分信号和第二 部分信号中的频谱系数的相位旋转的绝对值相同。
以下以等式的方式来描述相关的关系。在以下的描述中,Pbi(k) 表示在由索引k表示的时间位置的、第i音频频率范围的第一声道或左 声道(左声道由固定索引l表示)的部分值(例如频谱系数)。Pr,i(k)表 示在由索弓lk表示的时间位置的、第i音频频率范围的第二声道或右声 道(右声道由固定索引r表示)的部分值(例如频谱系数)。^i(k)表示 针对由索引i表示的音频频率范围的、在由索弓lk表示的时间位置的相
移值。Zi(k)描述了具有相位^(k)的幅度为l的复值。
根据上述定义,以下等式成立 PuW-p^kVexpCJ^OO);以及
Pr,i,(k)"r,i(k)-exp(,i(k))。
Pu'(k)是在由索弓lk表示的时间位置的、第一声道(左声道)和第 i音频频率范围的第一已处理部分信号440的已处理频谱系数。pr,i'(k) 是在由索弓lk表示的时间位置的、第二声道(右声道)和第i音频频率 范围的第二己处理部分信号460的已处理频谱系数。
索引i覆盖了要处理的任何音频频率范围,并小于或等于分解滤波 器组430、 450和合成滤波器组442、 462所使用的频率范围的数目(其 中>=1成立)。
还应注意,^i(k)是由调制函数产生器438针对要处理的每个音频频率范围i产生的时变相移参数。
还应注意,例如,分解滤波器组430适于针对具有索引k的每个时 间间隔来提供I个部分信号值Pu(k),pJk),i- 1, ...,I的集合。换言之, 分解滤波器组430、 450适于将第一声道输入音频信号410 (或第二声道 输入音频信号412)的时间间隔变换为I个频谱系数的集合,该频谱系 数描述了针对I个不同(重叠或不重叠)的音频频率范围的第一声道输 入音频信号410 (或第二声道输入音频信号412)的音频内容。
类似地,合成滤波器组442、 462适于基于对应的已处理频谱系数 Pl,i,(k)(或p^(k)), i-l,...,I,产生至少特定时间间隔中的第一解相 关的输出音频信号422 (或第二解相关的输出音频信号426)。然而,如 果需要,这些合成滤波器组可以具有无限或非因果的响应。
换言之,合成滤波器组442、 462是这样的设备,其接收给定时间 间隔的多个(I个)频谱系数,并由此产生时域信号(即第一解相关的 输出音频信号422或第二解相关的输出音频信号426)。
图5示出了根据本发明的第五实施例的本发明的多声道音频信号 处理器的另一个示意框图。图5的音频信号处理器其整体被标记为500。 由于图5的多声道音频信号处理器500与图4的多声道音频信号处理器 400类似,因此在图4和5中,使用相同的参考标号来标记相同的装置和 信号。此外,如果使用图5中的多个等效单元来替换图4所示的单个单 元,则在参考标号中加入字母(a、 b、 c……),以区分相同组件的不 同实例。
应注意,对于第一声道,在对应的乘法器434a中,将第一频谱系 数Pu(k)与第一相移值zu(k)相乘,以形成已处理的频谱系数pu,(k)。在 第二乘法器434b中,将第二频谱系数pw(k)与第二相移值zu(k)相乘, 以获得第二已处理的频谱系数P"(k)。在第三乘法器434c中,将第I频 谱系数Pu(k)与第三相移值zw(k)相乘,以获得第I已处理的频谱系数 P',!,(k)。
此外,对第二声道音频输入信号412执行模拟运算来形成第二解 相关的输出音频信号426。以等式表示为 p,,i,(k"p,'i(k)-z,,i(k),i-l,…,1
35Pr,i,(k) = pr,i(k). zr,i(k), i = 1,…,I z"k)= ,'(" ,i=l,...,I
zr,i,(k)= ,i = l,...,I
ai,i(k) = a0(k) . q,i ,i=l,...,I ar,i(k) = a0(k) cr,i ,i=l,...,I
换言之,从由调制(时间)函数产生器提供的单个依赖于时间的 角度值a。中导出所有相移值z,,i(k)、 z,i(k)。角度值a。确定了相移角度, 并被应用至左声道410和右声道412两者的不同部分信号(针对不同的 音频频率范围)。然而,根据优选实施例,优选地,如此选择频带(或 音频频率范围)i的相移幅度参数c,,i、 c,i,使得应用至具有比给定的第 二音频频率范围更高的频率的第一音频频率范围的相移的幅度大于或 等于被引入该给定的第二音频频率范围的相移。换言之,在优选实施 例中,以下等式成立-
在上述等式中,假定与具有频率索引i-k的部分信号相对应的音频 频率范围包括比与具有频率索引i-k+l的部分信号相对应的音频频率 范围更高的频率。
在优选实施例中,当与给定的音频频率范围m相对应的频谱系数 Pu'(k)、 p^,(k)之间的时变相移相比时,与给定的音频频率范围j相对 应的己处理频谱系数Pu'(k)、 p,j'(k)包括更大的时变相移,其中,给定 的音频频率范围j包括比给定的音频频率范围m更高的频率。
以等式表示为
|c/,a _cf,*| ^ |c/,"i -c/vt+ij ,k - 1,…,I-l.
在优选实施例中,被引入给定音频频率范围的相移或延迟在第一 声道音频信号的处理和第二声道音频信号的处理中包括相同的幅度和
相反的相位。参照图5,与描述第一声道音频输入信号410的第i音频频 率范围的音频内容的频谱系数Pu相乘的值是与描述第二声道音频输入信号412的相同音频频率范围i的音频内容的频谱系数p,i(k)相乘的
值的复共轭。
以等式表示为
cl,i= 一 Cr,j , 1=1,…,I
此外,这里应注意,假定常数 、C,i优选地为实值。
还应注意,可以以不同的方式来产生相移值Z,,i(k)、 Zr,i(k)。同样,
可以应用简化,例如以产生复共轭值。此外,从数学可以知道,与幅 度为l的复值相乘可以由除以其复共轭来替代。
图6示出了本发明的五声道音频信号处理器的示意框图。图6的五 声道音频信号处理器其整体被标记为600。五声道音频信号处理器600 接收第一声道输入音频信号610、第二声道输入音频信号612、第三声 道输入音频信号614、第四声道输入音频信号616以及第五声道输入音 频信号618。五声道音频信号处理器600包括第一双声道音频信号处理 器620,其结构与图2、 4和5的音频信号处理器200、 400、 500的结构相 同。此外,五声道音频信号处理器600包括第二双声道音频信号处理器 630,其结构与图2、 4和5的双声道音频信号处理器200、 400、 500的结 构相同。此外,五声道音频信号处理器600包括音频信号解相关器640, 其结构与图1和3的音频信号解相关器100、 300的结构相同。
第一双声道音频信号处理器620接收第一声道输入音频信号610 和第二声道输入音频信号612。在优选实施例中,第一声道输入音频信 号610与五声道杜比环绕音频信号的左前置声道(或左前置扬声器)的 音频信号相同。在优选实施例中,第二声道输入音频信号612与五声道 杜比环绕音频信号的右前置声道(或右前置扬声器)的音频信号相同。 第二双声道音频信号处理器630接收第三声道输入音频信号614和第四
声道输入音频信号616作为其输入信号。在优选实施例中,第三声道输 入音频信号614与五声道杜比环绕音频信号的左后置声道(或左后置扬 声器)的音频信号相同,并且在优选实施例中,第四声道输入音频信 号616与五声道杜比环绕音频信号的右后置声道(或右后置扬声器)的 音频信号相同。音频信号解相关器640接收第五声道输入音频信号618 作为其输入,在优选实施例中,第五声道输入音频信号618与五声道杜
37比环绕音频信号的中心声道(或中心扬声器)的音频信号相同。
在优选实施例中,第一双声道音频信号处理器620的第一解相关 的输出音频信号用作杜比环绕系统中的左前置扬声器音频信号。在优
选实施例中,第一双声道音频信号处理器620的第二解相关的输出音频 信号用作右前置扬声器音频信号。在优选实施例中,第二双声道音频 信号处理器630的第一解相关的输出音频信号用作左后置扬声器音频 信号。在优选实施例中,第二双声道音频信号处理器的第二解相关的 输出音频信号用作右后置扬声器音频信号。在优选实施例中,音频信 号解相关器的解相关的音频输出信号用作中心扬声器的音频信号。
虽然双声道音频信号处理器620、 630的结构相同,但是,音频信 号处理器620、 630以不同的参数来操作,以获得充分的总体解相关。 图5的多声道音频信号处理器500中描述过,从单个时变调制函数,即 从时变角度oc()(k)(其中k是时间离散或时间连续的时间参数)导出应 用至所有部分信号的相移。典型地,该时变调制函数oco(k)是具有重复 频率f的重复时间函数。然而,在双声道音频信号处理器620、 630中, 应用了具有不同频率的相关函数产生器660、 662。换言之,在第一双 声道音频信号处理器620中,被引入部分信号的相移是周期性的,其频 率为fp^。在第二双声道音频信号处理器中,被引入部分信号的相移
是周期性的,其频率为第二频率f^,2。此外,第一频率fp^与第二频率 fpe,2不同。此外,在音频信号解相关器640中,被引入部分信号的相移
是周期性的,其频率为第三频率fper,3。第三频率fper,3与第一频率fpeU不 同,也与第二频率fper,2不同。可选地或附加地,第一双声道音频信号
处理器620、第二音频信号处理器640和音频信号解相关器630中被引入
部分信号的相移的时间函数的形状(或波形)可以不同。例如,调制 信号产生器660可以产生正弦波形,其中,在不同时刻该正弦波形的值 确定了在对应时刻被引入部分信号的相移。相反,调制信号产生器622 可以产生三角波形。应注意,可以通过添加另外的声道来扩展图6的五 声道音频信号处理器。例如,通过添加另一对声道,可以创建7声道音 频信号处理器,例如,可以由附加的双声道音频信号处理器来处理该 附加的声道对。图7示出了本发明的音频会议系统的示意框图。图7的音频会议系 统其整体被标记为700。这里应注意,在图7中,使用相同的参考标号 来标记已经关于图9的现有技术的音频会议系统900描述过的那些特 征,并在此不再对其进行解释。与图9的音频会议系统900相比,音频 会议系统700还包括双声道音频信号处理器710。音频信号处理器710 与图2、 4和5的音频信号处理器200、 400、 500相同,并接收第一麦克 风信号x(k)作为第一输入信号,接收第二麦克风信号Xp(k)作为第二输 入信号。例如,双声道音频信号处理器710的第一输入与图4的音频信 号处理器400的第一声道音频信号输入410相同,双声道音频信号处理 器710的第二音频信号输入与的音频信号处理器400的第二声道音频信 号输入412相同。音频停号处理器710输出信号x「(k)作为第一输出音频 信号(或作为第一解相关的输出音频信号)。双声道音频信号处理器710
还输出信号Xp,(k)作为第二输出音频信号(或作为第二解相关的输出音
频信号)。例如,双声道音频信号处理器710的第一音频信号输出与音 频信号处理器400的第一解相关的音频信号输出422相同,双声道音频 信号处理器710的第二音频信号输出与音频信号处理器400的第二解相 关的音频信号输出426相同。
此外,从音频信号x,(k)解相关的音频信号x「(k)由扬声器932输出, 并进一步馈送入信道估计器954。此外,从音频信号xp(k)解相关的音 频信号Xp'(k)由扬声器934输出,并进一步馈送入信道估计器952。
由于音频信号处理器710的功能,即使麦克风信号x,(k)、 Xp(k)强相 关或相同,也可以将音频信号x,'(k)、 Xp'(k)解相关。由于这个原因, 即使在麦克风信号x,(k)、 Xp(k)相同的情况下,信道估计器952、 954也 可以独立地估计扬声器932、934与麦克风940之间的各自的信道传递函 数hp(k)、 h,(k)。因此, 一旦信道估计器952、 954收敛,可以独立于麦 克风信号x,(k)、 Xp(k),以足够的精度来估计两个信道传递函数hp(k)、
¥k)。
此外,可选地,音频会议系统700可以具有相关检测器,该相关 检测器确定麦克风信号x,(k)、 Xp(k)是否相关。如果两个麦克风信号之 间的相关性超过预定阈值,则该相关检测器可以激活音频信号处理器710,而只要麦克风信号X,(k)、 Xp(k)之间的相关性低于该预定阈值,则
去激活音频信号处理器710。因此,当麦克风信号x,(k)、 Xp(k)本身已经 充分解相关时,扬声器932、 934输出最优的未处理的音频信号。仅当 音频信号Xm(k)、 Xp(k)强相关时,才激活在音频信号中引入一些失真的 音频信号处理器710。因此,仅当需要对麦克风信号x,(k)、 Xp(k)进行解 相关时,才激活音频信号处理器710。
以下将总结本发明的思想。应注意,根据现有技术的方法,难以 实现(至少两个音频声道之间的)最大解相关,同时又保证在左声道 和右声道之间引入变化的时间/相位差不会导致所感知的立体声图像 中被感知到的偏移和/或改变。这有若干方面的原因
耳间的相位差和/或时间差是声阶(sound stage,参见例如 [Bla97])的主观感知的相关感知参数,并已经广泛地用于立体声 图像的合成(参见例如[Bau03]和[Fal03]中描述的耳间时间差 IDT)。由此,由于所引入的时间差和/或相位差出现在通过扬声器 重现的音频信号中,因此仅当其保持低于感知阈值时,才可以避 免所感知的立体声图像的改变。
如果预处理引入的时间差和/或相位差正好在感知阈值上,即应 用可容许的(时间或相位)改变的最大量,则可以实现最优的AEC 收敛增强。
如从心理声学和声学中所知道的那样,对相位差的敏感度在低 频上非常高,并随着频率增大而逐渐降低,直到在约4kHz以上的 频率完全消失。
*时间延迟调制或时变全通滤波都不能提供将时间偏移和/或相 位偏移的量裁剪为频率的函数的灵活性,以使得感知上容许的改 变被完全利用。
基于上述理解,开发出了本发明的音频信号解相关多声道处理的 概念。以下将描述本发明的新方法。这里应注意,所提出的方法的目 的是提供AEC收敛增强的良好的相关性以及所感知的立体声图像的最 小改变。
用于AEC处理(包括在多声道音频信号处理中对两个音频信号进
40行解相关)的收敛增强的新概念是基于以下考虑
*音频信号的相位的时变调制是在不需要计算复杂度很高的掩蔽 模型的情况下产生针对人类收听者的最小感知失真的一种有效方 法。
为了在不以令人不悦地方式超过人类听觉感知阈值的情况下实
现最大解相关影响,考虑人类对相位差的感知敏感度是很重要的,
该敏感度在低频时最高,并随着频率增大而降低。在4kHz以上,
可以认为绝对相位与人类听觉系统实际上不相关。
预处理单元允许通过采用分解滤波器组和合成滤波器组(一般
而言是频率分解器和组合器)对相位调制参数(调制频率、调制
幅度和调制波形)进行频率选择性的选择。
图3示意了音频声道310的预处理的基本方案。换言之,图3示出
了针对单音频声道的基本预处理方案的图形表示。
通过分解滤波器组312,将输入音频信号310分解为频谱系数或子 带信号314、 316、 318。在随后的处理步骤(由部分信号修改器332、 334、 336执行)中基于调制器输入信号(9"^<PO,对频谱系数或子 带信号314、 316、 318的相位进行修改。 一般而言,对每个频谱系数或 子带信号314、 316、 318,可以根据其对应的频率范围来使用不同的调 制器信号^' ^。
作为一个示例,可以不处理属于音频信号的低频部分的频谱系 数,而可以较大地调制与4kHz以上的频率相对应的频谱系数。换言之,
例如,可以不处理表示第三音频频率范围中的音频内容的第三部分信 号318,使得合成滤波器组350接收该未处理的第三部分信号。相反, 可以对第一和第二部分信号314、 316进行处理,即加以时变相移或时 间延迟操作,使得合成滤波器组接收第一已处理部分信号和第二己处 理部分信号。在本示例中,与第一部分信号相对应的第一音频频率范 围包括比与第二部分信号相对应的第二音频频率范围更高的频率,而 第二音频频率范围包括比与第三部分信号相对应的第三音频频率范围 更高的频率。
最终,使用合成滤波器组350,将(至少部分地)修改的频谱系数或子带信号342、 344、 346转换回时域表示352。
术语滤波器组包括已知的滤波器组,如伪QMF滤波器组、多相位 (Polyphase)滤波器组和其他滤波器组,以及己知的变换,如离散傅 立叶变换(DFT)、复数重叠变换和其他变换。为了允许信号相位的简 单修改,优选地对分解滤波器组312和/或对合成滤波器组350采用具有
复值表示的滤波器组类型。在这种情况下,简单的相位修改可以由(部 分信号314、 316、 318中包含的)频谱系数与e^的复数(或复值)成
分组成,其中cp以弧度为单位表示期望的相移。
为了简化调制过程, 一种实际的选择是对所有子带使用相同的调 制波形,但具有不同的縮放(如在低频子带使用低幅度,在高频子带 使用高调制幅度)。换言之,在要进行相位偏移的所有部分信号的调制 中应用相同的调制波形,其中,与具有不那么高频率的音频频率范围 相比,对描述具有较高频率的音频频率范围的部分信号应用较大幅度 的相移(即较大的最大相移)。换言之,高频子带是输入音频信号中包 括比低频子带更高频率的子带。
从通信理论中已知,作为相位调制处理的结果而引入了频率调 制,其中,频率偏移与相位调制的时间导数成正比。因此,为了避免
输出音频信号中的可感知的频率调制,优选地选择平滑的调制函数(如 正弦波),以及不太高的调制频率(例如低于5Hz)。然而,该调制函 数不必需是周期性的,而是可选地也可以是时间的随机函数(参见 [Ali05])。
图4示意了应用于立体声音频信号的两个声道410、 412的示例预 处理系统。换言之,图4示出了针对立体声音频声道对的预处理的示例。 对声道410、 412和所有子带(或部分信号432、 452)使用公共的调制 函数438。为了简化图4的图形表示,图4中省略了对不同频谱子带(或 不同部分信号432、 452)的调制的幅度縮放。为了产生输出信号之间 的时变相位差,图4的示例性电路适于以共轭复数的方式来对声道410、 412应用公共的调制函数。换言之,与被引入右声道信号412的相位偏 移相比,被引入左声道410的相位偏移具有相反的符号。
图6示意了如何将所提出的技术和概念应用为针对多声道音频信号(如流行的五声道环绕声)的AEC收敛增强。换言之,图6示出了对
五声道环绕声的预处理的示例。该环绕设置通常由左前置(L)扬声 器、右前置(R)扬声器、中心(C)扬声器、左环绕(Ls)扬声器以 及右环绕(Rs)扬声器组成。在图6的示例性布置中,使用3个独立的 调制器620、 630、 640,分别用于调制L/R声道对、Ls/Rs声道对和C声 道。换言之,第一调制器或双声道音频信号处理器620对左前置声道610 和右前置声道612进行调制,以获得解相关的左前置声道信号L。ut和解 相关的右前置声道信号R。ut,第二调制器或双声道音频信号处理器630 接收左环绕声道614和右环绕声道616进行调制,并由其导出解相关的 左环绕声道信号Ls。ut和解相关的右环绕声道信号Rs。ut。音频信号解相
关器或调制器640接收中心扬声器信号Cin,并由其导出解相关的中心 "f曰号Cout。
与图4中的布置400类似,以复共轭的方式来执行声道对的调制。 换言之,与相对于右前置声道音频信号612被引入解相关的右前置声道 信号Rout的相移相比,相对于左前置声道信号610被引入解相关的左前 置声道信号L。ut的相移具有相同的幅度和相反的方向。
此外,与相对于右环绕声道音频信号616被引入解相关的右环绕 声道信号Rs。ut的相移相比,相对于左环绕声道音频信号614被引入解相 关的左环绕声道音频信号Ls。ut的相移具有相同的幅度和相反的方向。
三个调制器660、 662、 664 (产生指示第一双声道音频信号处理 其620、第二双声道音频信号处理器630和音频信号解相关器640中的相 移的幅度的信号)的调制频率被选择为使得其不太高,即小于5Hz, 以避免可感知的频率调制。此外,调制频率被选择为使得其不相等, 使得它们提供在不同调制器间"正交"的调制。换言之,调制频率被 选择为使得任何两个调制频率的商不是整数值。
作为一个示例,对于(第一双声道音频信号处理器620中的)L/R 处理,可以使用1.3秒的调制周期,对于(音频信号解相关器640中的) C处理,可以使用3秒的调制周期,对于(第二双声道音频信号处理器 630中的)Ls/Rs处理,可以使用l.l秒的调制周期。再一次,为了简化 图6的绘制,针对不同频谱子带的调制信号的依赖于频率的幅度縮放在
43该图中被省略,但是在实际实现中可以出现。
图8a示意了主观收听测试的结果,该测试针对各种类型的预处理 算法,对经预处理的五声道环绕声素材的声音质量进行评估。换言之, 图8a描述了用于环绕声的各种预处理方法的主观声音质量。针对6 个声音选段(项目"fount"、 "glock"、 "indie"、 "pops"、 "poule"、
"spmg")和所有项目的平均,在从0 (非常低质量)至100 (与原始 声音不可区分)的尺度上对声音质量进行定量。不同的预处理方法是
(仅出于标准化测试方法学的原因而包括的)原始参考及其3.5kHz 限频带版本、由运行在48kbit/s每声道的mp3编码器/解码器对每个单 独声道的编码("mp3 48")、如之前所述的本发明的相位调制方法("相 位")、mp3编码/解码与本发明的相位调制方法的结合("mp3 48相 位")以及现有技术的非线性处理("NL";参见[MorOl])。从图8a的 图形可以看到,在声音质量方面,相位编制方法作为明显的胜者而出 现。此外,它可以与其他预处理方法相结合而不会是声音质量明显进 一步退化。
换言之,从图8a可以看到,使用本发明的概念来处理的信号的主 观收听印象几乎总是被评为优秀(即在80至100的评级单位的范围 中)。因此,使用本发明的方法来处理的信号的主观收听印象几乎与参 考信号所产生的收听印象一样好。相反,使用其他方法来解相关的信 号典型地被评为产生了较差的收听印象。
图8b示出了本发明的用于从输入音频信号中导出输出音频信号 的方法的流程图,所述输出音频信号与所述输入音频信号解相关。图9 的方法其整体被标记为850。方法850包括第一步骤860,从输入音频信
号中提取第一部分信号和第二部分信号。该第一部分信号描述第一音 频频率范围中的音频内容,该第二部分信号描述第二音频频率范围中 的音频内容。与第二音频频率范围相比,第一音频频率范围包括更高 的频率。
第二步骤870包括通过应用第一时变相移或第一时变延迟来对部 分信号进行修改。
第三部分880包括,通过对第二部分信号应用第二时变相移或第二时变延迟来对第二部分信号进行修改。修改第一部分信号,以获得第一已处理部分信号,并修改第二部分信号,以获得第二已处理部分信号,执行所述修改使得应用至第一部分信号的时变相移或时变延迟的调制幅度比应用至所述第二部分信号的时变相移或时变延迟的调制幅度更高。
本发明的方法还包括,在第四步骤890,将第一已处理部分信号
和第二已处理部分信号组合。
可选地,可以省略修改第二部分信号的第三步骤880。在这种情
况下,仅修改第一部分信号,使得将时变相移或时变延迟应用至第一部分信号(而不对第二部分信号应用时间相移或时变延迟)。在这种情况下,步骤940包括将第一已处理部分信号与第二部分信号组合,以获得输出音频信号。
应注意,可以使用本发明的音频信号解相关器所执行的任何步骤或功能来补充本发明的方法。
此外,可以使用本发明的双声道音频信号处理器、多声道音频信号处理器或五声道音频信号处理器所执行的任何功能来补充本发明的方法。
以上概括为,本发明创建了一种用于预处理的方法,包括分解滤波器组和合成滤波器组和对每个音频声道的修改级。根据本发明的一个方面,该修改级仅调制信号相位。根据本发明的另一方面,该滤波器组是复值的。根据本发明的又一方面,对不同的频率区域使用不同的调制函数。
根据本发明的一个方面,提供了一种调制信号,包括在子带频率上縮放的幅度,其中,在较高的频率上引入较多的调制。根据本发明的另一方面,以縮放的方式,在频率间共享相同的调制函数。根据本发明的又一方面,调制信号(或调制函数)是平滑的(例如正弦信号),并不会过快地变化。根据本发明的又一方面,对声道对执行共轭复调制。
根据本发明的方法的特定实现要求,可以以硬件或软件来实现本发明的方法。实现方式可以使用数字存储介质来执行,例如在具有电
45储于其上的盘、DVD、 CD、 ROM、 PROM、EPROM、 EEPROM或闪存存储器,所述控制信号可以与可编程计算机系统协作来执行本发明的方法。 一般地,因此,本发明也在于具有程序代码的计算机程序产品,所述程序代码存储在机器可读载体上,当计算机程序产品在计算机上运行时,所述程序代码被操作为执行本发明的方法。换言之,因此,本发明的方法是具有程序代码的计算机程序,当计算机程序在计算机上运行时,所述程序代码执行本发明的方法。
以上概括为,本发明创建了一种用于对音频信号或多个音频信号进行解相关的概念,该概念允许有效地利用对该变化的人类感知阈值。根据本发明,可以根据频率来引入相移,使得在不同的频率范围中引入适于人类感知阈值的不同幅度的时变相移。此外,本发明的概念包括与资源消耗相关的适度的要求。
参考文献 E. H汪nsler, "The hands-free telephone problem — Anannotated bibliography," Signal Processing, vol. 27, no. 3, pp.259-271, 1992. C. Breining, P. Dreiseitel, E.脂sler, A. Mader, B. Nitsch, H.
Puder, Th. Schertler, G. Schmidt, J. Tilp, "Aucustic echocontrol," IEEE Signal Processing Magazine, vol. 16, no. 4, pp.42-69, Jul, 1999. W. Kellermann, "Kompensation akustischer Echos inFrequenzteilb&idern," in Proc. Aachener Kolloquium, pp.322-325, 1984. T. Gansler and J. Benesty, "Stereophonic acoustic echocancellation and two-channel adaptive filtering: an overview,"Int. Journal of Adaptive Control and Signal Processing, vol.14, pp. 565-586, 2000. H. Buchner and W. Kellermann, "Acoustic echo cancellation
46for two and more reproduction channels", Proc. Int.Workshop on Acoustic Echo and Noise Control, pp. 99-102,Sept. 2001. M. M. Sondhi, D. R. Morgan, and J. L. Hall, "Stereophonicacoustic echo cancellation - An overview of the fundamentalproblem," IEEE Signal Processing Lett., vol. 2, pp. 148-151,Aug. 1995 J. Benesty, D. R. Morgan, and M. M. Sondhi, "A betterunderstanding and an improved solution to the specificproblems of stereophonic acoustic echo cancellation," IEEETrans, Speech Audio Processing, vol. 6, pp. 156-165, Mar.1998 D. R. Morgan, J. L. Hall, and J. Benesty, "Investigation ofSeveral Types of Nonlinearities for Use in Stereo AcousticEcho Cancellation," IEEE Trans. Speeach Audio Processing,vol. 5, no. 6, pp. 686-696, Sept. 2001 T. Gansler and P. Eneroth, "Influence of audio coding onstereophonic acoustic echo Cancellation," Proc. IEEE Int.Conf. On Acoustics, Speech, and Signal Processing, pp.3649-3652, 1998 J. Benesty, D. R. Morgan, J. L. Hall, and M. M. Sondhi,"Stereophonic acoustic echo cancellation using nonlineartransformations and comb filtering," Proc. IEEE Int, Conf.On Acoustic, Speech, and Signal Processing, pp. 3673-3676,1998 美国专利申请US06895093B1, Acoustic Echo-CancellationSystem 美国专利申请US06577731B1, Method and Apparatus of
Cancelling Multi-Channel Echoes[Sug98] 美国专利申请US06700977B2, Method and Apparatus of
Cancellation Multi-Channel Echo[Neu98] C. Neubauer, J. Herre: "Digital Watermarking and Its
Influence on Audio Quality", 105 AES Convention, San
Francisco 1998, Preprint 4823[Bla97] J. Blauert, "Spatial Hearing: The Psychophysics of HumanSound Localization", revised edition, MIT Press, 1997 F. Baumgarte and C. Faller: "Binaural Cue Coding _ Part I:Psychoacoustic fundamentals and design principles," IEEETrans. On Speech and Audio Proc., vol. 11, no. 6, November2003 C. Faller and F. Baumgarte, "Binaural C-ae Coding - Part II:Schemes and applications," IEEE Trans. On Speech andAudio Proc,, vol. 11, no. 6, November 2003 T. Hoya, J. A. Chambers, P. A. Naylor, "Low Complexitys-NLMS Algorithms and Subband Structures forStereophonic Acoustic Echo Cancellation", InternationalWorkshop in Acoustic Echo and Noise Control (IWAENC)1999, Pocono Manor, USA, Conference Proceedings, pp. 36 -39
权利要求
1. 一种音频信号解相关器(100;300),用于从输入音频信号(112;310)导出输出音频信号(170;352),所述音频信号解相关器包括频率分解器(110;312),用于从所述输入音频信号中提取第一部分信号(120;314)和第二部分信号(122;316),所述第一部分信号描述第一音频频率范围中的音频内容,所述第二部分信号描述第二音频频率范围中的音频内容,与所述第二音频频率范围相比,所述第一音频频率范围具有更高的频率;部分信号修改器(140;332、334、336),用于修改所述第一部分信号,以获得第一已处理部分信号(150;342),并用于修改所述第二部分信号,以获得第二已处理部分信号(152;344),使得应用至所述第一部分信号的时变相移或时变延迟的调制幅度比应用至所述第二部分信号的时变相移或时变延迟的调制幅度更高,或用于仅修改所述第一部分信号,使得将时变相移或时变延迟应用至所述第一部分信号;以及信号组合器(160;350),用于将所述第一已处理部分信号和所述第二已处理部分信号组合,或用于将所述第一已处理部分信号与所述第二部分信号组合,以获得输出音频信号(170;352)。
2. 如权利要求l所述的音频信号解相关器,其中,所述频率分解 器(110; 312)包括分解滤波器组,所述分解滤波器组适于将所述输 入音频信号(112; 310)分解为至少两个子带信号(120、 122; 214、 316、 318),第一子带信号描述所述第一音频频率范围中的音频内容, 所述第一子带信号形成所述第一部分信号,第二子带信号描述所述第 二音频频率范围中的音频内容,所述第二子带信号形成所述第二部分 信号;其中,所述部分信号修改器(140; 332、 334、 336)适于对至少 所述第一子带信号的延迟进行调制,以获得所述第一已处理部分信号 (150; 342),或对所述第一子带信号的延迟进行调制,以获得所述第 一己处理部分信号,并对所述第二子带信号的延迟进行调制,以获得所述第二已处理部分信号(152; 344);以及其中,所述信号组合器(160; 350)包括合成滤波器组,所述合成滤波器组适于对己处理的第一部分信号和第二部分信号进行组合,以获得作为时域信号的输出音频信号(170; 352),或对已处理的第一部分信号和已处理的第二部分信号进行组合,以获得作为时域信号的 输出音频信号。
3. 如权利要求1所述的音频信号解相关器(100; 300),其中, 所述频率分解器(110; 312)包括分解滤波器组,所述分解滤波器组 适于将所述输入音频信号(112; 310)分解为至少两个频谱系数,第一频谱系数描述所述第一音频频率范围中的音频内容,所述第一频谱系数形成所述第一部分信号(120; 314),第二频谱系数描述所述第二音频频率范围中的音频内容,所述第二频谱系数形成所述第二部分信号(122; 316);其中,所述部分信号修改器(140; 332、 334、 336)适于对至少 所述第一频谱系数的相位进行调制,以获得所述第一已处理部分信号 (150; 342),或对所述第一频谱系数的相位进行调制,以获得所述第 一已处理部分信号,并对所述第二频谱系数的相位进行调制,以获得 所述第二已处理部分信号(152; 344);以及其中,所述信号组合器(160; 350)包括合成滤波器组,所述合 成滤波器组适于对已处理的第一部分信号和第二部分信号进行组合, 以获得作为时域信号的输出音频信号(170; 352),或对已处理的第一 部分信号和已处理的第二部分信号进行组合,以获得作为时域信号的 输出音频信号。
4. 如权利要求1或3所述的音频信号解相关器,其中,所述频率 分解器(110; 312)适于将所述输入音频信号(112; 310)的时间块 分解为多个频谱系数,使得戶斥述第一部分信号(120; 314)包括第一 频谱系数的时间序列,并使得所述第二部分信号(122; 316)包括第 二频谱系数的时间序列;其中,所述部分信号修改器(140; 332、 334、 336)适于对至少 所述第一部分信号进行处理,以获得所述第一已处理部分信号(150;342)作为已处理的第一频谱系数的时间序列;以及其中,所述合成滤波器组(160; 350)适于将所述第一已处理部分信号的频谱系数的时间序列和所述第二部分信号或所述第二已处理 部分信号的频谱系数的时间序列组合为时域输出音频信号(170:352)。
5. 如权利要求3或4所述的音频信号解相关器,其中,所述频率 分解器(110; 312)适于提供作为复值的频谱系数;其中,所述部分信号修改器(140; 332、 334、 336)适于通过将 所述第一频谱系数乘以或除以具有预定的、相同的时不变幅度和时变 相位的第一多个时变复值(e^1),来时变地调制所述第一频谱系数的 相位。
6. 如权利要求5所述的音频信号解相关器,还包括调制函数产生 器(362、 364、 366),所述调制函数产生器适于产生时变的调制函数((pi, (p2, );其中,所述音频信号解相关器适于从所述调制函数在不同时刻的 值中导出所述第一多个时变复值中的复值的时变相位。
7. 如权利要求6所述的音频信号解相关器,其中,所述调制函数 产生器(362、 364、 366)适于产生时间的正弦函数作为所述调制函数((pi, (P2, q>3 )。
8. 如权利要求6或7所述的音频信号解相关器,其中,所述调制 函数产生器(362、 364、 366)适于按照以下方式来产生所述调制函数 由于所述第一多个时变复值中的复值的时变相位,被引入由所述第一 部分信号(120)所表示的音频内容中的调制频率小于10Hz。
9. 如权利要求6至8之一所述的音频信号解相关器,其中,所述 调制函数产生器(362、 364、 366)适于产生具有小于10Hz的频率的 周期性调制时间函数(W'^T3)。
10. 如权利要求6所述的音频信号解相关器,其中,所述调制函 数产生器(362、 364、 366)适于产生随机或伪随机的时间函数。
11. 如权利要求6至IO之一所述的音频信号解相关器,其中,所 述部分信号修改器(140; 332、 334、 336)适于通过将所述第二频谱 系数乘以或除以具有预定的、相同的时不变幅度和时变相位的第二多个时变复值,来调制所述第二部分信号(122; 360)的频谱系数的相 位;以及其中,所述音频信号解相关器适于从所述调制函数(9i'^'90 在不同时刻的值中导出所述第二多个时变复值中的复值的时变相位。
12. 如权利要求ll所述的音频信号解相关器,还包括縮放器,所 述缩放器适于使用第一时不变缩放值来对调制时间函数进行缩放,以 获得所述第一多个时变复值中的复值的时变相位,并适于使用第二时 不变縮放值来对调制时间函数进行缩放,以获得第二多个时变复值中 的复值的时变相位;其中,所述第一缩放值的绝对值或幅度大于所述第二縮放值的绝 对值或幅度,使得应用至所述第一部分信号(120; 314)的相移调制 幅度大于应用至所述第二部分信号(122; 316)的相移调制幅度。
13. 如权利要求1至12之一所述的音频信号解相关器,其中,所 述频率分解器(110; 312)适于从所述输入音频信号(310)中提取第 三部分信号(318),所述第三部分信号描述第三音频频率范围中的音 频内容,其中,与所述第二音频频率范围相比,所述第一音频频率范 围具有更高的频率,与所述第三音频频率范围相比,所述第二音频频 率范围具有更高的频率;其中,所述部分信号修改器(332、 334、 336)适于修改所述第一 部分信号(314),以获得第一已处理部分信号(342),适于修改所述 第二部分信号(316),以获得第二已处理部分信号(344),以及适于 修改所述第三部分信号(318),以获得第三已处理部分信号(346), 使得将时变相移调制(A)应用至所述第一部分信号,所述时变相移 调制(A)包括比应用至所述第二部分信号的时变相移调制更 大的调制幅度,其中,应用至所述第二部分信号的时变相移的调制幅 度大于应用至所述第三部分信号的时变相移的调制幅度;以及其中,所述信号组合器(350)适于将所述第一已处理部分信号(342)、所述第二已处理部分信号(344)和所述第三己处理部分信号(346)组合,以获得所述输出音频信号(352)。
14. 如权利要求1至13之一所述的音频信号解相关器,其中,所述第一音频频率范围的频率下界大于l.lkHz。
15. —种多声道音频信号处理器(200; 400; 500),用于对第一 声道音频信号(210; 410)和第二声道音频信号(212; 412)进行解 相关,以获得第一解相关的输出音频信号(230; 422)和第二解相关 的输出音频信号(232; 426),所述多声道音频信号处理器包括如权利要求1至14之一所述的第一音频信号解相关器(100;300;220; 430、 434、 442),其中,所述第一音频信号解相关器适于接收所 述第一声道音频信号作为输入音频信号(112; 310),以及其中,所述 第一音频信号解相关器的输出音频信号(170; 362)形成了所述第一 解相关的输出音频信号;其中,所述第二声道音频信号(212; 412)或由其导出的信号形 成了所述第二解相关的输出音频信号(232; 426);以及其中,所述第一音频信号解相关器适于使得所述第一解相关的输 出音频信号和所述第二解相关的输出音频信号的第一音频频率范围中 的音频内容与所述第一解相关的输出音频信号和所述第二解相关的输 出音频信号的第二音频频率范围中的音频内容相比,具有更大的时变 相移调制。
16. 如权利要求15所述的多声道音频信号处理器,还包括第二音 频信号解相关器(100; 300; 250; 450、 454、 462),所述第二音频信号解相关器包括频率分解器(110; 312、450),用于从所述第二声道音频信号(212; 412)中提取第三部分信号(120; 314; pr,"k))和第四部分信号(122;316;Pr,2(k)),所述第三部分信号描述第三音频频率范围中的音频内容,所述第四部分信号描述第四音频频率范围中的音频内容,其中,所述第三音频频率范围包括比所述第四音频频率范围更高的频率;部分信号修改器(440; 332、 334、 336; 454),用于修改所述第 三部分信号,以获得第三已处理部分信号,使得应用至所述第三部分 信号的时变相移或时变延迟的调制幅度比应用至所述第四部分信号的 时变相移或时变延迟的调制幅度更大,或用于仅修改所述第三部分信号,使得将时变相移或时变延迟应用至所述第三部分信号;以及信号组合器,用于将所述第三已处理部分信号和所述第四己处理 部分信号组合以获得第二解相关的输出信号,或用于将所述第三已处 理部分信号与所述第四部分信号组合,以获得所述第二解相关的输出 信号。
17. 如权利要求15所述的多声道音频信号处理器,还包括如权利要求1至14之一所述的第二音频信号解相关器,其中,所述第一音频信号解相关器的第一音频频率范围包括比所 述第二音频信号解相关器的第二音频频率范围更高的频率,其中,所述第一音频信号解相关器的第一音频频率范围与所述第 二音频信号解相关器的第一音频频率范围在第一重叠音频频率范围中重叠,其中,所述第一音频信号解相关器的第二音频频率范围与所述第 二音频信号解相关器的第二音频频率范围在第二重叠音频频率范围中重叠;其中,所述第二音频信号解相关器适于接收所述第二声道输入音 频信号(212)作为输入音频信号(112; 310);其中,所述第二音频信号解相关器的输出音频信号(170; 352) 形成了所述解相关的第二输出音频信号(232; 426);其中,所述第一音频信号解相关器和所述第二音频信号解相关器 适于使得被引入所述第一音频信号解相关器的第一部分信号中的时变 相移或时变延迟与被引入所述第二音频信号解相关器的第一部分信号 中的时变相移或时变延迟不相同。
18. 如权利要求17所述的多声道音频信号处理器,其中,所述第 一音频信号解相关器(100; 300; 430、 434、 442)适于基于第一相移 值(Zu)来调节其第一音频频率范围中的时变延迟或时变相移,并适 于基于第二相移值(zu)来调节其第二音频频率范围中的时变延迟或 时变相移;其中,所述第二音频信号解相关器(100; 300; 450、 454、 462) 适于基于第三相移值(Zr,》来调节其第一音频频率范围中的时变延迟 或时变相移,并适于基于第四相移值(zu)来调节其第二音频频率范围中的时变延迟或时变相移;以及其中,所述多声道信号处理器还包括缩放器(520a、 520b、 522a、 522b),所述縮放器适于从公共调制时间函数(cc"k))中通过縮放所 述调制时间函数来获得已縮放值,并通过从所述已縮放值导出相移值, 从而导出所述第一相移值、所述第二相移值、所述第三相移值和所述 第四相移值。
19. 如权利要求18所述的多声道音频信号处理器,其中,所述第 一音频信号解相关器(100; 300; 430、 434、 442)、所述第二音频信 号解相关器(100; 300; 450、 454、 462)和所述縮放器(220a、 220b、 520a、 520b)适于使得,当与所述第二音频信号解相关器应用至所述 第一重叠音频频率范围的相移相比时,所述第一音频信号解相关器应 用至所述第一重叠音频频率范围的相移包括相反的方向,以及,当与 所述第二音频信号解相关器应用至所述第二重叠音频频率范围的相移 相比时,所述第一音频信号解相关器应用至所述第二重叠音频频率范 围的相移包括相反的方向。
20. 如权利要求18或19所述的多声道音频信号处理器,所述第 一音频信号解相关器(100; 300; 430、 434、 442)、所述第二音频信 号解相关器(100; 300; 450、 454、 462)和所述缩放器(220a、 220b、 520a、 520b)适于使得,所述第一音频信号解相关器应用至所述第一 重叠音频频率范围的相移包括与所述第二音频信号解相关器应用至所 述第一重叠音频频率范围的相移相同的幅度,以及,使得所述第一音频信号解相关器应用至所述第二重叠音频频率范 围的相移包括与所述第二音频信号解相关器应用至所述第二重叠音频 频率范围的相移相同的幅度。
21. 如权利要求17至20之一所述的多声道音频信号处理器,其 中,所述第一音频信号解相关器(100; 300; 430、 434、 442)包括分 解滤波器组(110; 312; 430),所述分解滤波器组适于将所述第一声 道音频信号(410)分解为至少两个频谱系数,第一频谱系数(pw) 描述所述第一音频频率范围中的音频内容,所述第一频谱系数形成所 述第一部分信号,第二频谱系数(Pl,2)描述所述第二音频频率范围中的音频内容,所述第二频谱系数形成所述第二部分信号;其中,所述第二音频信号解相关器(100; 300; 450、 454、 462) 包括分解滤波器组(110; 312; 450),所述分解滤波器组适于将所述 第二声道音频信号分解为至少两个频谱系数,第三频谱系数(pw)描 述所述第二音频频率范围中的音频内容,所述第三频谱系数形成所述 第二音频信号解相关器的第一部分信号,第四频谱系数描述所述第二 音频频率范围中的音频内容,所述第四频谱系数形成所述第二音频信 号解相关器的第二部分信号,其中,所述多声道音频信号处理器、所述第一音频信号解相关器和所述第二音频信号解相关器适于实现在给定的时间间隔中,将所述第一频谱系数和所述第三频谱系数与彼此互为复共轭的值相乘,或适于实现在给定的时间间隔中,将所述第一频谱系数与幅度为1的 复值相乘,而将所述第三频谱系数除以相同的复值。
22. —种音频信号处理器(600),用于接收作为多声道音频信号 的一部分的第一声道音频信号(610)、第二声道音频信号(612)、第 三声道音频信号(614)、第四声道音频信号(616)和第五声道音频信 号(618),所述音频信号处理器包括如权利要求15至21之一所述的第一多声道音频信号处理器(200、 400、 500),其中,所述第一多声道音频信号处理器(620)接收所述 多声道信号的第一声道音频信号(610)作为其第一声道音频信号(210、 410),以及其中,所述第一多声道音频信号处理器接收所述多声道信 号的第二声道音频信号(612)作为其第二声道音频信号(412);如权利要求15至21之一所述的第二多声道音频信号处理器(200; 400; 500),其中,所述第二多声道音频信号处理器(630)接收所述 多声道信号的第三声道音频信号作为其第一声道音频信号(210;410), 以及其中,所述第二多声道音频信号处理器接收所述多声道信号的第 四声道音频信号作为其第二声道音频信号(212; 412);以及如权利要求1至14之一所述的音频信号解相关器(100; 300), 其中,所述音频信号解相关器(640)接收所述多声道信号的第五声道 音频信号作为其输入音频信号(112; 310),所述第一多声道音频信号处理器、所述第二多声道音频信号处理 器和所述音频信号解相关器的输出信号形成了解相关的五声道信号。
23. 如权利要求22所述的音频信号处理器,其中,所述多声道信 号的第一声道音频信号是左前置扬声器信号;其中,所述多声道信号的第二声道音频信号是右前置扬声器信号; 其中,所述多声道信号的第三声道音频信号是左后置扬声器信号; 其中,所述多声道信号的第四声道音频信号是右后置扬声器信号;以及其中,所述多声道信号的第五声道音频信号是中心扬声器信号。
24. 如权利要求22或23所述的音频信号处理器,其中,所述第 一多声道音频信号处理器(620)适于根据使用由縮放器(520a、 520b、 522a、 522b)执行的縮放操作从第一调制时间函数(仍)导出的相移值,在其音频频率范围内应用延迟;其中,所述第二多声道音频信号处理器(630)适于根据使用由缩 放器(520a、 520b、 522a、 522b)执行的缩放操作从第二调制时间函 数导出的相移值,在其音频频率范围内应用延迟;以及其中,所述音频信号解相关器(640)适于根据使用縮放操作从第 三调制时间函数导出的相移值,在其音频频率范围内应用延迟。
25. 如权利要求24所述的音频信号处理器,其中,所述第一调制 时间函数(A)、所述第二调制时间函数和所述第三调制时间 函数是周期性函数,以及其中,所述第一调制时间函数、所述 第二调制时间函数和所述第三调制时间函数包括不同的频率。
26. —种音频会议系统(700),包括音频输入,用于接收第一声道音频信号(Xl)和第二声道音频信 号(Xp);如权利要求15至21之一所述的多声道音频信号处理器(200;400; 500; 710),其中,所述多声道音频信号处理器接收所述第一声道音频 信号和所述第二声道音频信号;第一电声换能器(932),用于输出所述多声道音频信号处理器提供的第一解相关的输出音频信号(230; 422; X,');第二电声换能器(932),用于输出所述多声道音频信号处理器提供的第二解相关的输出音频信号(232; 426; Xp');麦克风(940),与所述第一电声换能器和所述第二电声换能器声 学耦合,所述麦克风提供描述声学信号的麦克风信号(y);回声消除单元(950),用于从所述麦克风信号中减小或移除所述 第一电声换能器输出的音频内容,并用于从所述麦克风信号中减小或 移除所述第二电声换能器输出的音频内容,其中,所述回声消除单元适于根据滤波器系数来对解相关的输出 音频信号进行滤波,适于从所述麦克风信号中移除或减去解相关的输出音频信号的己 滤波版本,以获得回声减小的麦克风信号,以及适于根据所述回声减小的麦克风信号来调节滤波器参数("(k), (&(k)),以最小化所述回声减小的麦克风信号中由所述电声换能器输 出的音频内容。
27. —种用于从输入音频信号(112; 310)中导出输出音频信号 (170; 252)的方法,所述方法包括从所述输入音频信号中提取(860)第一部分信号(120; 314)和 第二部分信号(122; 316),所述第一部分信号描述第一音频频率范围 中的音频内容,所述第二部分信号描述第二音频频率范围中的音频内 容,与所述第二音频频率范围相比,所述第一音频频率范围包括更高 的频率;修改(870、 880)所述第一部分信号,以获得第一已处理部分信 号(150; 342),并修改所述第二部分信号,以获得第二已处理部分信 号(152; 344),使得应用至所述第一部分信号的时变相移或时变延迟 的调制幅度比应用至所述第二部分信号的时变相移或时变延迟的调制 幅度更高,或仅修改(870)所述第一部分信号,使得将时变相移或时 变延迟应用至所述第一部分信号;以及将所述第一已处理部分信号和所述第二已处理部分信号组合 (890),或将所述第一已处理部分信号与所述第二部分信号组合,以 获得所述输出音频信号(170; 352)。
28. —种对第一声道音频信号(210; 410)和第二声道音频信号 (212; 412)进行解相关,以获得第一解相关的输出音频信号(230;422)和第二解相关的输出音频信号(232; 426)的方法,所述方法包括根据权利要求27所述的方法,从输入音频信号(112; 310)中导 出输出音频信号(170; 252),其中,所述第一声道音频信号形成了所 述输入音频信号,以及其中,所述输出音频信号形成了所述第一解相 关的输出音频信号;以及提供所述第二声道音频信号(212; 412)或由其导出的信号,作 为所述第二解相关的输出音频信号(232; 426);其中,执行所述用于解相关的方法,使得所述第一解相关的输出 音频信号和所述第二解相关的输出音频信号的第一音频频率范围中的 音频内容包括比所述第一解相关的输出音频信号和所述第二解相关的 输出音频信号的第二音频频率范围中的音频内容更大的时变相移调 制。
29. —种用于处理多声道音频信号的方法,所述方法包括 接收作为多声道音频信号的一部分的第一声道音频信号(610)、第二声道音频信号(612)、第三声道音频信号(614)、第四声道音频 信号(616)和第五声道音频信号(618);使用如权利要求28所述的方法,对五声道音频信号的第一声道音 频信号和第二声道音频信号进行解相关,以获得解相关的多声道信号 中的两个信号;使用如权利要求28所述的方法,对多声道音频信号的第三声道音 频信号和第四声道音频信号进行解相关,以获得己处理的多声道信号 中的另外两个信号;以及使用如权利要求27所述的方法,对多声道音频信号的第五声道音 频信号进行解相关,以获得已处理的多声道信号中的第五信号。
30. —种具有程序代码的计算机程序,当所述计算机程序在计算 机上运行时,所述程序代码用于执行如权利要求27、 28或29所述的 方法。 ,
全文摘要
一种音频信号解相关器(100),用于从输入音频信号(112)导出输出音频信号(170),所述音频信号解相关器包括频率分解器(110),用于从所述输入音频信号中提取第一部分信号(120)和第二部分信号(122),所述第一部分信号描述第一音频频率范围中的音频内容,所述第二部分信号描述第二音频频率范围中的音频内容,其中,与所述第二音频频率范围相比,所述第一音频频率范围具有更高的频率。所述音频信号解相关器还包括部分信号修改器(140),用于修改所述第一部分信号,以获得第一已处理部分信号(150),并用于修改所述第二部分信号,以获得第二已处理部分信号(152),使得应用至所述第一部分信号的时变相移或时变延迟的调制幅度比应用至所述第二部分信号的时变相移或时变延迟的调制幅度更高,或用于仅修改所述第一部分信号,使得将时变相移或时变延迟应用至所述第一部分信号。所述音频信号解相关器还包括信号组合器(160),用于将所述第一已处理部分信号和所述第二已处理部分信号组合,或用于将所述第一已处理部分信号与所述第二部分信号组合,以获得所述输出音频信号(170)。所述音频信号解相关器允许对音频信号进行有效地解相关,所述解相关适于人类听觉感知。
文档编号G10L21/02GK101502091SQ200780021616
公开日2009年8月5日 申请日期2007年3月28日 优先权日2006年4月13日
发明者于尔根·赫勒, 赫伯特·比希讷 申请人:弗劳恩霍夫应用研究促进协会

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:光学构造和采用所述光学构造的显示系统的制作方法技术领域:本发明整体涉及光学构造,所述光学构造包括反射型偏振器层和具有低折射率的光学膜或显示某些类似低折射率性质的光学膜。本发明还适用于采用此类光学构造的显示系统,如液晶显示器系统。背

    专利发布时间:2025-05-15阅读:(74)

    专利名称:助听仪器的制作方法技术领域:本发明涉及一种用于转换声音信号的方法以及助听仪器。背景技术:听力受损是众所周知的会对大多数人会发生并且涉及与在听力正常的人当中听起来很普通的平均灵敏度相比完全或部分无法发觉或察觉到至少某些声音频率。或者

    专利发布时间:2025-05-15阅读:(77)

    专利名称:成像装置及其充电单元的制作方法技术领域:本发明涉及具有充电装置的成像装置,其中充电装置通过使用适合于电子照相复印机、特别是电子照相打印机的导电磁性粒子,对图像承载部件进行均匀充电。背景技术: (1)充电装置为了获得载体表面上的指定

    专利发布时间:2025-05-15阅读:(57)

    专利名称:机械式电感门铃的制作方法技术领域:本实用新型涉及机械门铃,尤其是一种机械式电感门铃。本实用新型的目的是通过如下方案实现,由固定座及分别设置在固定座端面的变压器,接线板和位于该接线板下部的磁音锤、设置在固定座两边的发音片构成,其特征

    专利发布时间:2025-05-15阅读:(68)

    一种多功能照灯的制作方法【专利摘要】本发明公开了一种多功能照灯,属于照明灯具领域,包括筒体、旋转底盖和顶盖,筒体的顶端设置有顶盖,顶盖上设置有灯面板,灯面板上设置有LED灯,灯面板通过连杆与连接柱相连接,连接柱内套设有转轴,转轴上设置有螺纹

    专利发布时间:2025-05-15阅读:(84)

    专利名称:背光模块的框架结构的制作方法技术领域:本实用新型涉及液晶显示器,特别是指液晶显示器的背光模块的框架结构。背景技术:由于液晶显示器的快速发展与大众化的价格,使得液晶显示器逐渐的取代传统的阴极射线管、背投影电视、甚至电浆电视的市场。在

    专利发布时间:2025-05-15阅读:(69)