专利名称:噪声抑制方法和设备的制作方法
技术领域:
本发明涉及数字滤波器设计领域。具体地,本发明涉及设计用于在表示声学记录 的信号中进行噪声抑制的数字滤波器的领域。
背景技术:
由于自然环境中噪声的普遍存在,现实世界声音记录典型地包含来自各种源的噪 声。为了改进声音记录的声音质量,已经开发了各种方法用于减小声音记录的噪声水平。通 常,在这种方法中,根据期望频率响应H ( ω )来计算时域噪声抑制滤波器,然后将时域噪声 抑制滤波器应用至声音记录。在理想的噪声抑制滤波器中,期望声学信号应当无失真地通过滤波器,而噪声应 当被完全衰减。在实际滤波器中,这些属性不能同时满足(除非在没有期望信号或没有噪 声或者期望信号和噪声在频谱上分离的特殊情况下)。因此,在确定滤波器的期望频率响应 Η(ω)时,对于期望信号和噪声共存的频率,必须进行使期望信号失真与使噪声失真之间的 权衡。可以通过各种方法来估计期望频率响应Η(ω),如频谱减法。在“Low-distortion spectral subtraction for speech enhancement”, Peter Handel, Conference Proceedings of Eurospeech,pp. 1549-1553,ISSN1018-4074,1995 中讨论了用于抑制噪声 的频谱减法的不同方面。在US5,706,395中,讨论了频谱减法并公开了一种用于定义应当 将噪声衰减至的水平的方法。在US5,706,395中,期望频率响应Η(ω)被箝位为衰减不能 低于最小值,其中根据US5,706,395,最小值可以依赖于要滤波的有噪话音信号的信噪比。 US5, 706,395对期望频率响应的箝位防止了噪声抑制滤波器围绕非常小的值波动,从而避 免了通常称为音乐噪声的噪声失真。在许多频谱减法方法中,作为信噪比(SNR)的函数来计算期望频率响应。由于在 特定频率处有噪声学信号的SNR随时间变化,一般随时间更新期望频率响应Η(ω)—通 常针对每个数据帧来更新期望频率响应H (ω)。这样做的效果是,通常将在有噪话音信号 中处于恒定水平的噪声衰减至以可察觉的方式随时间显著变化的水平,导致残余噪声的波 动。这种不利效果通常称为噪声脉动,可以作为伴随语音(shadow voice)而被听见。
发明内容
本发明所涉及的问题如何避免残余噪声中的不利波动。这一问题是通过一种设计数字滤波器的方法来解决的,所述数字滤波器用于对要 滤波的信号进行噪声抑制,其中所述信号表示声学记录。所述方法包括确定所述数字滤波 器的期望频率响应并基于期望频率响应来产生噪声抑制滤波器。所述方法的特征在于,以 期望频率响应不超过最大水平的方式来确定期望频率响应,其中,所述最大水平是响应于 要滤波信号来确定的。此外,这一问题是通过一种数字滤波器设计设备来解决的,所述数字滤波器设计
4设备被配置为设计用于对要滤波的信号进行噪声抑制的数字滤波器,其中所述信号表示声 学记录。所述数字滤波器设计设备包括期望频率响应确定设备,被配置为响应于要滤波的 信号来确定期望频率响应,其中,期望频率响应确定设备被配置为根据要滤波的信号来确 定期望频率响应的最大水平;并且以期望频率响应不超过所述最大水平的方式来确定期望 频率响应。此外,这一问题是通过一种被配置为执行本发明方法的计算机程序产品来解决 的。通过响应于要滤波的信号来确定所设计的滤波器的期望频率响应的最大水平,可 以减小残余噪声中的不利波动,因此可以提高声学信号的感知声学质量。例如,如果要滤波 的信号的功率密度随时间变化,则最大水平可以以最小化功率密度变化对滤波后的信号的 影响的方式,以与功率密度变化的时间标度适配的时间标度来变化。此外,也可以作为频率的函数来确定最大水平。通过允许最大水平随要滤波的信 号的频率而变化,可以更进一步提高滤波后的信号的感知质量。例如,与通常存在话音的高 频相比,在通常仅包含噪声的低频处,可以将最大水平设置为较低的值。有利地,可以基于对要滤波的信号的噪声水平的测量,如信噪比或噪声功率,来确 定期望频率响应的最大水平。本发明的其他有利实施例在从属权利要求中阐述。
为了更完整地理解本发明及其优点,现在结合附图来参考以下描述,其中图1是数字滤波器设计设备的示意图。图2a是示意本发明方法的实施例的流程图。图2b是示意本发明方法的实施例的流程图。图3是根据本发明实施例的期望响应确定设备的示意图。图4a是并入了根据本发明的数字滤波器设计设备的用户设备的示意图。图4b是通信系统中的节点的示意图,其中所述节点包括根据本发明的数字滤波 器设计设备。图5a示意了信号滤波的仿真结果,其中使用了传统滤波器设计方法。图5b示意了信号滤波的仿真结果,其中使用了根据本发明的滤波器设计方法。
具体实施例方式具有期望话音分量s (t)和噪声分量η (t)的有噪话音信号y(t)可以表示为y(t) = s(t)+n(t) (1)在许多情况下,期望抑制噪声分量η (t)并形成话音分量的估计兴/),使得估计话 音分量尽可能接近地与话音分量s (t)相似。一种实现方式是使用时域噪声抑制滤波器 h(z)对有噪信号y(t)进行滤波,时域噪声抑制滤波器h (ζ)被设计为去除尽可能多的噪声 分量n(t),同时保留尽可能多的话音分量s (t)。通常,根据期望频率响应Η(ω)来计算噪声抑制滤波器h(z),其中Η(ω)是实值函 数,典型地被设计为使得对于y(t)仅包含噪声的频率ω,Η(ω)接近于零,而对于y(t)仅包含话音的频率ω,Η(ω) =1,并且对于y(t)包含有噪话音的频率ω,0 <Η(ω) <1。在确定有噪信号的话音分量时,通常对有噪信号的样本的帧应用线性变换F[ ·]。 通过假定以下关系 其中F[ ·]表示如快速傅立叶变换(FFT)之类的线性变换,作为期望频率响应 Η(ω)的反线性变换Π ·]来获得噪声抑制滤波器h (ζ)。因此,可以通过 来获得话音分量估计,其中 表示卷积。因此,为了得到话音分量估计,必须确定期望频率响应Η(ω)。如上所述,对于 y(t)包含有噪话音的频率ω,0<Η(ω) < 1。在y(t)包含有噪话音的特定频率处的H ( ω ) 的值通常是根据该频率处有噪话音信号y(t)的信噪比(SNR)来选择的。可以通过各种方法来估计期望频率响应Η(ω),如频谱减法。由于在特定频率 处SNR随时间变化,因此一般随时间更新期望频率响应Η(ω)—通常,针对每个数据帧 来更新期望频率响应Η(ω)。因此,期望频率响应Η(ω)典型地在帧之间变化,使得H(kn, ω)兴H(kn+1,ω),其中1^表示具有帧编号η的帧的定时。备选地,可以以不同的时间间隔来 更新期望频率响应Η(ω)并从而更新根据期望频率响应来确定的滤波器配置。因此,期望 频率响应和滤波器配置随时间变化。然而,为了简化描述,在以下表述中不显式示出Η(ω) 和h(z)的时间依赖性。在以频谱减法方法来确定期望频率响应Η(ω)时,通常使用以下表达式
(4)其中似)和⑩“俲)分别是n(t)和y(t)的功率谱密度的估计,δ (ω)是用于
减小音乐噪声的过减因子。如上所述,通常,将噪声抑制限制到水平Hmin以限制通常称为音 乐噪声的残余噪声的小波动是有利的。此时,表达式(4)可以采取以下形式
(4a)[和Y2是确定Η(ω) 1与Η(ω)= Hmin之间的转变的急剧程度的因子。当 Y1= Y2= 1时,表达式(4)通常表示维纳滤波方法。图1示意了滤波器设计设备100,滤波器设计设备100被配置为基于接收到的经采 样的有噪话音信号y(t)来产生合适的噪声抑制滤波器h (ζ)。滤波器设计设备100具有输入103,用于接收要滤波的有噪话音信号y(t);以及输出104,用于输出表示所设计的数字 滤波器h(z)的信号。滤波器设计设备100包括线性变换设备105,被配置为接收经采样 的有噪话音信号y(t)并产生经采样的有噪话音信号y(t)的线性变换Υ(ω)。图1的滤波 器设计设备100还包括期望响应确定设备110,被配置为接收经采样的信号y(t)的线性 变换Υ(ω),并基于线性变换Υ(ω)来确定期望频率响应Η(ω)。滤波器设计设备100还包 括滤波器信号产生设备112,滤波器信号产生设备112包括反线性变换设备115,反线性变 换设备115被配置为接收期望频率响应Η(ω)并产生期望频率响应Η(ω)的反线性变换。 一般地,在滤波器信号产生设备112中对反线性变换设备115的输出进行进一步处理,例如 以US7,251,271中描述的方式,以获得滤波器h(z)。滤波器信号产生设备112的输出是表 示滤波器h(z)的信号,滤波器信号产生设备112的输出有利地连接至滤波器设计设备100 的输出104。在理想噪声抑制技术中,任何话音应无失真地通过。因此,对于有噪话音信号y (t) 包括话音分量s(t)的所有频率,Η(ω)应满足Η(ω) = 1。另一方面,理想噪声抑制技术应 当将任何噪声衰减至期望噪声水平Hmin,要求对于有噪话音信号y(t)包括噪声分量η (t)的 所有频率Η(ω) = Hfflin0一般不能同时满足上述期望属性,这是由于语音和噪声通常同时存在于相同频 率。因此,在确定滤波器的期望频率响应Η(ω)时,对于话音和噪声共存的频率,必须进行 使话音失真与使残余噪声失真之间的权衡。当在存在话音的频率处Η(ω) <1时,话音被 认为失真。当在存在噪声的频率处Η(ω)兴扎^时,残余噪声被认为失真,其中残余噪声定 义为
Kwh^CO = Μ2)<Η) (0·(5)根据本发明,选择期望频率响应使得应用Η(ω)的适当最大水平,其中最大水平 是响应于有噪话音信号y(t)来选择的。从以下可以看到,最大水平可以被选择为使得可以 以受控的方式来限制话音和残余噪声中的失真。从而可以减小噪声衰减的波动以及噪声和 话音失真的其他影响。在图2a中,示出了示意用于确定期望频率响应Η(ω)的本发明方法的流程图。在 步骤205,根据有噪话音信号y (t)来确定期望频率响应的最大水平Hmax——更具体地,可以 有利地根据有噪话音信号y(t)的线性变换Υ(ω)来确定最大水平!1_。可以基于有噪话音 信号y(t)的当前时间实例(即要对其应用要确定的滤波器h(z)的有噪话音信号的时间实 例);基于在要对其应用要确定的滤波器h(z)的实例的时间实例之前的有噪话音信号y(t) 的时间实例(或有噪话音信号y(t)的当前和先前时间实例的组合)来确定Hmax。Hmax可以 是或不是频率ω的函数,Η(ω)的最大水平以下表示为Η_(ω)。此外,Η_(ω)可以在不 同时刻之间变化或不变。然而,一般地,以下不显式示出这种变化。可以以多种不同方式来 确定Hmax (ω),其中一些方式在以下描述。当在步骤205确定了 Η·(ω)时,进入步骤210,其中根据Hmax(ω)来确定期望频 率响应Η(ω)。在本发明的一个实现中,针对高于转换频率Wtl的所有频率ω,Η(ω)可以 例如被选择为等于Η_(ω);针对低于(Oci的频率,Η(ω)可以被选择为等于期望频率响应 的最小水平Hmin。在该实现中,转换频率ω ^可以例如被确定为以下频率(或者以任何其他合适的方式来确定)低于该频率,有噪话音信号的话音分量s (t)的功率小于阈值。图2b示意了本发明方法的实现,其中根据期望频率响应的近似Η3ρρΜΧ(ω)以及根 据最大水平Η_(ω)来执行确定期望频率响应的步骤205。在图2b的步骤205中,确定最 大水平Η_(ω)(见图2a)。然后,进入步骤207,其中基于经采样的信号y (t)的线性变换 Υ(ω)来确定期望频率响应的近似Η_Μ(ω)。例如,可以使用表达式(4)来获得期望频率 响应的这一近似Happra (ω)。然后进入步骤210,其中基于期望频率响应的近似Happrax (ω) 与期望频率响应的最大值Η_(ω)之间的比较来确定Η(ω)的值。例如,可以使用以下表 达式来执行上述确定Η(ω) =π1 η{Η~(ω), Hmzx(W)} (6)优选地,应当针对应确定Η(ω)值的每个频率箱体来进行表达式(6)所表达的选 择。因此,图2b的步骤210优选地针对应确定Η(ω)值的每个频率箱体来重复进行。然而, 可能存在以下情况对期望频率响应的最大水平的限制对于频谱的某些部分不那么有利。 在与这种实现相关的实现中,应当仅针对需要对期望频率响应的最大值进行限制的频率箱 体重复进行步骤210。备选地,可以在步骤205之前执行步骤207。在图2b的方法中(以及在图2a的方法中)可以包括检查值Happra (ω)是否小于 期望频率响应的最小值!1_。然后,可以有利地将表达式(6)改变为如下H (ω) = max {min (Happrox (ω),Hmax (ω)},HffliJ (6a)或如下H (ω) = min {max (Happrox (ω), HffliJ,Hmax (ω)} (6b)使用表达式(6a)还是(6b)取决于期望Η(ω)取值Η_(ω)还是值Hmin,其中Hmin > Hfflax0与Η_(ω) —样,Hmin可以随频率改变,并且可以在不同时刻取不同值。如上所述,ΗΜΧ(ω)可以被设置为适用于所有频率和/或所有时刻的固定值。当 Η_(ω)独立于时间和频率时,Hmax < 1的值将用于限制存在话音的时刻与仅存在噪声的时 刻之间在特定频率处的噪声抑制的差异,即可以减小残余噪声的波动。然后,所发生的话音 失真总是至少为Hmax所确定的程度。然而,为了减小话音失真以及提高获得对噪声衰减的 波动的有效减小的可能性,有利地,引入随频率和时间变化的最大期望频率响应Η_(ω)。例如,可以基于对有噪话音信号y(t)的噪声水平的测量,如有噪话音信号y(t)的 信噪比SNR(co)、不同频率处话音分量估计的SNR(co)或话音分量估计· ( )的总信噪比 Sfrim等(其中“总”是指在相关频带上执行积分(见以下表达式(14))),来导出图2的步 骤205中确定的Η_(ω)的值。备选地,可以使用其他测量来确定Η_(ω)。优选地,所述 其他测量应与信噪比相关例如,Η_(ω)的确定可以基于有噪话音信号y(t)在不同频率 处的噪声功率电平Pn(t,ω),或基于有噪话音信号的总噪声水平。对信号y(t)的噪声 功率电平的测量可以被视为对信噪比的测量,其中假定信号功率具有特定值。Η_(ω)的值 可以备选地基于有噪话音信号y(t)的功率电平,或基于有噪话音信号y(t)的任何其他测 量。基于SNR(t,ω)的最坏t書况考虎的H:由于在Η(ω)在特定时间段内变化时,针对该时间段获得的估计话音分量■?( )的SNR取决于Η(ω)(见以下内容),因此例如可以从话音分量估计邓)的SNR(co)的最坏情况 考虑来导出Η_(ω)的表达式。话音分量估计的SNR ( ω )可以表达为 其中Φρ Φ, Φ 分别是对所估计的话音分量i(i)、有噪话音信号y(t)和噪声 分量n(t)的谱密度的估计,是对残余噪声nresidual(t)的谱密度的估计。从以上表达式(1)_(3)和⑶可以看到,瞬时地,针对特定频率ω的的 SNR(co)独立于Η(ω)(并且等于该频率处y(t)的SNR)。然而,与瞬时SNR不同,典型地, 当Η(ω)在特定时间段内变化时,针对该时间段的SNR依赖于Η(ω)。为了示意这一点,考 虑以下简单示例其中基于在两个不同时刻、和、采集的两个采样y(tA)和y(tB)来确定 SNR,并且在tA获得的采样包含有噪话音y(tA) =s(tA)+n(tA);在tB处的采样仅包含噪声 y(tB) =n(tB)。假定针对特定频率ω的期望频率响应Η(ω)在不同时刻取不同值,使得 H(tA,ω)乒H(tB,ω),基于这两个采样的针对频率ω的兴 )的SNR可以表示为 显然,表达式(8a)中的SNR依赖于Η(ω),由于H(tB,《)仅存在于表达式(8a)的
分母中。当假定话音被最大衰减并且噪声被最小衰减时给出最坏情况SNR。对于频率ω, 这可以表示为 为了限制最坏情况SNR,可以提供最坏情况SNR的最小值β,其中β是频率的函
数 在表达式(10)中,β (ω)形成了最坏情况SNR的下限。以下将β称为容限阈值。 优选地,针对所有频率,应当对容限阈值β给出大于0的值。 表达式(10)得到针对Η(ω)的最大水平的以下表达式 通过针对Hfflin = 0或= ci>,t(a0的特殊情况来定义Hmax ( ω ) = 0,这些情况 将被(11)所涵盖。由于期望Η(ω)以及从而Η_(ω)尽可能大,以最小化话音失真,因此(11)可以
简化为 容限阈值β (ω)对最坏情况SNR可以多小定义了限制。β (ω)可以取大于0的 任何值。在用于移动通信的噪声抑制应用中,β (ω)的值可以例如落在-10至IOdB范围 内。这种应用中β (ω)的典型值可以是_3dB,这已经被证明以合理的话音失真代价将残余 噪声的波动减小至对于Η_(ω)的大多数值残余噪声不可察觉。例如,可以根据以下表达式来选择容限阈值 或
的可接受失真(可以从中获得Dnt5ise和Dspradl的值的关系在以下表达式(21)和(22)中给出)。在部分或整个频率范围内,β (ω)也可以取恒定值。如果对最小化残余噪声失真 赋予比最小化话音失真更高的优先级,则β应当优选地被给予较大的值,例如大约+3dB。 另一方面,如果最小化话音失真比最小化残余噪声更加重要,则β应当优选地被给予较小 的值,例如大约_7dB。在本发明的一个实现中,β (ω)的值可以取决于有噪话音信号在特定时间和频率 处是否包含话音分量。如果在特定频率处没有话音分量,则β (ω)的值将被设置为相对 较大的值;当在该特定频率处出现话音分量时,β (ω)的值可以有利地缓慢下降至明显较 小的值。在话音出现时缓慢减小β (ω)的值时,实现了在不存在话音时获得高效的噪声抑 制,并且在该特定频率处得到的话音失真以收听信号的人耳不会察觉到对话音分量估计的 滤波的逐渐改变的方式逐渐减小。基于总信噪比的H=如上所述,可以基于对总信噪比Sk的考虑来确定Η_(ω),其中
Hfflax的值可以例如从以下表达式获得 或从以下表达式获得
(16)基于噪声功率电平Ρη( ω )的Hmax此夕卜,备选地,可以基于对噪声功率电平? ( )的考虑来确定Η χ(ω)的值,例如 通过表达式(17)或(18)中提供的关系之一Η·(ω) = a[Pn(co)rb+c(17)Η χ(ω) = alog2[Pn(W)]+b (18)基于总噪声功率电平&的H:备选地,可以基于对总噪声功率电平瓦的考虑来确定Hmax ( ω ),其中ζ是在ω 和 ω2之间的频率区域内测量的噪声功率电平。Hfflax的值可以例如从以下表达式获得 或从以下表达式获得
(20)在以上表达式(15)-(20)中,a、b和c是表示可以通过实验导出合适值的常数。也 可以使用确定期望频率响应的最大水平Hmax的其他方法。图3中示意了根据本发明的期望响应确定设备110的实施例。图3的期望响应确 定设备Iio包括响应近似确定设备300、最大响应确定设备305和最小值选择器310。响 应近似确定设备300被配置为对馈送至期望响应确定设备110的输入315的信号(即典 型为有噪话音信号的线性变换Υ(ω))进行操作。此外,响应近似确定设备300被配置为基 于输入信号来确定期望频率响应的近似Η_Μ(ω)。有利地,可以以用于确定期望频率响应 的传统方式,例如根据上述表达式(4)来确定Η_Μ(ω)。图3的最大响应确定设备305被配置为确定期望频率响应的最大水平ΗΜΧ(ω)。 在本发明的许多实施例中,最大响应确定设备305被配置为接收并操作线性变换Υ(ω),或接收并操作有噪话音信号y(t),以例如根据上述表达式(12)或(15)-(20)中任一项来确定 。(在图3的实施例中,最大响应确定设备305被配置为接收线性变换Υ(ω))。然而, 在其他实施例中,可以以其他方式来确定IU (ω)——其中之一为IU ( )取恒定值——并且 可以省略图3所示的期望响应确定设备110的输入与最大响应确定设备之间的连接。在图3所示的设备中,响应近似确定设备300的输出(由此传送表的 信号)和最大响应确定设备的输出(由此传送表示Η χ(ω)的信号)均连接至最小值选择 器310的输入。最小值选择器310被配置为将表示Η_(ω)的信号与信号Happrax(ω)进 行比较,并选择Η_(ω)与Η_Μ(ω)中的较小者。然后,最小值选择器310被配置为输出 Η_(ω)与Happrax(O)中的较小者。最小值选择器310的输出表示期望频率响应Η(ω)的 值,最小值选择器310的输出连接至期望频率响应确定设备110的输出320,以便将表示期 望频率响应Η(ω)的值馈送至输出320。图3的期望响应确定设备110可以包括图3中未示出的其他组件,如最大值选择 器,被配置为将频率响应的值与期望频率响应的最小水平iiin( ω)进行比较,并选择所比较 值的最大值。有利地,这种最大值选择器可以被配置为将Hmin( ω )与最小值选择器310的输 出进行比较,在这种情况下,最大值选择器的输出可以有利地连接至期望响应确定设备110 的输出320。备选地,这种最大值选择器可以被配置为将Hmin(Co)与响应近似确定设备300 的输出进行比较,在这种情况下,最大值选择器的输出有利地连接至最小值选择器310的 输入而不是将响应近似确定设备300的输出连接至最小值选择器310 (见上述表达式(6a) 和(6b))。期望响应确定设备110还可以包括如缓冲器等其他组件。期望频率响应确定设备110可以有利地由合适的计算机软件和/或硬件来实现, 作为滤波器设计设备100的一部分。根据本发明的滤波器设计设备100可以有利地在用于 传输话音的用户设备中实现,如移动电话、固定线路电话、无线电话机等等。滤波器设计设 备100还可以在处理声学信号的其他类型的用户设备中实现,如便携式摄像机、录音电话 等。在图4a中,示出了包括根据本发明的滤波器设计设备的用户设备400。用户设备400 可以被配置为根据本发明在记录声学信号时和/或在重放已经在不同时刻和/或由不同用 户设备记录的声学信号时执行噪声抑制。此外,根据本发明的滤波器设计设备100可以有利地在通信网络中需要执行噪 声抑制的中间节点中实现,如在IP多媒体子系统(IMS系统)中的媒体资源功能处理器 (MRFP)中、在移动媒体网关中等等。图4b示出了包括节点410的通信系统405,节点410 包括根据本发明的滤波器设计设备100。表1以及图5a和5b示意了通过根据上述表达式(4a)针对特定时间t’和频率ω ’ 来确定期望频率响应H(t’,ω ’)(图5a)以及通过根据本发明的实施例确定期望频率响应 H(t’,ω’)(图5b)而获得的仿真结果。在图5b中,使用表达式(6a)来确定H(t’,ω’), 其中使用表达式(12)来确定Hmax (t’,ω,),其中β
,并且通过表达式(4)获 得!^ ^,ω’)。在图5a中,用于获得H(t’,ω’)的方法以传统方式不对H(t’,ω)施
加上限,即= OdB。在图5a和5b所示的仿真中,均使用相关参数的以下值
并且当前时间和频率处 y(t,)的 SNR 为 10dB。可以使用以下表达式作为对残余噪声的失真Dn°ise的测量
而话音的失真Dspeeeh可以表示为
H'
(22)
Dnoise也可以用作对残余噪声的波动的测量。 在图5a和5b中,指示了 5个不同信号水平
1有噪话音信号y(t’ )的功率谱密度
2噪声分量n(t’ )的功率谱密度ΦΜ( ·,乂)
3期望噪声水平- Hlin
4话音分量估计兴ο的功率谱密度χ ^Ο',αΟ一付3GW)
5:残余噪声IIresidual(t')的功率谱密度杏 (广,似,)—//2(/',份‘) 此外,在图5a和5b中指示了多个不同信号水平差
A 有噪话音信号y(t,)的SNR(t,)以及话音分量估计的SNR(t,) (IOdB) C:话音失真-H2 (t'
ω
D 残余噪声失真
在表1中,给出了通过图5a中示意的确定Η(ω)的传统方法和图5b中示意的本 发明方法获得的Dn°ise和D—的值,以及最坏情况信噪比的值。
表1.传统噪声抑制方法与根据本发明实施例的噪声抑制方法获得的噪声抑制的 比较从图5a和5b所示的仿真结果以及表1可以清楚看到,本发明方法获得的残余噪 声失真和最坏情况SNR优于传统噪声抑制技术所获得的残余噪声失真和最坏情况SNR。这 种改进总体上是以话音失真的增大为代价而获得的。然而,在许多情况下,如果减小了残余 噪声中的波动,则话音失真的增大是可接受的。此外,从以上可以清楚看到,可以容易地计 算根据本发明在残余噪声与话音的失真之间进行的权衡的效果。因此,判定是否要应用本 发明方法来选择滤波器配置的期望频率响应可以基于对应用本发明方法将对话音失真对 残余噪声失真具有何种结果的分析来进行。这种分析可以时常进行,可以基于该分析来判 定是否要应用本发明方法来确定H( )。如果发现从确定H( )的传统方式至根据本发明 的方法的转换是合适的,则可以有利地逐渐进行这种转换,以实现收听者不可察觉的无缝 转变。通过本发明,获得了一种灵活并且计算简单的方式来确定数字滤波器的期望频率 响应H( )。通过应用该方法,可以以受控的方式来减小残余噪声的波动,并且残余噪声中 的波动量与话音失真之间的必要权衡变得相当简单。本发明可以成功地应用于基于频谱减 法的任何噪声减小方法。以上就有噪话音信号的噪声抑制讨论了本发明。但是本发明也可以有利地应用于 其他类型的声学记录中的噪声抑制。以上将要抑制噪声的信号y(t)称为有噪话音信号,但 可以是任何类型的有噪声学记录。本领域技术人员可以认识到,本发明不限于在附图中公开的实施例和以上详细描 述,在附图中公开的实施例和以上详细描述仅呈现用于示意目的,可以以多种不同方式来 实现本发明,本发明由所附权利要求来限定。
权利要求
一种设计数字滤波器(h(z))的方法,所述数字滤波器用于对要滤波的信号(y(t))进行噪声抑制,其中所述信号表示声学记录,所述方法包括确定所述数字滤波器的期望频率响应(H(ω));基于期望频率响应来产生噪声抑制滤波器;所述方法的特征在于,以期望频率响应不超过最大水平的方式来确定期望频率响应,其中,所述最大水平是响应于要滤波的信号而确定的。
2.根据权利要求1所述的方法,其中 所述频率响应的最大水平是频率的函数。
3.根据权利要求1或2所述的方法,其中,确定期望频率响应包括 确定(205)所述频率响应的最大水平( ^χ(ω));确定(207)所述频率响应的近似(H—(ω)); 将所述近似与所述最大水平进行比较(210);以及选择(210)所述最大水平,作为下述频率的期望频率响应的值在所述频率处,所述最 大水平的值低于所述频率响应的近似的值。
4.根据权利要求3所述的方法,其中确定近似、确定最大水平、比较和选择的步骤针对至少两个不同的频率箱体重复进行。
5.根据上述任一权利要求所述的方法,其中以期望频率响应不取低于期望频率响应的最小水平的值的方式,确定期望频率响应。
6.根据权利要求5所述的方法,其中所述最大水平是根据所述最小水平来确定的。
7.根据上述任一权利要求所述的方法,其中所述最大水平是基于对要滤波的信号的噪声水平的测量来确定的。
8.根据权利要求7所述的方法,其中在特定频率处的最大水平是根据对所述特定频率处要滤波的信号的信噪比的估计来 确定的。
9.根据权利要求8所述的方法,其中所述最大水平被产生为与下述公式的数值相对应的值 IH2. ΦΜ-ΦΛω)"臓⑷=匪jj卞 ⑷“,I·,其中Η_(ω)是作为频率的函数的所述最大水平,Hmin是所述频率响应的最小水平,β 是表示最大可接受信噪比的容限阈值。
10.根据权利要求9所述的方法,其中 所述容限阈值的值取决于确定最大水平的频率。
11.根据权利要求7所述的方法,其中所述最大水平是根据对信噪比的总值的估计来确定的。
12.根据权利要求7所述的方法,其中在特定频率处的最大水平是根据对所述特定频率处要滤波的信号的噪声功率的估计 来确定的。
13.根据权利要求7所述的方法,其中所述最大水平是根据对所述信号的噪声功率的估计来确定的。
14.一种数字滤波器设计设备(100),被配置为设计对要滤波的信号(y(t))进行噪声 抑制的数字滤波器(h(ζ)),其中所述信号表示声学记录,所述数字滤波器设计设备包括期望频率响应确定设备(110),被配置为响应于要滤波的信号来确定期望频率响应 (Η(ω));所述数字滤波器设计设备的特征在于,期望频率响应确定设备被配置为根据要滤波的信号,确定(305)期望频率响应的最大水平(Η_(ω));以及以期望频率响应不超过所述最大水平的方式,确定(310)期望频率响应。
15.根据权利要求14所述的数字滤波器设计设备,其中期望频率响应确定设备(110)被配置为作为频率的函数来确定(300)期望频率响应 的最大水平。
16.根据权利要求14或15所述的数字滤波器设计设备,其中,期望频率响应确定设备 被配置为确定(300)期望频率响应的近似(H—(ω));将所述频率响应的近似与所确定的最大水平进行比较(310);以及选择(310)所述最大水平与期望频率响应的近似中的较小者作为期望频率响应的值。
17.根据从属于权利要求15的权利要求16所述的数字滤波器设计设备,其中,期望频 率响应确定设备被配置为针对每个频率箱体来进行比较和选择。
18.根据权利要求14 17中任一项所述的数字滤波器设计设备,其中期望频率响应确定设备被配置为以期望频率响应不取低于最小水平的值的方式来确 定期望频率响应。
19.根据权利要求18所述的数字滤波器设计设备,其中期望频率响应确定设备被配置为根据所述最小水平来确定所述最大水平。
20.根据权利要求14 19中任一项所述的数字滤波器设计设备,其中期望频率响应确定设备被配置为基于对要滤波的信号的噪声水平的测量来确定所述 最大水平。
21.一种用于处理声学信号的用户设备(400),所述用户设备包括根据权利要求14 20中任一项所述的数字滤波器设计设备。
22.一种通信系统(405)中用于对表示语音的信号进行中继的节点(410),所述节点包 括根据权利要求14 20中任一项所述的数字滤波器设计设备(100)。
23.一种用于设计数字滤波器(h(z))的计算机程序产品,所述数字滤波器用于对要滤 波的信号(y(t))进行噪声抑制,其中所述信号表示声学记录,所述计算机程序产品包括在计算机上运行时,适于确定所述数字滤波器的期望频率响应(Η(ω))的计算机程序 代码部分(110);在计算机上运行时,适于基于期望频率响应来产生噪声抑制滤波器的计算机程序代码 部分(112);所述计算机程序产品的特征在于,适于确定期望频率响应的计算机程序代码部分被配置为以期望频率响应不超过最大 水平的方式来确定(300、305、310)期望频率响应,其中,所述最大水平是响应于要滤波的 信号而确定的。
全文摘要
本发明涉及一种数字滤波器的方法和设备,所述数字滤波器用于对表示声学记录的信号进行噪声抑制。所述方法包括确定所述数字滤波器的期望频率响应(H(ω));基于期望频率响应来产生噪声抑制滤波器。以期望频率响应不超过最大水平的方式来确定期望频率响应,其中,所述最大水平是响应于要滤波信号来确定的。
文档编号G10L21/02GK101904097SQ200780102005
公开日2010年12月1日 申请日期2007年12月20日 优先权日2007年12月20日
发明者佩尔·阿格伦, 安德尔斯·埃里克松 申请人:艾利森电话股份有限公司
噪声抑制方法和设备的制作方法
相关推荐
专利名称:新型马林巴琴的制作方法技术领域:本实用新型属于打击乐器领域,尤其是一种新型马林巴琴。 背景技术:马林巴是一种非洲木琴,结构同一般的欧洲木琴有很大区别,而且马林巴的种类 也比较多,如常见的高音马林巴和大型马林巴等。虽然马林巴的种类很
专利名称:一种语音识别方法及系统的制作方法一种语音识别方法及系统技术领域:本发明涉及互联网应用领域,尤其涉及一种语音识别方法及系统。背景技术:语音识别技术是近十年间信息技术领域十大重要的科技发展技术之一,主要应用于语音拨号、语音导航、室内设
专利名称:一种易拆分的led灯的制作方法技术领域:—种易拆分的LED灯技术领域[0001]本实用新型涉及一种LED灯,特别是一种结构美观、便于修理和清理的易拆分的 LED灯,属于LED照明件技术领域。背景技术:[0002]LED灯作为一种新
专利名称:Led组件的连接器的制作方法技术领域:LED组件的连接器技术领域[0001]本发明涉及LED组件。更具体而言,本发明涉及一种LED组件的连接器,在该LED 组件中电连接端子受到连接器保护且由于组装了该连接器而使得LED模块和电路板
专利名称:弦乐器弓杆、弦乐器弓及弦乐器弓杆的制造方法技术领域:本发明涉及弦乐器弓杆(stick)、弦乐器弓及弦乐器弓杆的制造方法,特别是,本发明涉及具备使用了纤维强化塑料作为基体材料并具有与天然木材相接近的木纹质外观的杆的弦乐器弓及弦乐器弓
专利名称:通过使用平方根折扣的统计语言的语音识别的制作方法技术领域:本发明涉及采用统计平滑的统计语言建模的方法。特别地,本发明涉及基于统计语言建模的语音识别方法,该统计建模利用平滑的概率计算,具体地,折扣所观察到的事件的概率。 背景技术:统