噪声抑制方法和设备的制作方法-品牌商务网

专利名称：噪声抑制方法和设备的制作方法
技术领域：
本发明涉及数字滤波器设计领域。具体地，本发明涉及设计用于在表示声学记录的信号中进行噪声抑制的数字滤波器的领域。
背景技术：
由于自然环境中噪声的普遍存在，现实世界声音记录典型地包含来自各种源的噪声。为了改进声音记录的声音质量，已经开发了各种方法用于减小声音记录的噪声水平。通常，在这种方法中，根据期望频率响应H ( ω )来计算时域噪声抑制滤波器，然后将时域噪声抑制滤波器应用至声音记录。在理想的噪声抑制滤波器中，期望声学信号应当无失真地通过滤波器，而噪声应当被完全衰减。在实际滤波器中，这些属性不能同时满足(除非在没有期望信号或没有噪声或者期望信号和噪声在频谱上分离的特殊情况下)。因此，在确定滤波器的期望频率响应 Η(ω)时，对于期望信号和噪声共存的频率，必须进行使期望信号失真与使噪声失真之间的权衡。可以通过各种方法来估计期望频率响应Η(ω)，如频谱减法。在“Low-distortion spectral subtraction for speech enhancement”， Peter Handel, Conference Proceedings of Eurospeech,pp. 1549-1553，ISSN1018-4074，1995 中讨论了用于抑制噪声的频谱减法的不同方面。在US5，706，395中，讨论了频谱减法并公开了一种用于定义应当将噪声衰减至的水平的方法。在US5，706，395中，期望频率响应Η(ω)被箝位为衰减不能低于最小值，其中根据US5，706，395，最小值可以依赖于要滤波的有噪话音信号的信噪比。 US5, 706，395对期望频率响应的箝位防止了噪声抑制滤波器围绕非常小的值波动，从而避免了通常称为音乐噪声的噪声失真。在许多频谱减法方法中，作为信噪比(SNR)的函数来计算期望频率响应。由于在特定频率处有噪声学信号的SNR随时间变化，一般随时间更新期望频率响应Η(ω)—通常针对每个数据帧来更新期望频率响应H (ω)。这样做的效果是，通常将在有噪话音信号中处于恒定水平的噪声衰减至以可察觉的方式随时间显著变化的水平，导致残余噪声的波动。这种不利效果通常称为噪声脉动，可以作为伴随语音(shadow voice)而被听见。

发明内容
本发明所涉及的问题如何避免残余噪声中的不利波动。这一问题是通过一种设计数字滤波器的方法来解决的，所述数字滤波器用于对要滤波的信号进行噪声抑制，其中所述信号表示声学记录。所述方法包括确定所述数字滤波器的期望频率响应并基于期望频率响应来产生噪声抑制滤波器。所述方法的特征在于，以期望频率响应不超过最大水平的方式来确定期望频率响应，其中，所述最大水平是响应于要滤波信号来确定的。此外，这一问题是通过一种数字滤波器设计设备来解决的，所述数字滤波器设计
4设备被配置为设计用于对要滤波的信号进行噪声抑制的数字滤波器，其中所述信号表示声学记录。所述数字滤波器设计设备包括期望频率响应确定设备，被配置为响应于要滤波的信号来确定期望频率响应，其中，期望频率响应确定设备被配置为根据要滤波的信号来确定期望频率响应的最大水平；并且以期望频率响应不超过所述最大水平的方式来确定期望频率响应。此外，这一问题是通过一种被配置为执行本发明方法的计算机程序产品来解决的。通过响应于要滤波的信号来确定所设计的滤波器的期望频率响应的最大水平，可以减小残余噪声中的不利波动，因此可以提高声学信号的感知声学质量。例如，如果要滤波的信号的功率密度随时间变化，则最大水平可以以最小化功率密度变化对滤波后的信号的影响的方式，以与功率密度变化的时间标度适配的时间标度来变化。此外，也可以作为频率的函数来确定最大水平。通过允许最大水平随要滤波的信号的频率而变化，可以更进一步提高滤波后的信号的感知质量。例如，与通常存在话音的高频相比，在通常仅包含噪声的低频处，可以将最大水平设置为较低的值。有利地，可以基于对要滤波的信号的噪声水平的测量，如信噪比或噪声功率，来确定期望频率响应的最大水平。本发明的其他有利实施例在从属权利要求中阐述。

为了更完整地理解本发明及其优点，现在结合附图来参考以下描述，其中图1是数字滤波器设计设备的示意图。图2a是示意本发明方法的实施例的流程图。图2b是示意本发明方法的实施例的流程图。图3是根据本发明实施例的期望响应确定设备的示意图。图4a是并入了根据本发明的数字滤波器设计设备的用户设备的示意图。图4b是通信系统中的节点的示意图，其中所述节点包括根据本发明的数字滤波器设计设备。图5a示意了信号滤波的仿真结果，其中使用了传统滤波器设计方法。图5b示意了信号滤波的仿真结果，其中使用了根据本发明的滤波器设计方法。
具体实施例方式具有期望话音分量s (t)和噪声分量η (t)的有噪话音信号y(t)可以表示为y(t) = s(t)+n(t) (1)在许多情况下，期望抑制噪声分量η (t)并形成话音分量的估计兴/)，使得估计话音分量尽可能接近地与话音分量s (t)相似。一种实现方式是使用时域噪声抑制滤波器 h(z)对有噪信号y(t)进行滤波，时域噪声抑制滤波器h (ζ)被设计为去除尽可能多的噪声分量n(t)，同时保留尽可能多的话音分量s (t)。通常，根据期望频率响应Η(ω)来计算噪声抑制滤波器h(z)，其中Η(ω)是实值函数，典型地被设计为使得对于y(t)仅包含噪声的频率ω，Η(ω)接近于零，而对于y(t)仅包含话音的频率ω，Η(ω) =1，并且对于y(t)包含有噪话音的频率ω，0 <Η(ω) <1。在确定有噪信号的话音分量时，通常对有噪信号的样本的帧应用线性变换F[ ·]。通过假定以下关系其中F[ ·]表示如快速傅立叶变换(FFT)之类的线性变换，作为期望频率响应 Η(ω)的反线性变换Π ·]来获得噪声抑制滤波器h (ζ)。因此，可以通过来获得话音分量估计，其中表示卷积。因此，为了得到话音分量估计，必须确定期望频率响应Η(ω)。如上所述，对于 y(t)包含有噪话音的频率ω，0<Η(ω) < 1。在y(t)包含有噪话音的特定频率处的H ( ω ) 的值通常是根据该频率处有噪话音信号y(t)的信噪比(SNR)来选择的。可以通过各种方法来估计期望频率响应Η(ω)，如频谱减法。由于在特定频率处SNR随时间变化，因此一般随时间更新期望频率响应Η(ω)—通常，针对每个数据帧来更新期望频率响应Η(ω)。因此，期望频率响应Η(ω)典型地在帧之间变化，使得H(kn， ω)兴H(kn+1，ω)，其中1^表示具有帧编号η的帧的定时。备选地，可以以不同的时间间隔来更新期望频率响应Η(ω)并从而更新根据期望频率响应来确定的滤波器配置。因此，期望频率响应和滤波器配置随时间变化。然而，为了简化描述，在以下表述中不显式示出Η(ω) 和h(z)的时间依赖性。在以频谱减法方法来确定期望频率响应Η(ω)时，通常使用以下表达式
(4)其中似)和⑩“俲)分别是n(t)和y(t)的功率谱密度的估计，δ (ω)是用于
减小音乐噪声的过减因子。如上所述，通常，将噪声抑制限制到水平Hmin以限制通常称为音乐噪声的残余噪声的小波动是有利的。此时，表达式(4)可以采取以下形式
(4a)[和Y2是确定Η(ω) 1与Η(ω)= Hmin之间的转变的急剧程度的因子。当 Y1= Y2= 1时，表达式(4)通常表示维纳滤波方法。图1示意了滤波器设计设备100，滤波器设计设备100被配置为基于接收到的经采样的有噪话音信号y(t)来产生合适的噪声抑制滤波器h (ζ)。滤波器设计设备100具有输入103，用于接收要滤波的有噪话音信号y(t)；以及输出104，用于输出表示所设计的数字滤波器h(z)的信号。滤波器设计设备100包括线性变换设备105，被配置为接收经采样的有噪话音信号y(t)并产生经采样的有噪话音信号y(t)的线性变换Υ(ω)。图1的滤波器设计设备100还包括期望响应确定设备110，被配置为接收经采样的信号y(t)的线性变换Υ(ω)，并基于线性变换Υ(ω)来确定期望频率响应Η(ω)。滤波器设计设备100还包括滤波器信号产生设备112，滤波器信号产生设备112包括反线性变换设备115，反线性变换设备115被配置为接收期望频率响应Η(ω)并产生期望频率响应Η(ω)的反线性变换。一般地，在滤波器信号产生设备112中对反线性变换设备115的输出进行进一步处理，例如以US7，251，271中描述的方式，以获得滤波器h(z)。滤波器信号产生设备112的输出是表示滤波器h(z)的信号，滤波器信号产生设备112的输出有利地连接至滤波器设计设备100 的输出104。在理想噪声抑制技术中，任何话音应无失真地通过。因此，对于有噪话音信号y (t) 包括话音分量s(t)的所有频率，Η(ω)应满足Η(ω) = 1。另一方面，理想噪声抑制技术应当将任何噪声衰减至期望噪声水平Hmin，要求对于有噪话音信号y(t)包括噪声分量η (t)的所有频率Η(ω) = Hfflin0一般不能同时满足上述期望属性，这是由于语音和噪声通常同时存在于相同频率。因此，在确定滤波器的期望频率响应Η(ω)时，对于话音和噪声共存的频率，必须进行使话音失真与使残余噪声失真之间的权衡。当在存在话音的频率处Η(ω) <1时，话音被认为失真。当在存在噪声的频率处Η(ω)兴扎^时，残余噪声被认为失真，其中残余噪声定义为
Kwh^CO = Μ2)<Η) (0·(5)根据本发明，选择期望频率响应使得应用Η(ω)的适当最大水平，其中最大水平是响应于有噪话音信号y(t)来选择的。从以下可以看到，最大水平可以被选择为使得可以以受控的方式来限制话音和残余噪声中的失真。从而可以减小噪声衰减的波动以及噪声和话音失真的其他影响。在图2a中，示出了示意用于确定期望频率响应Η(ω)的本发明方法的流程图。在步骤205，根据有噪话音信号y (t)来确定期望频率响应的最大水平Hmax——更具体地，可以有利地根据有噪话音信号y(t)的线性变换Υ(ω)来确定最大水平!1_。可以基于有噪话音信号y(t)的当前时间实例(即要对其应用要确定的滤波器h(z)的有噪话音信号的时间实例)；基于在要对其应用要确定的滤波器h(z)的实例的时间实例之前的有噪话音信号y(t) 的时间实例(或有噪话音信号y(t)的当前和先前时间实例的组合)来确定Hmax。Hmax可以是或不是频率ω的函数，Η(ω)的最大水平以下表示为Η_(ω)。此外，Η_(ω)可以在不同时刻之间变化或不变。然而，一般地，以下不显式示出这种变化。可以以多种不同方式来确定Hmax (ω)，其中一些方式在以下描述。当在步骤205确定了 Η·(ω)时，进入步骤210，其中根据Hmax(ω)来确定期望频率响应Η(ω)。在本发明的一个实现中，针对高于转换频率Wtl的所有频率ω，Η(ω)可以例如被选择为等于Η_(ω)；针对低于(Oci的频率，Η(ω)可以被选择为等于期望频率响应的最小水平Hmin。在该实现中，转换频率ω ^可以例如被确定为以下频率(或者以任何其他合适的方式来确定)低于该频率，有噪话音信号的话音分量s (t)的功率小于阈值。图2b示意了本发明方法的实现，其中根据期望频率响应的近似Η3ρρΜΧ(ω)以及根据最大水平Η_(ω)来执行确定期望频率响应的步骤205。在图2b的步骤205中，确定最大水平Η_(ω)(见图2a)。然后，进入步骤207，其中基于经采样的信号y (t)的线性变换 Υ(ω)来确定期望频率响应的近似Η_Μ(ω)。例如，可以使用表达式(4)来获得期望频率响应的这一近似Happra (ω)。然后进入步骤210，其中基于期望频率响应的近似Happrax (ω) 与期望频率响应的最大值Η_(ω)之间的比较来确定Η(ω)的值。例如，可以使用以下表达式来执行上述确定Η(ω) =π1 η{Η~(ω), Hmzx(W)} (6)优选地，应当针对应确定Η(ω)值的每个频率箱体来进行表达式(6)所表达的选择。因此，图2b的步骤210优选地针对应确定Η(ω)值的每个频率箱体来重复进行。然而，可能存在以下情况对期望频率响应的最大水平的限制对于频谱的某些部分不那么有利。在与这种实现相关的实现中，应当仅针对需要对期望频率响应的最大值进行限制的频率箱体重复进行步骤210。备选地，可以在步骤205之前执行步骤207。在图2b的方法中(以及在图2a的方法中)可以包括检查值Happra (ω)是否小于期望频率响应的最小值!1_。然后，可以有利地将表达式(6)改变为如下H (ω) = max {min (Happrox (ω)，Hmax (ω)}，HffliJ (6a)或如下H (ω) = min {max (Happrox (ω), HffliJ，Hmax (ω)} (6b)使用表达式(6a)还是(6b)取决于期望Η(ω)取值Η_(ω)还是值Hmin，其中Hmin > Hfflax0与Η_(ω) —样，Hmin可以随频率改变，并且可以在不同时刻取不同值。如上所述，ΗΜΧ(ω)可以被设置为适用于所有频率和/或所有时刻的固定值。当 Η_(ω)独立于时间和频率时，Hmax < 1的值将用于限制存在话音的时刻与仅存在噪声的时刻之间在特定频率处的噪声抑制的差异，即可以减小残余噪声的波动。然后，所发生的话音失真总是至少为Hmax所确定的程度。然而，为了减小话音失真以及提高获得对噪声衰减的波动的有效减小的可能性，有利地，引入随频率和时间变化的最大期望频率响应Η_(ω)。例如，可以基于对有噪话音信号y(t)的噪声水平的测量，如有噪话音信号y(t)的信噪比SNR(co)、不同频率处话音分量估计的SNR(co)或话音分量估计· ( )的总信噪比 Sfrim等(其中“总”是指在相关频带上执行积分(见以下表达式(14)))，来导出图2的步骤205中确定的Η_(ω)的值。备选地，可以使用其他测量来确定Η_(ω)。优选地，所述其他测量应与信噪比相关例如，Η_(ω)的确定可以基于有噪话音信号y(t)在不同频率处的噪声功率电平Pn(t，ω)，或基于有噪话音信号的总噪声水平。对信号y(t)的噪声功率电平的测量可以被视为对信噪比的测量，其中假定信号功率具有特定值。Η_(ω)的值可以备选地基于有噪话音信号y(t)的功率电平，或基于有噪话音信号y(t)的任何其他测量。基于SNR(t，ω)的最坏t書况考虎的H:由于在Η(ω)在特定时间段内变化时，针对该时间段获得的估计话音分量■？( )的SNR取决于Η(ω)(见以下内容)，因此例如可以从话音分量估计邓)的SNR(co)的最坏情况考虑来导出Η_(ω)的表达式。话音分量估计的SNR ( ω )可以表达为其中Φρ Φ, Φ 分别是对所估计的话音分量i(i)、有噪话音信号y(t)和噪声分量n(t)的谱密度的估计，是对残余噪声nresidual(t)的谱密度的估计。从以上表达式(1)_(3)和⑶可以看到，瞬时地，针对特定频率ω的的 SNR(co)独立于Η(ω)(并且等于该频率处y(t)的SNR)。然而，与瞬时SNR不同，典型地，当Η(ω)在特定时间段内变化时，针对该时间段的SNR依赖于Η(ω)。为了示意这一点，考虑以下简单示例其中基于在两个不同时刻、和、采集的两个采样y(tA)和y(tB)来确定 SNR，并且在tA获得的采样包含有噪话音y(tA) =s(tA)+n(tA)；在tB处的采样仅包含噪声 y(tB) =n(tB)。假定针对特定频率ω的期望频率响应Η(ω)在不同时刻取不同值，使得 H(tA，ω)乒H(tB，ω)，基于这两个采样的针对频率ω的兴 )的SNR可以表示为显然，表达式(8a)中的SNR依赖于Η(ω)，由于H(tB，《)仅存在于表达式(8a)的
分母中。当假定话音被最大衰减并且噪声被最小衰减时给出最坏情况SNR。对于频率ω，这可以表示为为了限制最坏情况SNR，可以提供最坏情况SNR的最小值β，其中β是频率的函
数在表达式(10)中，β (ω)形成了最坏情况SNR的下限。以下将β称为容限阈值。优选地，针对所有频率，应当对容限阈值β给出大于0的值。表达式(10)得到针对Η(ω)的最大水平的以下表达式通过针对Hfflin = 0或= ci>,t(a0的特殊情况来定义Hmax ( ω ) = 0，这些情况将被(11)所涵盖。由于期望Η(ω)以及从而Η_(ω)尽可能大，以最小化话音失真，因此(11)可以
简化为容限阈值β (ω)对最坏情况SNR可以多小定义了限制。β (ω)可以取大于0的任何值。在用于移动通信的噪声抑制应用中，β (ω)的值可以例如落在-10至IOdB范围内。这种应用中β (ω)的典型值可以是_3dB，这已经被证明以合理的话音失真代价将残余噪声的波动减小至对于Η_(ω)的大多数值残余噪声不可察觉。例如，可以根据以下表达式来选择容限阈值或
的可接受失真(可以从中获得Dnt5ise和Dspradl的值的关系在以下表达式(21)和(22)中给出)。在部分或整个频率范围内，β (ω)也可以取恒定值。如果对最小化残余噪声失真赋予比最小化话音失真更高的优先级，则β应当优选地被给予较大的值，例如大约+3dB。另一方面，如果最小化话音失真比最小化残余噪声更加重要，则β应当优选地被给予较小的值，例如大约_7dB。在本发明的一个实现中，β (ω)的值可以取决于有噪话音信号在特定时间和频率处是否包含话音分量。如果在特定频率处没有话音分量，则β (ω)的值将被设置为相对较大的值；当在该特定频率处出现话音分量时，β (ω)的值可以有利地缓慢下降至明显较小的值。在话音出现时缓慢减小β (ω)的值时，实现了在不存在话音时获得高效的噪声抑制，并且在该特定频率处得到的话音失真以收听信号的人耳不会察觉到对话音分量估计的滤波的逐渐改变的方式逐渐减小。基于总信噪比的H=如上所述，可以基于对总信噪比Sk的考虑来确定Η_(ω)，其中
Hfflax的值可以例如从以下表达式获得或从以下表达式获得
(16)基于噪声功率电平Ρη( ω )的Hmax此夕卜，备选地，可以基于对噪声功率电平？ ( )的考虑来确定Η χ(ω)的值，例如通过表达式(17)或(18)中提供的关系之一Η·(ω) = a[Pn(co)rb+c(17)Η χ(ω) = alog2[Pn(W)]+b (18)基于总噪声功率电平&的H:备选地，可以基于对总噪声功率电平瓦的考虑来确定Hmax ( ω )，其中ζ是在ω 和 ω2之间的频率区域内测量的噪声功率电平。Hfflax的值可以例如从以下表达式获得或从以下表达式获得
(20)在以上表达式(15)-(20)中，a、b和c是表示可以通过实验导出合适值的常数。也可以使用确定期望频率响应的最大水平Hmax的其他方法。图3中示意了根据本发明的期望响应确定设备110的实施例。图3的期望响应确定设备Iio包括响应近似确定设备300、最大响应确定设备305和最小值选择器310。响应近似确定设备300被配置为对馈送至期望响应确定设备110的输入315的信号(即典型为有噪话音信号的线性变换Υ(ω))进行操作。此外，响应近似确定设备300被配置为基于输入信号来确定期望频率响应的近似Η_Μ(ω)。有利地，可以以用于确定期望频率响应的传统方式，例如根据上述表达式(4)来确定Η_Μ(ω)。图3的最大响应确定设备305被配置为确定期望频率响应的最大水平ΗΜΧ(ω)。在本发明的许多实施例中，最大响应确定设备305被配置为接收并操作线性变换Υ(ω)，或接收并操作有噪话音信号y(t)，以例如根据上述表达式(12)或(15)-(20)中任一项来确定。(在图3的实施例中，最大响应确定设备305被配置为接收线性变换Υ(ω))。然而，在其他实施例中，可以以其他方式来确定IU (ω)——其中之一为IU ( )取恒定值——并且可以省略图3所示的期望响应确定设备110的输入与最大响应确定设备之间的连接。在图3所示的设备中，响应近似确定设备300的输出(由此传送表的信号)和最大响应确定设备的输出(由此传送表示Η χ(ω)的信号)均连接至最小值选择器310的输入。最小值选择器310被配置为将表示Η_(ω)的信号与信号Happrax(ω)进行比较，并选择Η_(ω)与Η_Μ(ω)中的较小者。然后，最小值选择器310被配置为输出 Η_(ω)与Happrax(O)中的较小者。最小值选择器310的输出表示期望频率响应Η(ω)的值，最小值选择器310的输出连接至期望频率响应确定设备110的输出320，以便将表示期望频率响应Η(ω)的值馈送至输出320。图3的期望响应确定设备110可以包括图3中未示出的其他组件，如最大值选择器，被配置为将频率响应的值与期望频率响应的最小水平iiin( ω)进行比较，并选择所比较值的最大值。有利地，这种最大值选择器可以被配置为将Hmin( ω )与最小值选择器310的输出进行比较，在这种情况下，最大值选择器的输出可以有利地连接至期望响应确定设备110 的输出320。备选地，这种最大值选择器可以被配置为将Hmin(Co)与响应近似确定设备300 的输出进行比较，在这种情况下，最大值选择器的输出有利地连接至最小值选择器310的输入而不是将响应近似确定设备300的输出连接至最小值选择器310 (见上述表达式(6a) 和(6b))。期望响应确定设备110还可以包括如缓冲器等其他组件。期望频率响应确定设备110可以有利地由合适的计算机软件和/或硬件来实现，作为滤波器设计设备100的一部分。根据本发明的滤波器设计设备100可以有利地在用于传输话音的用户设备中实现，如移动电话、固定线路电话、无线电话机等等。滤波器设计设备100还可以在处理声学信号的其他类型的用户设备中实现，如便携式摄像机、录音电话等。在图4a中，示出了包括根据本发明的滤波器设计设备的用户设备400。用户设备400 可以被配置为根据本发明在记录声学信号时和/或在重放已经在不同时刻和/或由不同用户设备记录的声学信号时执行噪声抑制。此外，根据本发明的滤波器设计设备100可以有利地在通信网络中需要执行噪声抑制的中间节点中实现，如在IP多媒体子系统(IMS系统)中的媒体资源功能处理器 (MRFP)中、在移动媒体网关中等等。图4b示出了包括节点410的通信系统405，节点410 包括根据本发明的滤波器设计设备100。表1以及图5a和5b示意了通过根据上述表达式(4a)针对特定时间t’和频率ω ’ 来确定期望频率响应H(t’，ω ’)(图5a)以及通过根据本发明的实施例确定期望频率响应 H(t’，ω’)(图5b)而获得的仿真结果。在图5b中，使用表达式(6a)来确定H(t’，ω’)，其中使用表达式(12)来确定Hmax (t’，ω，)，其中β
，并且通过表达式(4)获得！^ ^，ω’)。在图5a中，用于获得H(t’，ω’)的方法以传统方式不对H(t’，ω)施
加上限，即= OdB。在图5a和5b所示的仿真中，均使用相关参数的以下值
并且当前时间和频率处 y(t，)的 SNR 为 10dB。可以使用以下表达式作为对残余噪声的失真Dn°ise的测量

而话音的失真Dspeeeh可以表示为
H'
(22)
Dnoise也可以用作对残余噪声的波动的测量。在图5a和5b中，指示了 5个不同信号水平
1有噪话音信号y(t’ )的功率谱密度
2噪声分量n(t’ )的功率谱密度ΦΜ( ·，乂)
3期望噪声水平- Hlin
4话音分量估计兴ο的功率谱密度χ ^Ο',αΟ一付3GW)
5:残余噪声IIresidual(t')的功率谱密度杏 (广，似，)—//2(/'，份‘) 此外，在图5a和5b中指示了多个不同信号水平差
A 有噪话音信号y(t，)的SNR(t，)以及话音分量估计的SNR(t，) (IOdB) C:话音失真-H2 (t'
ω
D 残余噪声失真
在表1中，给出了通过图5a中示意的确定Η(ω)的传统方法和图5b中示意的本发明方法获得的Dn°ise和D—的值，以及最坏情况信噪比的值。
表1.传统噪声抑制方法与根据本发明实施例的噪声抑制方法获得的噪声抑制的比较从图5a和5b所示的仿真结果以及表1可以清楚看到，本发明方法获得的残余噪声失真和最坏情况SNR优于传统噪声抑制技术所获得的残余噪声失真和最坏情况SNR。这种改进总体上是以话音失真的增大为代价而获得的。然而，在许多情况下，如果减小了残余噪声中的波动，则话音失真的增大是可接受的。此外，从以上可以清楚看到，可以容易地计算根据本发明在残余噪声与话音的失真之间进行的权衡的效果。因此，判定是否要应用本发明方法来选择滤波器配置的期望频率响应可以基于对应用本发明方法将对话音失真对残余噪声失真具有何种结果的分析来进行。这种分析可以时常进行，可以基于该分析来判定是否要应用本发明方法来确定H( )。如果发现从确定H( )的传统方式至根据本发明的方法的转换是合适的，则可以有利地逐渐进行这种转换，以实现收听者不可察觉的无缝转变。通过本发明，获得了一种灵活并且计算简单的方式来确定数字滤波器的期望频率响应H( )。通过应用该方法，可以以受控的方式来减小残余噪声的波动，并且残余噪声中的波动量与话音失真之间的必要权衡变得相当简单。本发明可以成功地应用于基于频谱减法的任何噪声减小方法。以上就有噪话音信号的噪声抑制讨论了本发明。但是本发明也可以有利地应用于其他类型的声学记录中的噪声抑制。以上将要抑制噪声的信号y(t)称为有噪话音信号，但可以是任何类型的有噪声学记录。本领域技术人员可以认识到，本发明不限于在附图中公开的实施例和以上详细描述，在附图中公开的实施例和以上详细描述仅呈现用于示意目的，可以以多种不同方式来实现本发明，本发明由所附权利要求来限定。
权利要求
一种设计数字滤波器(h(z))的方法，所述数字滤波器用于对要滤波的信号(y(t))进行噪声抑制，其中所述信号表示声学记录，所述方法包括确定所述数字滤波器的期望频率响应(H(ω))；基于期望频率响应来产生噪声抑制滤波器；所述方法的特征在于，以期望频率响应不超过最大水平的方式来确定期望频率响应，其中，所述最大水平是响应于要滤波的信号而确定的。
2.根据权利要求1所述的方法，其中所述频率响应的最大水平是频率的函数。
3.根据权利要求1或2所述的方法，其中，确定期望频率响应包括确定(205)所述频率响应的最大水平( ^χ(ω))；确定(207)所述频率响应的近似(H—(ω))；将所述近似与所述最大水平进行比较(210)；以及选择(210)所述最大水平，作为下述频率的期望频率响应的值在所述频率处，所述最大水平的值低于所述频率响应的近似的值。
4.根据权利要求3所述的方法，其中确定近似、确定最大水平、比较和选择的步骤针对至少两个不同的频率箱体重复进行。
5.根据上述任一权利要求所述的方法，其中以期望频率响应不取低于期望频率响应的最小水平的值的方式，确定期望频率响应。
6.根据权利要求5所述的方法，其中所述最大水平是根据所述最小水平来确定的。
7.根据上述任一权利要求所述的方法，其中所述最大水平是基于对要滤波的信号的噪声水平的测量来确定的。
8.根据权利要求7所述的方法，其中在特定频率处的最大水平是根据对所述特定频率处要滤波的信号的信噪比的估计来确定的。
9.根据权利要求8所述的方法，其中所述最大水平被产生为与下述公式的数值相对应的值 IH2. ΦΜ-ΦΛω)"臓⑷=匪jj卞 ⑷“，I·，其中Η_(ω)是作为频率的函数的所述最大水平，Hmin是所述频率响应的最小水平，β 是表示最大可接受信噪比的容限阈值。
10.根据权利要求9所述的方法，其中所述容限阈值的值取决于确定最大水平的频率。
11.根据权利要求7所述的方法，其中所述最大水平是根据对信噪比的总值的估计来确定的。
12.根据权利要求7所述的方法，其中在特定频率处的最大水平是根据对所述特定频率处要滤波的信号的噪声功率的估计来确定的。
13.根据权利要求7所述的方法，其中所述最大水平是根据对所述信号的噪声功率的估计来确定的。
14.一种数字滤波器设计设备(100)，被配置为设计对要滤波的信号(y(t))进行噪声抑制的数字滤波器(h(ζ))，其中所述信号表示声学记录，所述数字滤波器设计设备包括期望频率响应确定设备(110)，被配置为响应于要滤波的信号来确定期望频率响应 (Η(ω))；所述数字滤波器设计设备的特征在于，期望频率响应确定设备被配置为根据要滤波的信号，确定(305)期望频率响应的最大水平(Η_(ω))；以及以期望频率响应不超过所述最大水平的方式，确定(310)期望频率响应。
15.根据权利要求14所述的数字滤波器设计设备，其中期望频率响应确定设备(110)被配置为作为频率的函数来确定(300)期望频率响应的最大水平。
16.根据权利要求14或15所述的数字滤波器设计设备，其中，期望频率响应确定设备被配置为确定(300)期望频率响应的近似(H—(ω))；将所述频率响应的近似与所确定的最大水平进行比较(310)；以及选择(310)所述最大水平与期望频率响应的近似中的较小者作为期望频率响应的值。
17.根据从属于权利要求15的权利要求16所述的数字滤波器设计设备，其中，期望频率响应确定设备被配置为针对每个频率箱体来进行比较和选择。
18.根据权利要求14 17中任一项所述的数字滤波器设计设备，其中期望频率响应确定设备被配置为以期望频率响应不取低于最小水平的值的方式来确定期望频率响应。
19.根据权利要求18所述的数字滤波器设计设备，其中期望频率响应确定设备被配置为根据所述最小水平来确定所述最大水平。
20.根据权利要求14 19中任一项所述的数字滤波器设计设备，其中期望频率响应确定设备被配置为基于对要滤波的信号的噪声水平的测量来确定所述最大水平。
21.一种用于处理声学信号的用户设备(400)，所述用户设备包括根据权利要求14 20中任一项所述的数字滤波器设计设备。
22.一种通信系统(405)中用于对表示语音的信号进行中继的节点(410)，所述节点包括根据权利要求14 20中任一项所述的数字滤波器设计设备(100)。
23.一种用于设计数字滤波器(h(z))的计算机程序产品，所述数字滤波器用于对要滤波的信号(y(t))进行噪声抑制，其中所述信号表示声学记录，所述计算机程序产品包括在计算机上运行时，适于确定所述数字滤波器的期望频率响应(Η(ω))的计算机程序代码部分(110)；在计算机上运行时，适于基于期望频率响应来产生噪声抑制滤波器的计算机程序代码部分(112)；所述计算机程序产品的特征在于，适于确定期望频率响应的计算机程序代码部分被配置为以期望频率响应不超过最大水平的方式来确定(300、305、310)期望频率响应，其中，所述最大水平是响应于要滤波的信号而确定的。
全文摘要
本发明涉及一种数字滤波器的方法和设备，所述数字滤波器用于对表示声学记录的信号进行噪声抑制。所述方法包括确定所述数字滤波器的期望频率响应(H(ω))；基于期望频率响应来产生噪声抑制滤波器。以期望频率响应不超过最大水平的方式来确定期望频率响应，其中，所述最大水平是响应于要滤波信号来确定的。
文档编号G10L21/02GK101904097SQ200780102005
公开日2010年12月1日申请日期2007年12月20日优先权日2007年12月20日
发明者佩尔·阿格伦, 安德尔斯·埃里克松申请人:艾利森电话股份有限公司

本文推荐噪声抑制方法和设备的制作方法仅代表作者观点，不代表本网站立场。本站对作者上传的所有内容将尽可能审核来源及出处，但对内容不作任何保证或承诺。请读者仅作参考并自行核实其真实性及合法性。如您发现图文视频内容来源标注有误或侵犯了您的权益请告知，本站将及时予以修改或删除。未经允许不得转载：http://www.pinpai35.com/1656562118.html

当前位置：网站首页>专利 >正文

噪声抑制方法和设备的制作方法

相关推荐