专利名称:噪声估算方法和设备的制作方法
技术领域:
本发明涉及到一种用于估算叠加在所需要的话音信号上的噪声的方法和设备。
背景技术:
噪声抑制器是抑制叠加在所需要的话音信号上的噪声的设备。噪声抑制器进行工作,以便利用已经转变成频域信号的输入信号来估算噪声分量的功率谱,并且从输入信号中减去估算的噪声功率谱,从而抑制与所需要的话音信号混在一起的噪声。噪声抑制器可以通过检测话音的无声部分以及更新噪声分量的功率谱来抑制非稳定性噪声。
一种噪声抑制器公开发表在1984年12月IEEE(电气与电子工程师协会)声学、话音、和信号处理的论文集中,32卷编号6,1109到1121页(参考文献1)。在这篇文章中,所述噪声抑制器使用通常所说的最小均方误差快速频谱幅度处理技术。图1显示描述在参考文献1中的噪声抑制器结构。包含所需要的话音信号与噪声混合的信号在下文中将称为有噪声的话音信号。
图1显示的噪声抑制器包括输入端11、帧分解单元1、窗口单元2、傅里叶变换单元3、话音激活检测器4、噪声估算单元51、频率-相关信噪比(SNR)计算器6、先验信噪比估算器7、频谱增益产生器8、傅里叶逆变换单元9、帧综合单元10、输出端12、计数器13、和多路复用乘法器16、17。在该噪声抑制器中,输入端11提供有噪声的话音信号作为采样的序列。然后,有噪声的话音信号的采样值提供给帧分解单元1,它将有噪声的话音信号分离成具有K/2个采样的帧,其中K表示偶数。被分离成帧的有噪声话音信号的采样提供给窗口单元2,将它们乘上窗口函数w(t)。通过利用w(t)窗口操作输入信号yn(t)(t=0、1、...、k/2-1)的第n帧而产生的信号yn(t)用下面的方程式来表示yn(t)=w(t)yn(t) (1)在该噪声抑制器中,通常重叠以及窗口操作连续的两帧。如果假设帧长的50%用作为重叠长度,则窗口单元2输出的yn(t)(t=0、1、...、K-1),用方程式(2)、(3)表示yn(t)=w(t)yn-1(t) (2)yn(t+K/2)=w(t+K/2)yn(t) (3)在以下描述中,假定50%重叠。汉明窗口用方程式(4)表示,例如,可以用w(t) 窗口输出的yn(t)提供给傅里叶变换单元3,它将窗口输出yn(t)转换成有噪声的话音频谱Yn(k)。有噪声的话音频谱Yn(k)被分成一个相位和一个幅度。有噪声的话音相位谱arg Yn(k)提供给傅里叶逆变换单元9,有噪声的话音频谱幅度|Yn(k)|提供给话音激活检测器4,多路复用乘法器16、和多路复用乘法器17。
话音激活检测器4根据有噪声的话音|Yn(k)|的频谱幅度来确定话音是否存在,并且将一个根据确定结果设置的话音激活检测标志传输给噪声估算单元51。多路复用乘法器17利用提供的有噪声话音|Yn(k)|的频谱幅度计算有噪声的话音功率谱,并且将计算的噪声话音功率谱提供给噪声估算单元51和频率-相关信噪比计算器6。
噪声估算单元51利用话音激活检测标志、有噪声话音功率谱、和计数器13提供的计数值来估算噪声功率谱,并且将估算的功率谱传输给频率-相关信噪比计算器6作为估算的噪声功率谱。频率-相关信噪比计算器6通过利用有噪声话音功率谱和已经提供的估算噪声功率谱为每个频率计算信噪比,并且提供该计算的信噪比作为后验信噪比给先验信噪比估算器7和频谱增益产生器8。
先验信噪比估算器7利用提供的后验信噪比以及从频谱增益产生器8提供的频谱增益来估算先验信噪比,并且将估算的先验信噪比作为反馈提供给频谱增益产生器8。
频谱增益产生器8利用后验信噪比和作为输入提供的估算先验信噪比产生一个频谱增益,并且将频谱增益作为反馈提供给先验信噪比估算器7,而且还将生成的噪声频谱增益传输给多路复用乘法器16。
多路复用乘法器16利用频谱增益产生器8提供的频谱增益 加权傅里叶变换单元3提供的有噪声话音|Yn(k)|的频谱幅度,从而确定增强话音|Xn(k)|的频谱幅度,并且将增强话音|Xn(k)|的频谱幅度传输给傅里叶逆变换单元9。增强的话音|Xn(k)|用方程式(5)表示|X‾n(k)|=G‾n(k)|Yn(k)|----(5)]]>傅里叶逆变换单元9将多路复用乘法器16提供的增强话音|Xn(k)|的频谱幅度与傅里叶变换单元3提供的有噪声话音相位谱arg Yn(k)彼此相乘,因此确定增强的话音Xn(k)。即,傅里叶逆变换单元9根据方程式(6)执行计算Xn(k)=|Xn(k)|arg Yn(k)(6)傅里叶逆变换单元9在产生的增强话音Xn(k)上执行傅里叶逆变换,产生一个时域的采样序列xn(t)(t=0、1、...、K-1),其中一帧由K个采样值组成,并且传输该时域采样xn(t)给帧综合单元10。帧综合单元10从xn(t)相邻的两帧取出k/2个采样值,并且叠加该k/2个采样值,根据方程式(7)产生增强话音 产生的增强话音 (t=0、1、...、K-1)作为帧综合单元10的输出传送到输出端12。
x^n(t)=x-n-1(t+K/2)+x‾n(t)----(7)]]>参考文献1没有详细地公开如何实现包含在图1所示噪声抑制器中的话音激活检测器4。然而,能够用于噪声抑制器中的话音激活检测器的一个例子可以从“日本声学协会的国家会议的会刊,2000年3月,321-322页(参考文献2)”获得。参考文献2中所示的话音激活检测器将作为一个话音激活检测器4的常规实施例子描述如下。如图2所示,话音激活检测器4包括阈值存储器401、比较器402、乘法器404、对数计算器405、功率计算器406、加权加法器407、加权存储器408、和非门电路409。
在话音激活检测器4中,傅里叶变换单元3(图1)提供的有噪声话音的频谱幅度提供给功率计算器406。功率计算器406计算有噪声话音从k=0到k-1的频谱幅度功率|Yn(k)|2之和,并且将计算的和传送给对数计算器405。对数计算器405确定提供的有噪声话音频谱功率的对数,并且提供该对数给乘法器404。乘法器404用一个常数乘以提供的对数以便确定有噪声话音功率Qn,并且提供该有噪声话音功率给比较器402和加权加法器407。具体地,第n帧中的有噪声话音功率Qn是用下面方程式表示Qn=10log10(Σt=0K-1|Yn(k)|2----(8)]]>在参考文献2中公开的话音激活检测器根据方程式(9),利用时域采样yn(t)来确定Qn。
Qn=10log10(Σt=0K-1|y‾n2(t)|2----(9)]]>如Corona,1985发表的“数字信号处理”(参考文献3)中,75-76页所描写,众所周知方程式(8)和(9)根据巴塞伐尔定理(Parseval)是等效的。
阈值存储器401提供一个阈值THn给比较器402。比较器402将乘法器404的输出与阈值THn进行比较。如果THn>Qn,则比较器402输出“1”表示话音部分,而如果THn≤Qn,则比较器402输出“0”表示无声部分,作为一个话音激活检测标志。比较器402的输出被用作为话音激活检测的标志,并且也提供给非门电路409。非门电路409提供它的输出给加权加法器407作为加权加法器的控制信号905。加权加法器407由阈值存储器401提供阈值902以及由加权存储器408提供加权903。
加权加法器407根据加权加法器控制信号905有选择地更新从阈值存储器401提供的阈值902,并且将更新阈值904作为反馈提供给阈值存储器401。利用来自加权存储器408的加权903,通过执行阈值THn-1与有噪声话音功率901的加权相加来确定更新的阈值THn。更新的阈值THn只有在非门电路409输出的加权加法器控制信号905等于“1”时才计算,即,仅仅在无声部分期间计算。因此,更新的阈值904作为反馈提供给阈值存储器401。
如图3所示,功率计算器406具有多路信号分离器4061、K个乘法器40620到4062k-1和加法器4063。傅里叶变换单元3(图1)提供的有噪声话音的多路复用频谱幅度由多路信号分离器4061分离成频率-相关的K个采样,其分别提供给乘法器40620到4062k-1。乘法器40620到4062k-1分别平方提供的输入信号,并且将平方后的信号传送给加法器4063,这确定输入信号的总和并且将该计算的和输出。
如图4所示,加权加法器407具有乘法器4071、4073、常数乘法器4075,和加法器4072、4074。来自乘法器404(图2)的有噪声话音功率901,来自阈值存储器401(图2)的阈值902,来自加权存储器408(图2)的加权903以及来自非门电路409(图2)的加权加法器控制信号905都作为输入提供给加权加法器407。具有值β的加权903被传输到常数乘法器4075和乘法器4073。常数乘法器4075用-1乘上输入信号而产生一个值-β,并且将该值-β传送给加法器4074,还提供1作为另一个输入。因此,加法器4074输出和1-β,该和再提供给乘法器4071。另一方面,乘法器4071用有噪声话音功率Qn乘以总和1-β作为另一个输入,产生一个传输到加法器4072的乘积(1-β)Qn。乘法器4073用阈值902乘以作为加权903提供的值β,并且传送乘积βTHn-1给加法器4072。加法器4072将βTHn-1与(1-β)Qn相加,并且输出该和作为更新阈值904。更新的阈值THn只有在加权加法器控制信号905等于“1”时才计算。即,加权加法器407具有更新THn-1的功能以便在根据下列方程式中β表示的加权903数值期间确定THnTHn=THn,THn≥QnβTHn-1+(1-β)Qn,THn<Qn----(10)]]>图5显示包含在图1所示噪声抑制器中的多路复用乘法器17的结构例子。多路复用乘法器17具有K个乘法器17010到1701k-1、信号分离器1702、1703,和多路复用器1704。在多路复用乘法器17中,傅里叶变换单元3(图1)提供的有噪声话音的多路复用频谱幅度通过信号分离器1702、1703分离成为频率-相关的K个采样,它们分别提供给乘法器17010到1701k-1。乘法器17010到1701k-1分别平方提供的输入信号,并且将平方的信号传输给多路复用器1704,它多路复用这些输入信号并且输出该多路复用信号作为有噪声话音功率谱。
如图6所示,包含在图1所示噪声抑制器中的噪声估算单元51具有信号分离器502、多路复用器503、和K个频率-相关噪声估算单元5140到514k-1。在噪声判断单元51中,话音激活检测器4(图1)提供的话音激活检测标志和计数器13(图1)提供的计数值都被传输给频率-相关噪声估算单元5140到514k-1。多路复用乘法器17(图1)提供的有噪声话音功率谱被传输到信号分离器502。信号分离器502将提供的多路复用有噪声话音功率谱分离成为K个频率-相关分量,并且将K个频率-相关分量分别地传输到频率-相关噪声估算单元5140到514k-1。频率-相关噪声估算单元5140到514k-1利用从信号分离器502提供的有噪声话音功率谱计算这些噪声功率谱分量,并且将计算的噪声功率谱分量传输给多路复用503。噪声功率谱的计算是通过计数值和话音激活检测标志的值来控制的,而且只有在预定状态满足时才执行。多路复用器503多路复用提供的K个噪声功率谱分量,并且将多路复用的噪声功率谱当作估算噪声功率谱输出。
图7显示包含在噪声判断单元51(图6)中的频率-相关噪声估算单元5140到514k-1的结构。因为频率-相关噪声估算单元5140到514k-1在结构上彼此是相同的,所以在图7中它们就表示为频率-相关噪声估算单元514。在参考文献2中公开的噪声估算算法用来更新无声部分中的估算噪声值,并且使用由递归滤波器平均的估算噪声瞬时值作为估算噪声值。另一个噪声估算算法是公开发表在1998年5月,IEEE话音与音频处理的论文集,卷6编号3,287-292页(参考文献4),其描述取平均和使用的估算噪声瞬时值。参考文献4建议利用横向滤波器实现平均处理,即,滤波器包括移位寄存器,而不是递归滤波器。因为上述两者的实现具有同等的功能,所以参考文献4中公开的处理将描述如下。
频率-相关噪声估算单元514具有更新判断单元521、寄存器长度存储器5041、开关5044、移位寄存器4045、加法器5046、最小值选择器5047、分离器5048,和计数器5049。来自多路分解器502(图6)的频率-相关有噪声话音功率谱提供给开关5044。当开关5044关合其电路时,频率-相关有噪声话音功率谱被传输给移位寄存器5045。响应更新判断单元521的控制信号,移位寄存器5045将内部寄存器单元中的存储数值移到相邻的寄存器单元。移位寄存器5045的长度等于存储在寄存器长度存储器5941中的数值。来自移位寄存器5045的全部内部寄存器单元的输出提供给加法器5046。加法器5046将来自所有内部寄存器单元提供的输出相加,并且将其和传输给除法器5048。
另一方面,来自计数器13的计数值和来自话音激活检测器4的话音激活检测标志提供给更新判断单元521。更新判断单元521总是输出“1”直到计数值达到一个预定值。在计数值达到这预定值后,当话音激活检测标志是“0”时,即在无声部分期间,更新判断单元521输出“1”,否则输出“0”。更新判断单元521将它的输出传输给计数器5049、开关5044,和移位寄存器5045。当更新判断单元521提供信号是“1”时,开关5044闭合它的电路,而当更新判断单元521提供的信号是“0”时,断开它的电路。当更新判断单元521提供信号是“1”时,计数器5049增加它的计数值,而当从更新判断单元521提供的信号是“0”时,不改变它的计数值。当更新判断单元521提供的信号是“1”时,移位寄存器5045从开关5044读取一个采样信号并且将内部寄存器单元的存储数值移位到相邻的寄存器单元。
计数器5049的输出和寄存器长度存储器5941的输出提供给最小值选择器5047。最小值选择器5047选择提供的计数值与寄存器长度中较小的一个,并且将选择值传输给除法器5048。除法器5048用计数值和寄存器长度中较小的一个除加法器5046提供的频率-相关有噪声话音功率谱的和,并且输出这个商作为频率-相关估算噪声功率谱λn(k)。如果存储在移位寄存器5045的频率-相关有噪声话音功率频谱分量的采样值用Bn(k)(n=0、1、...、n-1)表示,则该频率-相关估算噪声功率谱λn(k)用方程式(11)表示λn(k)=1NΣn=0N-1Bn(k)----(11)]]>其中N表示计数值和寄存器长度中较小的一个。因为计数值单调地从零开始增加,所以除法操作开始是利用计数值来执行然后再利用寄存器长度来执行。利用寄存器长度执行除操作意味着确定移位寄存器中存储数值的平均值。开始,因为没有足够多的数值存储在移位寄存器5045中,所以将频率-相关有噪声话音功率谱的和除以实际存储数值的寄存器单元的数量。当计数值小于寄存器长度时,实际存储数值的寄存器单元数量等于计数值,而当计数值变得比寄存器长度大时,它等于寄存器长度。
图8显示更新判断单元521的结构。更新判断单元521具有非门电路5202、比较器5203、阈值存储器5204,和或门电路5211。在更新判断单元521中,计数器13(图1)提供的计数值被传输到比较器5203。阈值存储器5204输出的阈值也提供给比较器5203。比较器5203将提供的计数值和提供的阈值相互比较。如果计数值是小于阈值,则比较器5203传输“1”给或门电路5211,而如果计数值大于阈值,则比较器5203传输“0”给或门电路5211。提供给更新判断单元521的话音激活检测标志被传输到非门电路5202,它确定输入信号的逻辑反向值并且将该反向值传输给或门电路5211。具体地说,非门电路5202将“0”传输给话音激活检测标志是“1”的话音部分中的或门电路5211,而将“1”传输给话音激活检测标志是“0”的无声部分中的或门电路5211。结果,在话音激活检测标志是“0”的无声部分期间或者当计数值小于阈值时或门电路5211输出“1”,图7显示的开关闭合而且总计计数器5049。
图9显示包含在图1所示噪声抑制器中的频率-相关信噪比计算器6的结构例子。频率-相关信噪比计算器6具有K个除法器、6010到601k-1、多路分解器602、603,和多路复用器604。在频率-相关信噪比计算器6中,多路复用乘法器17(图1)提供的有噪声话音功率谱被传输到多路分解器602。噪声估算单元51(图1)提供的估算噪声功率谱被传输到多路分解器603。有噪声话音功率谱通过多路分解器602分成对应于各个频率分量的K个采样,而该K个采样提供给各个除法器6010到601k-1。估算的噪声功率谱通过多路分解器603被分成对应于各个频率分量的K个采样,而该K个采样提供给各个除法器6010到601k-1。除法器6010到601k-1用提供的估算噪声功率谱除提供的有噪声话音功率谱,从而根据方程式(12)确定频率-相关信噪比γn(k),并且将频率-相关信噪比γn(k)传输给多路复用器604
γn(k)=|Yn(k)|2λn(k)----(12)]]>其中λn(k)表示估算的噪声功率谱。多路复用器604多路复用传输的K个频率-相关信噪比,并且输出该多路复用的信噪比作为后验信噪比。
如图10所示,包含在图1所示的噪声抑制器中的先验信噪比估算器7具有多路复用的范围限制处理器701、后验信噪比存储器702、频谱增益存储器703、多路复用乘法器704、705、加权存储器706、多路复用加权加法器707,和加法器708。
在先验信噪比估算器7中,频率-相关信噪比计算器6(图6)提供的后验信噪比γn(k)(k=0、1、...、K-1)被传输到后验信噪比存储器702和加法器708。后验信噪比存储器702存储第n帧中的后验信噪比γn(k)而且传输第(n-1)帧中的后验信噪比γn-1(k)到多路复用乘法器705。频谱增益产生器8提供的频谱增益 (k=0、1、...、K-1)被传输到频谱增益存储器703。频谱增益存储器703存储第n帧中的频谱增益 而且将第(n-1)个帧中的频谱增益Gn-1(k)传输给多路复用乘法器704。多路复用乘法器704平方提供的频谱增益Gn-1(k)以确定G2n-1(k)并且传输G2n-1(k)给多路复用乘法器705。多路复用乘法器705将G2n-1(k)与γn-1(k)(k=0、1、...、k-1)相乘以便确定G2n-1(k)γn-1(k),并且将G2n-1(k)γn-1(k)作为估算后信噪比922传送给多路复用加权加法器707。多路复用乘法器704、705在结构上与参考图5已经描述的多路复用乘法器17相同,因此这里将不再描述。
加法器708的另外一端被提供-1,因此和γn(k)-1被传输到多路复用范围限制处理器701。多路复用范围限制处理器701利用范围限制算子P[.]处理加法器708提供的和γn(k)-1,于是传送该结果P[γn(k)-1]作为瞬时估算信噪比921给多路复用加权加法器707。P[x]定义如(13) 多路复用加权加法器707还提供来自加权存储器706的加权923。多路复用加权加法器707利用在此提供的瞬时估算信噪比921,估算后信噪比922,和加权923确定估算的先验信噪比924。如果加权923用α表示而估算的先验信噪比924用 表示,则 根据方程式14)计算ξ^n(k)=αγn-1(k)G‾n-12(k)+(1-α)P[γn(k)-1]----(14)]]>其中G‾-12(k)γ-1(k)=1]]>如图11所示,上面描述的多路复用范围限制处理器701具有常数存储器7011、K个最大值选择器70120到7012k-1、多路信号分离器7013,和多路复用器7014。在多路复用范围限制处理器701中,多路信号分离器7013提供来自加法器708(图10)的γn(k)-1。多路复用分离器7013分解提供的γn(k)-1到K个频率-相关分量而且分别提供这些频率-相关分量给最大值选择器70120到7012k-1,它们的另外一个输入端提供来自常数存储器7011的零。最大值选择器70120到7012k-1将γn(k)-1与零相比较,并且传送较大的值给多路复用器7014。这个最大值选择计算对应于根据方程式(13)的计算。多路复用器7014多路复用这些提供的数值并且输出这些多路复用值。
如图12所示,多路复用加权加法器707具有K个加权加法器70710到7071k-1,多路信号分离器7072、7074,和多路复用器7075。在多路复用加权加法器707中,来自多路复用范围限制处理器701(图10)的P[γn(k)-1]作为瞬时估算信噪比921提供给多路信号分离器7072。多路复用分离器7072分离P[γn(k)-1]到K个频率-相关分量,并且将这些频率-相关分量作为频率-相关瞬时估算的信噪比9210到921k-1传送给各个加权加法器70710到7071k-1。来自多路复用乘法器705图10)作为估算后信噪比922的G2n-1(k)γn-1(k)提供给多路分解器7074。多路分解器7074分离G2n-1(k)γn-1(k)为K个频率-相关分量,并且将这些频率-相关分量作为过去频率相关估算信噪比9210到921k-1传输给各个加权加法器70710到7071k-1。加权加法器70710到7071k-1还提供加权923。加权加法器70710到7071k-1根据方程式(14)执行加权加法,并且将结果作为频率-相关估算先验信噪比9240到924k-1传输给多路复用器7075。多路复用器7075多路复用频率-相关估算先验信噪比9240到924k-1,并且输出多路复用的结果作为估算的先验信噪比924。每个加权加法器70710到7071k-1的操作和结构都与上面已经描述的参考图4的加权加法器407相同,所以不再详细描述。然而,该加权加法总是在计算。
图13显示包含在图1所示噪声抑制器中的频谱增益产生器8的结构例子。频谱增益产生器8具有K个频谱增益探测装置8010到801k-1、多路信号分离器802、803,和多路复用器804。在频谱增益产生器8中,来自频率-相关信噪比计算器6(图1)的后验信噪比提供给多路信号分离器802。多路复用分离器802分离提供的后验信噪比成K个频率-相关分量并且将这些K个频率-相关分量分别地传送到频谱增益探测装置8010到801k-1。来自先验信噪比估算器7(图1)的估算先验信噪比提供给多路信号分离器803。多路信号分离器803分离提供的估算先验信噪比成K个频率-相关分量并且分别传送这些K个频率-相关分量到频谱增益探测装置8010到801k-1。频谱增益探测装置8010到801k-1搜索对应于后验信噪比和已经提供的估算先验信噪比的频谱增益,并且将该结果传送给多路复用器804。多路复用器804多路复用提供的频谱增益而且输出该多路复用的结果。
图14显示频谱增益探测装置8010到801k-1结构的例子。因为频谱增益探测装置8010到801k-1在结构上彼此是相同的,所以它们表示为图14中频谱增益探测装置801。频谱增益探测装置801具有频谱增益表8011和地址变换器8012、8013。在频谱增益探测装置801中,来自多路信号分离器802(图13)的频率-相关后验信噪比提供给地址变换器8012。地址变换器8012将提供的频率-相关后验信噪比转换成为相应的地址,并且传送该地址给频谱增益表8011。多路信号分离器803(图13)的频率-相关估算先验信噪比提供给地址变换器8013。地址变换器8013将提供的频率-相关估算先验信噪比转换成为相应的地址,并且传送该地址给频谱增益表8011。频谱增益表8011输出存储在对应于地址变换器8012和地址变换器8013提供的地址所在区域的频谱增益,作为频率相关频谱增益。
常规的噪声抑制器上面已经描述。关于上面描述的常规噪声抑制器,噪声功率谱是根据话音激活检测器的输出在无声部分中更新。因此,如果来自话音激活检测器的检测结果不正确,则不能准确地估算噪声的功率谱。当话音部分长久持续时,因为没有无声部分存在,所以噪声功率谱不能更新,由此非稳定噪声功率谱的估算精度不可避免地降低。因此,常规的噪声抑制器具有残留噪声以及在增强话音上有失真。
根据常规的抑制算法,噪声功率谱是利用有噪声的话音功率谱来估算。因此,对于常规算法,噪声功率谱在包含有噪声话音中的话音功率谱影响下不能精确地估算,所以噪声趋向保持而失真趋向被引进增强的话音。此外,根据常规的噪声抑制算法,因为噪声抑制是利用频谱增益来完成的,该频谱增益由独立于信噪比的相同计算方法而确定,所以对于增强的话音不能获得足够高的质量。
发明内容
本发明的目的是提供一种噪声抑制方法,通过与话音激活检测器性能无关的精确地估算噪声功率谱,以便产生具有减少失真和噪声的增强话音。
本发明的另一个目的是提供一种用于噪声抑制的设备,通过不受话音激活检测器性能控制的精确地估算噪声功率谱,以便产生具有减少失真和噪声的增强话音。
本发明还有一个目的是提供一种噪声抑制方法,甚至在噪声是非平稳的状态时,该方法通过精确地估算噪声功率谱,以便产生减少失真和噪声的增强话音。
还有,本发明的另一个目的是提供一种用于噪声抑制的设备,甚至当噪声是非平稳状态时,该装置通过精确地估算的噪声功率谱,以便产生具有减少失真和噪声的增强话音。
本发明另外的目的是提供一种噪声抑制方法,以便利用相对于所有信噪比值的最佳频谱增益来产生具有减少失真和噪声的增强话音。
本发明还有一个目的是提供一种用于噪声抑制的设备,以便利用相对于所有信噪比值的最佳频谱增益来产生具有减少失真和噪声的增强话音。
根据本发明的第一个方面,提供一种噪声抑制的方法,其包括步骤将输入信号转换到频域并且根据频域的信号确定信噪比,根据信噪比确定频谱增益,根据信噪比修正频谱增益以便产生一个修正的频谱增益,利用修正的频谱增益来加权频域的信号以确定第二频域信号,以及将第二频域信号转换成时域信号,以便产生噪声已经被抑制的输出信号。
根据本发明的第二个方面,提供一种噪声抑制的设备,它包括信噪比计算器,其用于将输入信号转换到频域并且利用频域信号来确定信噪比;频谱增益产生器,其用于根据信噪比来确定频谱增益;频谱增益修正单元,其用于根据信噪比修正频谱增益以便产生一个修正的频谱增益;乘法器,其利用修正的频谱增益来加权频域信号以便确定第二频域信号;逆变器,其用于将第二频域信号转换成时域信号。
在上述噪声抑制的设备和方法中,噪声是利用依靠信噪比(SNR)的值修正的频谱增益来抑制。具体地说,为噪声抑制的设备具有频谱增益修正单元,其接收信噪比和频谱增益的数值并且计算修正的频谱增益。通过依靠信噪比值利用修正的频谱增益来制止噪声,根据本发明可能获得遭受少量失真以及相对全部信噪比值遭受较小噪声的增强话音。
根据本发明的第三个方面,提供一种噪声抑制的方法,其包括步骤将输入信号转换到频域并且加权频域信号以便确定加权的频域信号,利用加权的频域信号估算噪声,利用估算的噪声和频域信号确定信噪比,根据信噪比确定频谱增益,利用频谱增益来加权频域信号以确定第二频域信号,以及转换该第二频域信号到时域信号以便产生噪声已经被抑制的输出信号。
根据本发明的第四个方面,提供一种噪声抑制的设备,至少包括信噪比计算器,其用于将输入信号转换到频域并且利用频域信号来确定信噪比;频谱增益产生器,其用于根据该信噪比来确定频谱增益;乘法器,其利用频谱增益来加权频域信号以确定第二频域信号;以及逆变器,其用于转换第二频域信号到时域信号,其中信噪比计算器包括一个加权频域信号计算器,其用于加权频域信号以便确定加权频域信号;噪声判断单元,其利用加权频域信号来估算噪声。
在上述噪声抑制的方法和设备中,噪声的功率谱是利用加权频域信号(即,加权有噪声的话音功率谱)估算的。尤其是,对于噪声抑制的设备具有加权频域信号的计算器(即,加权有噪声话音的计算器),其计算来自有噪声话音功率谱的加权噪声话音功率谱以及估算的噪声功率谱。因为当前帧中噪声功率谱是利用加权噪声话音功率谱和前面帧中估算的噪声功率谱来估算,该加权噪声话音功率谱来自噪声话音功率谱,所以可能精确地估算噪声的功率谱而与噪声的性质无关,从而产生遭受少量失真和噪声的增强话音。
根据本发明的第五个方面,提供一种估算噪声的方法,其包括步骤利用输入信号和在确定加权时存在的估算的噪声确定信噪比,利用信噪比确定加权,利用权重加权输入信号以便确定加权的输入信号,以及根据加权的输入信号确定估算的噪声。
根据本发明的第六个方面,提供一种估算噪声的设备,它包括信噪比计算器,其利用输入信号和在确定加权时存在的估算的噪声确定信噪比;加权计算器,其用于根据该信噪比确定加权;输入信号计算器,其利用权重加权输入信号以便确定加权的输入信号;以及噪声估算单元,其用于根据加权的输入信号确定估算的噪声。
图1是显示常规噪声抑制器的结构方框图;图2是显示包含在图1所示噪声抑制器中的话音激活检测器的结构方框图;图3是显示包含在图2所示噪声抑制器中的功率计算器的结构方框图;图4是显示包含在图2所示话音激活检测器中的加权加法器的结构方框图;图5是一个显示包含在图1所示噪声抑制器中的多路复用乘法器的结构方框图;图6是显示包含在图1所示噪声抑制器中的噪声估算单元的结构方框图;图7是显示包含在图6所示噪声估算单元中的频率-相关噪声估算单元的结构方框图;图8是显示包含在图7所示频率-相关噪声估算单元的更新判断单元的结构方框图;
图9是显示包含在图1所示噪声抑制器中的频率-相关信噪比计算器的结构方框图;图10是显示包含在图1所示噪声抑制器中的频率-先验信噪比估算器的结构方框图;图11是显示包含在图10所示频率-先验信噪比估算器中的多路复用范围限制处理器的结构方框图;图12是显示包含在图10所示频率-先验信噪比估算器中的多路复用加权加法器的结构方框图;图13是显示包含在图1所示噪声抑制器中的频谱增益产生器的结构方框图;图14是显示包含在图13所示频谱增益产生器中的频谱增益测试单元的结构方框图;图15是显示根据本发明第一实施例的噪声抑制器结构方框图;图16是显示包含在图15所示噪声抑制器中的加权噪声话音计算器的结构方框图;图17是显示包含在加权噪声话音计算器中的多路复用非线性处理器的结构方框图;图18是显示使用多路复用非线性处理器的非线性函数例子的图;图19是显示包含在图15所示噪声抑制器中的噪声估算单元的结构方框图;图20是显示包含在图19所示噪声估算单元中的频率-相关噪声估算单元的结构方框图;图21是显示包含在图20所示频率-相关噪声估算单元的更新判断单元的结构方框图;图22是显示包含在图19所示噪声估算单元中的频率-相关噪声估算单元的结构方框图;图23是显示包含在图15所示噪声抑制器中的频谱增益修正单元的结构方框图;图24是显示包含在图23所示频谱增益修正单元中的频率-相关频谱增益修正单元的结构方框图;
图25是显示频谱增益产生器结构的第二个例子的方框图;图26是显示可以代替图15所示噪声抑制器中的频率-相关信噪比计算器的频率-带宽-相关信噪比计算器的结构方框图;图27是显示包含在图26所示频率-带宽-相关信噪比计算器中的频率-带宽-相关功率计算器的结构方框图;图28是显示根据本发明第二实施例的噪声抑制器结构方框图;图29是显示包含在图28所示噪声抑制器中的噪声估算单元的结构方框图;图30是显示包含在图29所示噪声估算单元中的频率-相关噪声估算单元的结构方框图;图31是显示根据本发明第三实施例的噪声抑制器结构方框图;图32是显示包含在图31所示噪声抑制器中的频率-先验信噪比估算器的结构方框图;图33是显示根据本发明第四实施例的噪声抑制器结构方框图;图34是显示根据本发明第五实施例的噪声抑制器结构方框图;图35是显示包含在图34所示噪声抑制器中的噪声估算单元的结构方框图;图36是显示包含在图35所示噪声估算单元中的频率-相关噪声估算单元的结构方框图;以及图37是显示包含在图36所示频率-相关噪声估算单元中的更新判断单元的结构方框图。
具体实施例方式
根据图15显示的本发明第一实施例的噪声抑制器与图1显示常规的噪声抑制器类似,但是不同的是噪声估算单元具有不同的内部结构,而且增加了加权有噪声话音计算器14和频谱增益修正单元15。具体地说,根据第一实施例的噪声抑制器用噪声估算单元5代替图1所示噪声抑制器中的噪声估算单元51。加权有噪声话音计算器14计算来自有噪声话音功率谱的加权有噪声话音功率谱和估算的噪声功率谱,并且将该计算的加权有噪声话音功率谱输出到噪声估算单元5。频谱增益修正单元15根据频谱增益和估算的先验信噪比计算修正的频谱增益。用修正的频谱增益代替由频谱增益产生器8产生的频谱增益提供给多路复用乘法器16和先验信噪比估算器7。话音激活检测器4、噪声估算单元5、频率-相关信噪比计算器6、计数器13、加权有噪声话音计算器14,以及多路复用乘法器17共同组成信噪比计算器101。先验信噪比估算器7和频谱增益产生器8共同组成频谱增益产生单元102。
在以下描述中,用参考字符表示的那些分量与图1到14中所示的一样。根据本实施例的噪声抑制器,主要相对于常规噪声抑制器的不同描述如下。
如图16所示,加权有噪声话音计算器14具有估算噪声存储器1401、频率-相关信噪比计算器1402、多路复用非线性处理器1405,和多路复用乘法器1404。估算噪声存储器1401存储从噪声估算单元5(图15)提供的估算噪声功率谱,并且将存储的先前帧中估算噪声功率谱输出给频率-相关信噪比计算器1402。频率-相关信噪比计算器1402,利用估算噪声存储器1401提供的估算噪声功率谱和多路复用乘法器17(图15)提供的有噪声话音功率谱,为每个频率计算信噪比,并且输出计算的信噪比到多路复用非线性处理器1405。多路复用非线性处理器1405利用从频率-相关信噪比计算器1402提供的信噪比来计算加权因子矢量,并且输出该加权因子矢量给多路复用乘法器1404。多路复用乘法器1404计算从多路复用乘法器17(图16)提供的有噪声话音功率谱每个频率的乘积,以及计算来自多路复用非线性处理器1405提供的加权因子矢量,并且输出加权有噪声话音功率谱给估算噪声存储器5(图15)。加权有噪声话音功率谱对应于加权的振幅分量。
在加权有噪声话音计算器14中,频率-相关信噪比计算器1402在结构上与上面描述的参考图9的频率-相关信噪比计算器6相同,并且多路复用乘法器1404在结构上与上述参考图5中多路复用乘法器17相同。因此,将不再详细描述。
包含在加权有噪声话音计算器14中的多路复用非线性处理器1405的构造细节与工作将参考图17在下面进行详细描述。如图17所示,多路复用非线性处理器1405具有多路分解器1495、K个非线性处理器14850到1485k-1,和多路复用器1475。多路分解器1495分离从频率-相关信噪比计算器1402(图16)提供的信噪比成频率-相关信噪比,并且分别输出频率-相关信噪比给非线性处理器14850到1485k-1。根据非线性函数,非线性处理器14850到1485k-1输出取决于输入数值的实际价值数。图18显示一个非线性函数例子。当输入值用f1表示时,图18所示的非线性函数具有一个用方程式(15)表示的输出值f2 每个非线性处理器14850到1485k-1利用非线性函数处理从多路分解器1495提供的频率-相关信噪比以便确定加权因子,并且输出该加权因子给多路复用器1475。具体地说,非线性处理器14850到1485k-1凭借信噪比输出从1到0的加权因子范围,因此它们在信噪比较小时输出1而在信噪比较大时输出0。多路复用器1475多路复用从非线性处理器14850到1485k-1输出的加权因子并且输出加权因子矢量给多路复用乘法器1404。
用有噪声话音功率谱通过路复用乘法器1404(图16)与加权因子相乘,其具有取决于信噪比的数值。当信噪比较大时(即,有噪声话音包含较大的话音分量)加权因子具有较小值。估算的噪声通常是利用有噪声话音功率谱更新的。通过加权有噪声话音功率频谱常常更新具有信噪比的估算噪声,用于估算高精度的噪声,可以减小包含在有噪声话音功率频谱中话音分量的影响。当非线性函数在这个例子中用来计算加权因子时,能够使用另一种形式表示的信噪比函数而不是非线性函数,比如线性函数或者高-次多项式。
图19显示包含在噪声抑制器中的噪声判断单元5的结构。噪声判断单元5类似于用于图6所示常规噪声抑制器中的噪声判断单元51,除了它具有多路信号分离器505之外,而频率-相关噪声判断单元5140到514k-1用频率-相关噪声判断单元5040到504k-1代替。噪声判断单元5主要是相对这些不同描述如下。
多路信号分离器505将来自加权有噪声话音计算器14(图15)提供的加权有噪声话音功率频谱分解为频率-相关加权有噪声话音功率频谱,并且将这些频率-相关加权的噪声话音功率频谱分别地输出到频率-相关噪声判断单元5040到504k-1。频率-相关噪声判断单元5040到504k-1根据来自多路信号分离器502提供的频率-相关有噪声话音功率频谱,根据来自多路信号分离器505提供的频率-相关权重有噪声话音功率频谱,根据来自话音激活检测器4(图15)提供的话音激活检测标志,以及根据来自计数器13(图15)提供的计数值来计算频率-相关估算噪声功率谱,并且将计算的频率-相关估算噪声功率谱输出给多路复用器503。多路复用器503多路复用频率-相关噪声判断单元5040到504k-1提供的频率-相关估算噪声功率谱,并且输出一个合成的估算噪声功率谱给频率-相关信噪比计算器6(图15)和权重有噪声话音计算器14(图15)。频率-相关噪声判断单元5040到504k-1的结构将描述如下。
图20显示频率-相关噪声判断单元5040到504k-1的结构。因为频率-相关噪声判断单元5040到504k-1在结构上是彼此相同的,所以它们表示为图20中的频率-相关噪声判断单元504。在此使用的频率-相关噪声判断单元504不同于图7所示的频率-相关噪声判断单元514,在频率-相关噪声判断单元504中具有估算噪声存储器5942,更新判断单元520替换了更新判断单元521,而且提供给开关5044的是频率-相关加权的有噪声话音功率频谱,而不是频率-相关有噪声话音功率频谱。这些差异的发生是因为频率-相关噪声判断单元5040到504k-1使用了加权的有噪声话音功率频谱,而不是有噪声话音功率频谱,在计算估算噪声中,而且在确定估算噪声的更新中使用估算的噪声和有噪声话音功率频谱。估算噪声存储器5942存储分离器5048提供的频率-相关估算噪声功率谱,并且以上述帧的方式输出存储的频率-相关估算噪声功率谱到更新判断单元520。
图21显示更新判断单元520的结构。更新判断单元520不同于图8中的更新判断单元521,在更新判断单元520中具有比较器5205,阈值存储器5206,和阈值计算器5207,或门电路5201替换了或门电路5211。更新判断单元520主要是相对这些不同描述如下。
阈值计算器5207计算一个取决于估算噪声存储器5942(图20)提供的频率-相关估算噪声功率谱的数值,并且将其作为一个阈值输出给阈值存储器5206。根据计算阈值的简单处理,用一个常数与频率-相关估算噪声功率谱的相乘作为一个阈值。根据其它处理,可以利用高次多项式或者非线性函数来计算阈值。阈值存储器5206存储从阈值计算器5207输出的阈值,并且将存储的阈值以上述的帧方式输出到比较器5205。比较器5205将阈值存储器5206提供的阈值与多路信号分离器502(图19)提供的频率-相关有噪声话音频谱进行比较。如果频率-相关有噪声话音频谱小于阈值,比较器5205输出“1”给或门电路5201。如果频率-相关有噪声话音频谱大于阈值,比较器5205输出“0”给或门电路5200。因此,比较器5205根据估算噪声功率谱的幅度确定是有噪声的语言信号还是噪声。或门电路5201计算从比较器5203输出、非门电路5202输出、和比较器5205输出的逻辑和,并且输出该结果到开关5044、移位寄存器5045,和计数器5049(图20)。
如果有噪声话音功率不仅在初始状态和无声部分较小,而且在话音部分也较小,则更新判断单元520输出“1”,从而更新估算噪声。因为阈值是为每个频率计算的,所以估算噪声可以对每个频率更新。
在图20中,假设计数器5049具有一个计数值CNT,移位寄存器5045具有累加寄存器长度N,和移位寄存器5045存储频率-相关加权有噪声话音功率频谱Bn(k)(n=0、1、...、N-1)。分离器5048提供的频率-相关估算噪声功率谱λn(k)用方程式(16)表示 换句话说,频率-相关估算噪声功率谱λn(k)表示存储在移位寄存器5045中的频率-相关权重有噪声话音功率频谱的平均值。该平均值可以利用加权加法器(递归滤波器)计算。使用加权加法器的结构计算频率-相关估算噪声功率谱λn(k)描述如下。
图22显示频率-相关噪声判断单元5040到504k-1的第二个例子的结构。因为频率-相关噪声判断单元5040到504k-1在结构上彼此相同,它们表示为图22中的频率-相关噪声判断单元507。图22中所示的频率-相关噪声判断单元507具有加权加法器5071和加权存储器5072,添加它们以代替图20中所示频率-相关噪声判断单元504中的移位寄存器5045、加法器5046、最小值选择器5047、分离器5048、计数器5049,和寄存器长度存储器5941。
加权加法器5071利用估算噪声存储器5942以上述的帧形式提供的频率相关估算噪声功率谱,利用开关5044提供的频率-相关权重有噪声话音功率频谱,和利用加权存储器5072输出的加权因子来计算频率-相关估算噪声,并且输出该计算的频率-相关估算噪声给多路复用器503。具体地说,如果存储在加权存储器5072中的加权因子用δ表示而频率-相关权重有噪声话音功率频谱用 表示,则从加权加法器5071输出的频率-相关估算噪声功率谱λn(k)用方程式(17)表示。因为加权加法器5071在结构上与上面描述的参考图4的加权加法器407是相同的,所以加权加法器5071将不再详细描述。然而,加权加法总是在加权加法器5071中计算。
λn(k)=δλn-1(k)+(1-δ)|Y‾n(k)|2----(17)]]>图15所示噪声抑制器中的频谱增益改进单元15将描述如下。频谱增益修正单元15修正取决于信噪比频谱增益,以便防止当信噪比较低时由于不足的抑制引入残留噪声,以及防止当信噪比较高时由于过度的抑制发生话音失真而导致通话质量降低。作为频谱增益修正的一个例子,当信噪比较低时,一个修正值被附加到频谱增益以抑制残留噪声,而信噪比时,频谱增益的最小值被限制以便防止话音失真。如图23所示,频谱增益修正单元15具有K个频率-相关频谱增益修正单元15010到1501k-1,多路信号分离器1502、1503,和多路复用器1054。
多路信号分离器1502将先验信噪比估算器7(图15)提供的估算先验信噪比分离成为频率-相关分量,并且分别输出该频率-相关分量给频率-相关频谱增益修正单元15010到1501k-1。多路信号分离器1503将频谱增益产生器8(图15)提供的频谱增益分离成为频率-相关分量,并且分别输出该频率-相关分量给频率-相关频谱增益修正单元15010到1501k-1。频率-相关频谱增益修正单元15010到1501k-1中的每个,根据多路信号分离器1502提供的频率-相关估算先验信噪比和多路信号分离器1503提供的频率-相关频谱增益,计算频率-相关修正频谱增益,并且输出该计算的频率-相关修正频谱增益给多路复用器1504。多路复用器1504多路复用频率-相关频谱增益修正单元15010到1501k-1提供的频率-相关修正频谱增益,并且将多路复用的修正频谱增益输出到多路复用乘法器16和先验信噪比估算器7。
图24显示频率-相关频谱增益修正单元15010到1501k-1的结构。因为频率-相关频谱增益修正单元15010到1501k-1在结构上彼此是相同的,所以它们表示为图24中的频率-相关频谱增益修正单元1501。频率-相关频谱增益修正单元1501具有最大值选择器1591、频谱增益下限存储器1592、阈值存储器1593、比较器1594、开关(选择器)1595、修正值存储器1596,和乘法器1597。
比较器1594将阈值存储器1593提供的阈值与多路信号分离器1502(图23)提供的频率-相关估算先验信噪比相互进行比较。如果频率-相关估算先验信噪比大于该阈值,则比较器1594提供“0”给开关1595。如果频率-相关估算先验信噪比小于该阈值,则比较器1594提供“1”给开关1595。当比较器1594的输出是“1”时,开关1595将多路信号分离器1503(图23)提供的信号输出给乘法器1597。当比较器1594输出是“0”时,开关1595将多路信号分离器1503提供的信号输出给最大值选择器1591。就是说,当频率-相关估算先验信噪比小于该阈值时,频谱增益被修正。由于该频谱增益是在信噪比较小时修正,所以话音分量没有过度地抑制,而且残留噪声的数值减少。乘法器1597计算开关1595的输出值与修正值存储器1596的输出值的乘积,并且输出该计算结果到最大值选择器1591。为了减少频谱增益值,修正值通常小于1。然而,是否可以选择该修正值取决于噪声抑制器的目的。在图1所示的常规噪声抑制器中,频谱增益是提供给多路复用乘法器16和先验信噪比估算器7。然而,在根据第一实施例的噪声抑制器中,提供给多路复用乘法器16和先验SNR估算器7的是修正的频谱增益,而不是频谱增益。
频谱增益下限存储器1592提供一个为频谱增益而存储的下限值给最大值选择器1591。最大值选择器1591将开关1595提供的频率-相关频谱增益与频谱增益下限存储器1592提供的频谱增益下限值相互进行比较,并且输出它们之中较大的一个给多路复用器1504(图23)。这就是,频谱增益总是大于在频谱增益下限存储器1592中存储的下限值。因此,防止由于过度的抑制而使话音失真。
图25显示包含在图1所示噪声抑制器中的频谱增益产生器结构的第二个例子。在此图解说明的频谱增益产生器81具有最小均方误差STSA增益函数值计算器811、归一化似然比计算器812、话音存在概率存储器813、和频谱增益计算器814。频谱增益产生器81不同于图15所示通过搜索来确定频谱增益的频谱增益产生器8,因为噪声频谱增益产生器81根据估算先验信噪比和提供的后验信噪比来计算频谱增益。根据参考文献1中描述的方程式计算频谱增益的过程将描述如下。
假设帧的编号用n来表示,频率数用k表示,k,γn(k)表示频率-相关信噪比计算器6(图15)提供的频率-相关后验信噪比,而 表示先验信噪比估算器7(图15)提供的频率-相关估算先验信噪比。也可以假设ηn(k)=ξ^n(k)/q,]]>υn(k)=ηn(k)·γn(k)/(1+ηn(k))υn(k)最小均方误差STSA增益函数值计算器811根据频率-相关信噪比计算器6提供的后验信噪比,先验信噪比估算器7提供的估算先验信噪比,以及话音存在概率存储器813提供的话音存在概率q来为各个频率计算最小均方误差STSA增益函数值,并且输出该计算的最小均方误差STSA增益函数值给频谱增益计算器814。对于各个频率的最小均方误差STSA增益函数值Gn(k)是通过方程式(18)给出的。在方程式(18)中,I0(z)表示第0阶修正的贝塞尔函数,而I1(z)表示第1修正的贝塞尔函数。修正贝塞尔函数是描述在1985年,Iwanami Shoten出版的“数学字典”的374页G(参考文献5)。
Gn(k)=πυn(k)2·γn(k)exp(-υn(k)2)·[(1+υn(k))I0(υn(k)2)+υn(k)I1(υn(k)2)]----(18)]]>归一化似然比计算器812根据频率-相关信噪比计算器6提供的后验信噪比γn(k),先验信噪比估算器7提供的估算先验信噪比 以及话音存在概率存储器813提供的话音存在概率q来为各个频率计算归一化似然比,并且输出该计算的归一化似然比给频谱增益计算器814。对于各个频率的归一化似然比Λn(k)是通过方程式(19)表示Λn(k)=q exp(υn(k))1-q1+ηn(k)----(19)]]>频谱增益计算器814根据最小均方误差STSA增益函数值计算器811提供的最小均方误差STSA增益函数值Gn(k),以及根据归一化似然比计算器812提供的归一化似然比Λn(k),为各个频率计算频谱增益,并且输出该计算的频谱增益给频谱增益修正单元15(图15)。对于相应频率的频谱增益Gn(k)用方程式(20)表示G‾n(k)=Λn(k)Λn(k)+1Gn(k)----(20)]]>在图15所示的噪声抑制器中,对于包括多个频率的相应频带范围,能够确定和使用普通的信噪比,而不是频率-相关信噪比。为各自频带而用于计算信噪比的频率-相关信噪比计算器6的第二例子将描述如下。
图26所示的频率-带宽-相关信噪比计算器61的结构可以用于代替图15所示噪声抑制器中的频率-相关信噪比计算器6。频率-带宽-相关信噪比计算器61与图9所示的频率-相关信噪比计算器6不同,其中它具有频率-带宽-相关功率计算器611、612。频率-带宽-相关功率计算器611根据多路信号分离器602提供的频率-相关有噪声话音功率频谱来计算频率-带宽-相关功率,并且分别输出该计算的频率-带宽-相关功率给分离器6010到601k-1。频率-带宽-相关功率计算器612根据多路信号分离器603提供的频率-相关估算噪声功率谱来计算频率-带宽-相关功率,并且分别输出该计算的频率-带宽-相关功率给分离器6010到601k-1。
图27显示频率-带宽-相关功率计算器611的结构。在图解说明的例子中,整个功率谱被分成M个具有相等带宽L的频带,其中L、M是自然数满足关系K=LM。
频率-带宽-相关功率计算器611具有M个加法器61100到6110M-1。从多路信号分离器602(图26)提供的频率-相关有噪声话音功率频谱分量9100到910k-1(9100到910ML-1)分别传输给对应于各个频率的加法器61100到6110M-1。例如,因为对应于频带编号0的频率数是0到L-1,所以频率-相关有噪声话音功率频谱分量9100到910L-1被传输给加法器61100。同样地,例如,因为对应于频带编号1的频率数是L到2L-1,所以频率-相关有噪声话音功率频谱分量910L到9102L-1被传输给加法器61101。加法器61100到6110M-1计算提供的频率-相关有噪声话音功率频谱分量的各个和,并且输出频率-带宽-相关有噪声话音功率频谱分量9110到911ML-1(9110到911k-1)给分离器6010到601k-1(图26)。提供来自加法器61100到6110k-1的计算结果作为频率-带宽-相关有噪声话音功率频谱分量,对于依靠各个频带编号的频率。例如,来自加法器61100的计算结果输出作为频率-带宽-相关有噪声话音功率频谱分量9110到911L-1,而来自加法器61101的计算结果输出作为频率-带宽-相关有噪声话音功率频谱分量911L到9112L-1。
频率-带宽-相关功率计算器612在结构和操作中等效于频率-带宽-相关功率计算器611。因此,频率-带宽-相关功率计算器612下面将不做详细描述。
在整个功率谱被分成以前描述的多个频带范围同时,也可以使用其它的频带分隔方法,比如,用于分离整个功率谱成为临界频带的方法,其公开在1980年电子学、信息和通信工程师学会,“监听与话音”的115-118页(参考文献6),或者用于分隔整个功率谱成为倍频度频带的方法,如公开在1983年,美国Prentice-Hall公司,“多速率数字信号处理”(参考文献7)。
本发明的第二实施例将描述如下。根据图28所示第二实施例的噪声抑制器不同于根据图15所示第一实施例的噪声抑制器,其中噪声判断单元5替换为噪声判断单元52而省去加权有噪声话音计算器14。根据第二实施例的噪声抑制器主要相对于这些不同描述如下。
图29显示包含在根据第二实施例的噪声抑制器中的噪声判断单元52的结构。噪声判断单元52不同于图19所示的噪声判断单元5,其中频率-相关噪声判断单元5040到504k-1用频率-相关噪声判断单元5060到506k-1替换,而且噪声判断单元52的输入信号没有加权有噪声话音功率频谱。这是因为鉴于图19所示噪声判断单元5中的频率-相关噪声判断单元5040到504k-1需要输入具有频率-相关加权有噪声话音功率频谱,而噪声判断单元52中的信号噪声判断单元5060到506k-1不需要输入具有频率-相关加权有噪声话音功率频谱。
图30是一个显示包含在图29所示噪声判断单元52中的频率-相关噪声判断单元5060到506k-1的结构方框图。因为频率-相关噪声判断单元5060到506k-1在结构上彼此相同,所以它们表示为图30中的频率-相关噪声判断单元506。频率-相关噪声判断单元506不同于图20所示的频率-相关噪声判断单元504,其中它没有使用具有加权有噪声话音功率频谱的输入信号,而它具有分离器5041、非线性处理机5042、和乘法器5043。噪声判断单元506主要针对这些差别描述如下。
分离器5041通过估算来自估算噪声存储器5942提供先前帧中的噪声功率谱,来分离多路信号分离器502(图29)提供的频率-相关有噪声话音功率频谱,并且输出分离的结果给非线性处理机5042。非线性处理机5042,它在结构与功能方面与图17所示的非线性处理机1485相同,计算取决于分离器5041输出的加权因子,并且输出计算的加权因子给乘法器5043。乘法器5043计算多路信号分离器502(图28)提供的频率-相关有噪声话音功率频谱与非线性处理机5042提供的加权因子两者乘积,并且输出该乘积给开关5044。
从乘法器5043输出的信号等效于图18所示频率-相关噪声判断单元504中的频率-相关加权噪声话音功率频谱分量。具体地说,频率-相关加权有噪声话音功率频谱可以在频率-相关噪声判断单元506内计算。因此在根据第二实施例的噪声抑制器中,可以省去加权有噪声话音计算器。
本发明的第三实施例将描述如下。根据图31所示本发明第三实施例的噪声抑制器不同于根据图15中所示第一实施例的噪声抑制器,其中先验信噪比估算器具有不同的内部结构。图32显示用于第三实施例的先验信噪比估算器71的结构。先验信噪比估算器71不同于图10所示的先验信噪比估算器7,其中它具有估算噪声存储器712,增强话音功率频谱存储器713、频率-相关信噪比计算器715、以及代替后验信噪比存储器702、频谱增益存储器703、和多路复用乘法器705、704的多路复用乘法器716。此外,鉴于图10所示的先验信噪比估算器7的输入信号包含频谱增益,图32所示的先验信噪比估算器71的输入信号包含代替频谱增益的增强话音频谱振幅和估算噪声功率谱。
多路复用乘法器716将多路复用乘法器16(图31)提供每个频率的增强话音频谱振幅进行平方,并且输出该确定的增强话音功率频谱给增强话音功率频谱存储器713。因为多路复用乘法器716与如上所述参考图5的多路复用乘法器17在结构上相同,所以下面不再详细描述多路复用乘法器716。增强话音功率频谱存储器713存储多路复用乘法器716提供的增强话音功率频谱,并且以先前帧的方式输出存储的增强话音功率频谱给频率-相关信噪比计算器715。因为频率-相关信噪比计算器715在结构上与如上所述参考图9的频率-相关信噪比计算器6相同,所以下面不再详细描述频率-相关信噪比计算器715。估算噪声存储器712存储噪声判断单元5(图31)提供的估算噪声功率谱,并且将存储的估算噪声功率谱以先前帧的方式输出到频率-相关信噪比计算器715。频率-相关信噪比计算器715,为各个频率,计算增强话音功率频谱存储器713提供的增涨话音功率频谱的信噪比,以及计算估算噪声存储器712提供的估算噪声功率谱的信噪比,并且输出计算的信噪比给多路复用加权加法器707。
在图32所示先验信噪比估算器71中的频率-相关信噪比计算器715的输出信号等效于图10所示先验信噪比估算器7中的多路复用乘法器705的输出信号。因此,根据第三实施例,先验信噪比估算器7可以用如上所述的先验信噪比估算器71代替。
本发明的第四实施例将描述如下。根据图33所示本发明第四实施例的噪声抑制器不同于根据图28中所示第二实施例的噪声抑制器,其中使用在第三实施例中的先验信噪比估算器71(看图32)被用作一个先验信噪比估算器。噪声判断单元52在结构和工作上与使用在第二实施例中的类似,而先验信噪比估算器71在结构和工作上与使用在第三实施例中的类似。因此,图33中所示噪声抑制器完成的功能相当于根据图15所示第一实施例噪声抑制器的功能。
本发明的第五实施例将描述如下。根据图34所示第五实施例的噪声抑制器不同于根据图15所示第一实施例的噪声抑制器,其中噪声判断单元5替换为噪声判断单元53而省去加权有噪声话音计算器4。因此,噪声抑制器如此安排它不需要使用估算噪声的话音激活检测器。根据第五实施例的噪声抑制器主要针对于这些不同描述如下。
图35显示用在第五实施例中的噪声判断单元53的结构。噪声判断单元53不同于图19所示的噪声判断单元5,其中频率-相关噪声判断单元5040到504k-1用频率-相关噪声判断单元5080到508k-1来代替,而且输入信号不包含话音激活检测标志。
图36显示每个频率-相关噪声判断单元5080到508k-1的结构。因为频率-相关噪声判断单元5080到508k-1在结构上彼此相同,所以它们表示为图36中的频率-相关噪声判断单元508。频率-相关噪声判断单元508不同于图20所示的频率-相关噪声判断单元504,其中更新判断单元520用更新判断单元522代替,而且该输入信号不包含话音激活检测标志。图37中图解说明更新判断单元522的结构。更新判断单元522不同于图21所示的更新判断单元520,其中或门电路5221代替或门电路5201,省去非门电路5202,而且输入信号不包含话音激活检测标志。具体地说,更新判断单元522不同于图21所示的更新判断单元520,它在更新估算噪声中没有使用话音激活检测标志。或门电路5221计算比较器5205输出值与比较器5203输出值的逻辑和,并且将结果输出给触发器5044、移位寄存器5045、加计数器5049(图36)。更新判断单元522总是输出“1”直到计数值达到一个预定值。在计数值达到预定值后,当有噪声话音功率小于阈值时更新判断单元522输出“1”。参考如上所述的图21,比较器5025确定有噪声语言信号是不是噪声。即,比较器5205检测每个频率的话音。因此,利用上述结构,可能实现更新判断单元,其不需要话音激活检测标志包含在输入信号中。
根据本发明优选实施例的噪声抑制器已经在上面进行了描述。在上面的描述中,已经假定最小均方误差快速频谱振幅被用作噪声抑制的算法。然而,本发明也适用于其它的噪声抑制算法。这样的噪声抑制算法一种是维纳滤波处理,其公开在1979年12月,IEEE会刊,67卷编号12,1586-1604页(参考文献8)。
工业实用性根据本发明,如上所述,因为噪声的功率谱是利用加权的有噪声话音功率谱来估算,所以噪声的功率谱能够精确地估算而与噪声性质无关,因此利用减少失真和噪声来产生增强话音。此外,根据本发明,因为噪声是利用取决于信噪比值(信号-对-噪声比)的改进频谱增益来抑制的,所以能够利用减少相对于全部信噪比值的失真和噪声来产生增强话音。
权利要求
1.一种估算噪声的方法,包括步骤将输入信号转换成频域信号;根据所述频域信号确定加权;根据所述加权对所述频域信号加权以确定加权的频域信号;以及根据所述加权的频域信号确定估算的噪声。
2.根据权利要求1所述的估算噪声的方法,其特征在于所述的确定所述加权的步骤包括步骤根据所述频域信号确定频率相关信噪比;以及根据所述频率相关信噪比计算所述加权。
3.根据权利要求2所述的估算噪声的方法,其特征在于所述的确定所述加权的步骤包括利用非线性函数处理所述频率相关信噪比以确定所述加权的步骤。
4.根据权利要求2或3所述的估算噪声的方法,其特征在于所述的确定所述频率相关信噪比的步骤包括步骤根据所述频域信号和在前一帧中的所述估算的噪声确定所述频率相关信噪比。
5.根据权利要求1-4中任何一个所述的估算噪声的方法,其特征在于所述的确定所述估算的噪声的步骤包括步骤根据所述加权的频域信号的移动平均值确定所述估算的噪声。
6.一种用于估算噪声的设备,其特征在于包括输入信号变换器,其用于将输入信号转换成频域信号;加权计算器,其用于根据所述频域信号输入信号确定加权;加权频域信号计算器,其利用所述加权对所述频域信号加权,以确定加权的频域信号;以及噪声估算单元,其用于根据所述加权的频域信号确定估算的噪声。
7.根据权利要求6所述的估算噪声的设备,其特征在于所述加权计算器包括频率相关信噪比计算器,用于根据所述频域信号确定频率相关信噪比。
8.根据权利要求7所述的估算噪声的设备,其特征在于所述加权计算器包括非线性处理器,用于利用非线性函数处理所述频率相关信噪比以确定所述加权。
9.根据权利要求7或8所述的估算噪声的设备,其特征在于所述频率相关信噪比计算器根据所述频域信号和在前一帧中的估算噪声确定所述频率相关信噪比。
10.根据权利要求6-9中的任何一个所述的估算噪声的设备,其特征在于噪声估算单元包括移动平均值计算器,用于根据所述加权的频域信号的移动平均值确定所述估算的噪声。
全文摘要
一种用于估算噪声的设备,包括输入信号变换器,其用于将输入信号转换成频域信号;加权计算器,其用于根据所述频域信号输入信号确定加权;加权频域信号计算器,其利用所述加权对所述频域信号加权,以确定加权的频域信号;以及噪声估算单元,其用于根据所述加权的频域信号确定估算的噪声。
文档编号G10L21/00GK1770264SQ20051012008
公开日2006年5月10日 申请日期2001年12月27日 优先权日2000年12月28日
发明者加藤正德, 杉山昭彦 申请人:日本电气株式会社
噪声估算方法和设备的制作方法
相关推荐
专利名称:现场安装型光拼接器的制作方法技术领域:本发明涉及一种用于直径可变的光纤电缆的现场安装型拼接器。 背景技术:光纤电缆(以下称为光缆)普遍存在于数据和通信领域。典型的光缆包 括由緩沖层包裹的光纤,该緩沖层保护光纤并给光缆提供强度。根据
专利名称:投影机的制作方法技术领域:本发明涉及一种投影机。背景技术:由于投影机属于精密的光机电一体化产品,其内部元器件对温度十分敏感,加之内部构造的复杂性,其自身对于温度的要求比较苛刻,因此投影机同众多电脑部件一样涉及到散热的问题。目前投影
专利名称::纤维素酯光学膜、使用该纤维素酯光学膜的偏振片和液晶显示装置、以及纤维素酯光学膜...的制作方法技术领域::.本发明涉及纤维素酯光学膜、使用该纤维素酯光学膜的偏振片和液晶显示装置、以及纤维素酯光学膜的制造方法。背景技术::液晶显示
专利名称:一种大功率节能灯隔热导风壳体的制作方法技术领域:本发明涉及一种电子节能灯,尤其涉及一种大功率节能灯隔热导风壳体。 背景技术:大功率电子节能灯,灯管工作时温度高,尤其是灯管的中心区,热量集中上升往往 将电子镇流器烤死,因此人们自然而
专利名称:霓虹灯的制作方法技术领域:本实用新型涉及一种灯具,特别是一种霓虹灯。背景技术:随着经济的发展,现在的霓虹灯种类越来越多。因为霓虹灯要设置在外界露天的环境里,所以霓虹灯能否一直保持原有的色彩效果就是设计霓虹灯的一个技术问题。中国实用
专利名称:多功能放大镜的制作方法技术领域:本实用新型属于日常生活用品。在人们生活中,放大镜是看清微小物件的必须用品,现有的放大镜只能在明处放大物件。因此,必然功能单一,利用率很低。现提供一种既能在暗处放大物件,又能照明和拔、夹物品的多功能放