当前位置:网站首页>专利 >正文

噪声抑制装置的制作方法

专利名称:噪声抑制装置的制作方法
技术领域
本发明涉及在各种噪声环境下使用的语音通信系统或语音识别系统等系统中,用来抑制语音信号以外的噪声的噪声抑制装置。


图1表示上述公报中公告的传统的噪声抑制装置之结构的框图。图中,111为输入端子,112为帧形成/开窗处理电路,113为FFT电路,114为频分电路,115为噪声估计电路,116为语音估计电路,117为Pr(SP)计算电路,118为Pr(SP|Y)计算电路,119为最大似然滤波器,120为软判决抑制电路,121为滤波器处理电路,122为频带转换电路,123为频谱修正电路,124为IFFT电路,125为重叠相加电路,126为输出端子。
图2是表示传统的噪声抑制装置的噪声估计电路115结构的框图。图中,115A为RMS计算电路,115B为相对能量计算电路,115C为最小RMS计算电路,115D为最大信号计算电路。
接着,就动作进行说明。
输入端子111上,输入了含有语音分量和噪声分量的输入信号y[t]。此输入信号y[t],例如为抽样频率FS的数字信号,它被送至帧形成/开窗处理电路112,而帧长被分成FL样值,例如被分成160样值的帧,而在接着的FFT处理前进行开窗处理。
接着在FFT电路113中进行256点的FFT(Fast FourierTransform快速傅立叶变换),所得到的频谱振幅值,由频分电路114例如分为18个频带。
在噪声估计电路115,从语音中区分出输入信号y[t]中的噪声,并检测出被估计为噪声的帧。以下,用图2说明噪声估计电路115的动作。
图2中,输入信号y[t]被送至RMS(Root Mean Square均方根)计算电路115A计算各帧的短时RMS值,该短时RMS值被送至相对能量计算电路115B、最小RMS计算电路115C、最大信号计算电路115D,以及噪声谱估计电路115E上。而来自相对能量计算电路115B、最小RMS计算电路115C和最大信号计算电路115D的各输出以及来自上述频分电路114的输出,被送至噪声估计电路115E。
在RMS计算电路115A中,按下式(1)计算出各帧信号的RMS值RMS[k]。在相对能量计算电路115B中,计算出相对于来自前帧的衰减能量(衰减时间0.65秒)的当前帧的相对能量dB_rel[k]。RMS[k]=sqrt(Σt=1FLy2[t])]]>dB_rel[k]=10log10(E_dec[k]/E[k])E[k]=∑y2[t]E_dec[k]=max(E[k],exp(-FL/0.65*FS)E_dec[k-1]) ……(1)在最小RMS计算电路115C上,为了评估背景噪声电平,计算当前帧的最小噪声RMS值MinNoise_short和每隔0.6秒更新的长时最小噪声RMS值MinNoise_Long。再有,在当前帧的最小噪声RMS值MinNoise_short无法跟上噪声电平的急遽变化的情况下,则作为替代使用长时最小噪声RMS值MinNoise_long。
在最大信号计算电路115D上,求得当前帧的最大信号RMS值MaxSignal_short,以及例如每0.4秒更新的长时最大信号RMS值MaxSignal_long。再有,在当前帧的最大信号RMS值无法跟上噪声电平急遽变化的情况下,作为替代使用长时最大信号RMS值MaxSignal_long。使用上述短时的最大信号RMS值MaxSigna_short和短时最小噪声RMS值MinNoise_short来估计当前帧信号的最大SNR值MaxSNR。并且,使用最大SNR值MaxSNR,算出表示相对噪声电平的从0到1的范围的归一化参数NR-level。
接着,在噪声谱估计电路115E中,使用以相对能量计算电路115B、最小RMS计算电路115C以及最大信号计算电路115D算出的值,进行关于当前帧的状态为语音信号还是为噪声的判定。当前帧被判定为噪声的时,噪声谱的时间平均估计值N[w,k],由当前帧的信号谱Y[w,k]更新。W表示频率划分的频带号。
在图1的语音估计电路116中,计算出上述的每个被频分的各频带W的SN比。首先,按照下式(2),假设噪声不存在(无噪条件)来粗略估计语音谱,以求得语音谱粗略估计值S’[w,k]。此语音谱粗略估计值S’[w,k],用于后述的概率Pr(Sp|Y)的计算。再有,式(2)中的ρ为规定常数,例如设ρ=1.0。S’[w,k]=sqrt(max(0,Y[w,k]2-ρN[w,k]2))……(2)接着,语音估计电路116,使用上述的语音谱粗略估计值S’[w,k]和1帧前的语音谱估计值S’[w,k-1],来算出当前帧的语音谱估计值S[W,k]。使用所得到的语音谱估计值S[W,k]和上述噪声估计电路115E输出的噪声谱的估计值N[W,k],按照下面的式(3),算出每个次频带的SN比SNR[w,k]。SNR[w,k]=20log10(0.2*S[w,-1,k]+0.6*S[w,k]+0.2*S[w+1,k]0.2*N[w-1,k]+0.6*N[w,k]+0.2*N[w+1,k])·····(3)]]>接着,语音估计电路116为了对应大范围的噪声/语音电平,使用上述的每个次频带的SN比SNR[w,k],由下面的式(4),求得可变的SN比SNR_new[w,k]。式(3)中的MIN_SNR()是决定SNR_new[w,k]的最小值的函数,自变数snr和次频带的SN比SNR[w,k]同义。SNR_new[w,k]=max(MIN_SNR(SNR[w,k]),S′[w,k]/N[w,k]) 如上求得的SNR_new[w,k],为限制于其最小值的当前帧中的瞬时次频带SN比。此SNR_new[w,k],例如对于具有如语音部分那样的作为整体的高SN比的信号,次频带SN比所取的最小值能够降低至1.5(dB)。又例如对于具有如噪声部分的低的瞬时SN比的信号,次频带SN比所取的最小值不能比3(dB)更小。
在Pr(Sp)计算电路117中,计算在假设的输入信号即无噪条件下语音信号存在的概率Pr(Sp)。此概率Pr(Sp)用最大信号计算电路115D所算出的NR_level函数来计算。
在Pr(Sp|Y)计算电路118中,计算实际有噪声混入的输入信号y[t]中的语音信号存在的概率Pr(Sp|Y)。此概率Pr(Sp|Y)用上述Pr(Sp)计算电路117所输出的概率Pr(Sp)和以上式(4)所计算的次频带SN比SNR_new[w,k]来计算。此处,被算出的概率Pr(Sp|Y)中,概率Pr(H1|Y)[w,k]的意义,为谱振幅信号Y[w,k]的次频带w的语音事件H1,亦即当前帧的输入信号y[t]为语音信号s[t]和噪声信号n[t]之和,其中表示了语音信号S[t]存在时的每个次频带W的概率,例如SNR_new[w,k]一旦变大,概率Pr(H1|Y)[w,k]就成为接近1.0的值。
在最大似然滤波器119上,使用来自频分电路114的谱振幅信号Y[w,k]和来自噪声估计电路115的噪声谱振幅信号N[w,k],根据以下第(5)式从谱振幅信号Y中去除噪声信号N,并输出噪声除去谱信号H[w,k]。 在软判决抑制电路120中,用最大似然滤波器119输出的噪声除去谱信号H[w,k]和Pr(Sp|Y)计算电路118输出的概率Pr(H1|Y)[w,k],而根据下面的式(6)进行噪声除去谱信号H[w,k]的每个次频带W的谱振幅抑制,并输出谱抑制信号Hs[w,k]。再有,式(6)中,MIN_GAIN为表示最小增益的规定常数,例如设MIN_GAIN=O.1(-15dB)。根据式(6),语音信号存在的概率Pr(H1|Y)[w,k]接近1.0的情况下,噪声除去谱信号H[w,k]减弱振幅抑制,随着概率Pr(H1|Y)[w,k]接近于0.0,噪声除去谱信号H[w,k]被振幅抑制至最小增益MIN-GAIN。Hs[W,k]=Pr(H1|Y)[w,k]·H[w,k]+(1-Pr(H1|Y)[w,k])·MIN_GAIN ……(6)在滤波器处理电路121中,关于频率轴方向和时间轴方向,进行软判决抑制电路120输出的谱抑制信号Hs[w,k]的平滑化,来减轻谱抑制信号Hs[w,k]的不连续感。在频带变换电路122中,通过插值处理对滤波器处理电路121输出的平滑化信号进行扩频变换。
在频谱修正电路123中,用频分电路114的输出信号乘以FFT电路113得到的输入信号的FFT系数的虚部和以频带转换电路122得到的FFT系数的实部,以进行频谱修正。
在IFFT电路124中,用频谱修正电路123所得到的信号进行逆FFT处理。在重叠相加电路125中,对于各帧的IFFT输出信号的帧边界部分,执行重叠处理,并通过输出端子126输出经噪声减低处理的输出信号。
如此,传统的噪声抑制装置具有即使输入信号的噪声/语音电平变动也能按照其次频带SN比来调整噪声抑制量的构造,例如对于如语音部分那样整体具有高SN比的信号,使各次频带SN比的最小值变小,而对于SN比低的次频带,能够使振幅抑制量减小,所以能防止对低电平语音信号的抑制。又,对于如噪声部分那样整体具有低SN比的信号,使各次频带SN比的最小值增大,从而对于SN比低的次频带,由于充分的振幅抑制,能够使噪声感的发生得以抑制。
传统的噪声抑制装置,因为具有如上所述的结构而存在这样的问题即为了使噪声帧上不产生残留噪声,应利用全频带上一定频率方向上的噪声抑制量特性来抑制噪声,但由于估计噪声谱是过去的平均噪声谱,跟当前帧上实际噪声谱的频谱形状不一致,因此会产生次频带SN比的估计误差,从而无法在全频带频率方向上以一定的噪声抑制量特性来抑制噪声。
具体地说,即使为噪声帧,在含有大功率频谱分量的频带上,其次频带SN比变大,该频带当作有语音来处理,从而使抑制量变得不充分。结果,在全频带上无法形成一定的抑制特性,这成为残留噪声的原因;但是采用传统的方式存在这样的问题即由于执行与估计噪声谱和估计次频带SN比相关的控制,所以在噪声谱的估计出错时,无法执行适当的噪声抑制。
本发明为解决上述问题而构思,目的在于获得这样的噪声抑制装置,该装置用简单的方法抑制噪声帧上的残留噪声产生,而且即使在高噪声下也能减少品质恶化,并在噪声电平波动时也具有强大的抑制能力。
由此,可以取得这样的效果能够以全频带范围变动少的特性来抑制噪声,并能够减轻残留噪声的产生。
在本发明的噪声抑制装置中,根据次频带SN比计算装置所算出的混合率,由和噪声类似性信号成比例的函数确定。
由此,可以取得这样的效果能够以全频带范围变动少的特性来抑制噪声,并能够减轻残留噪声产生。
在本发明的噪声抑制装置中,次频带SN比计算装置算出的混合率,由在每个小频带的高频区设定尽可能低的规定阈值的、跟噪声类似性信号成比例的函数加以确定。
由此,可以取得这样的效果加强高频区的SN比的平滑化,并能够抑制高频区的噪声谱的估计精确度的恶化,又能进一步抑制高频区的残留噪声。
在本发明的噪声抑制装置中,由次频带SN比计算装置所算出的算出混合率,随频率增高而增大加权量。
由此,可以取得这样的效果能够平滑化而使高频区的SN比的波动更小,进一步抑制高频区残留噪声的发生。
在本发明的噪声抑制装置中,次频带SN比计算装置算出的算出混合率,在噪声类似性信号超过规定的阈值的时被加权。
由此,可以取得这样的效果例如在语音信号的开头的子音部分上,假设该帧即使被误判为噪声,也能防止不必要的平滑化而使SN比变小,从而能防止输出语音的品质恶化。
在本发明的噪声抑制装置中,次频带SN比计算装置算出的混合率,通过对应于噪声类似性信号的规定值来设定。
由此,可以取得这样的效果混合率在时间方向的微小波动被吸收至规定的常数值,因此能够稳定地求得混合率,从而更能抑制残留噪声的发生。
在本发明的噪声抑制装置中,次频带SN比计算装置算出的混合率,通过每个小频带的规定值加以设定。
由此,可以取得这样的效果混合率在时间方向的微小波动,被吸收至规定的常数值,所以能够稳定地求得每个小频带的混合率,并能进一步抑制高频的残留噪声的发生。
在本发明的噪声抑制装置中,次频带SN比计算装置算出的每个小频带的混合率,随频率增高而增大加权量。
由此,可以取得这样的效果除了用规定常数抑制混合率在时间方向的变动外,还能进行平滑化使高频区的SN比变小,从而能进一步抑制高频的残留噪声的发生。
在本发明的噪声抑制装置中,次频带SN比计算装置算出的混合率,在噪声类似性信号超过规定的阈值时被加权。
由此,可以取得这样的效果例如在语音信号的开头的子音部分上,假设该帧即使被误判为噪声,也能防止执行不必要的平滑化而使SN比变小,从而能防止输出语音的品质恶化。
图2是表示传统的噪声抑制装置中的噪声估计电路之结构的框图。
图3是表示本发明实施例1的噪声抑制装置之结构的框图。
图4是表示本发明实施例1的噪声抑制装置的次频带SN比计算装置之结构的框图。
图5是表示本发明实施例1的噪声抑制装置的噪声类似性分析装置之结构的框图。
图6是表示本发明实施例1的噪声抑制装置的噪声谱估计装置之结构的框图。
图7是表示本发明实施例1的噪声抑制装置的谱抑制量计算装置之结构的框图。
图8是表示本发明实施例1的噪声抑制装置的谱抑制装置之结构的框图。
图9是表示本发明实施例1的噪声抑制装置的频带划分表的示图。
图10是表示本发明实施例1的噪声抑制装置中的输入信号平均谱、估计噪声谱与次频带SN比三者之间关系的示图。
图11是表示在本发明实施例5的噪声抑制装置上对混合率在频率方向加权时,输入信号平均谱、估计噪声谱与次频带SN比三者之间关系的示图。
图3中,5为次频带SN比计算装置,该装置在输入了由噪声类似性分析装置3算出的噪声类似性信号、由上述时间/频率转换装置2转换的输入信号谱以及由上述噪声谱估计装置4更新的每个小频带的估计噪声谱后,根据输入的输入信号谱算出每个小频带的输入信号平均谱,基于输入的噪声类似性信号算出输入的每个小频带的估计噪声谱和算出的每个小频宽的输入信号平均谱的混合率,再基于算出输入的每个小频带的估计噪声谱、算出的每个小频带的输入信号平均谱和算出的混合率计算出每个小频带的SN比;6为谱抑制量计算装置,该装置使用由次频带SN比计算装置5算出的每个小频带的SN比,算出对应于经噪声谱估计装置4更新的每个小频带的估计噪声谱的每个小频带的谱抑制量;7为谱抑制装置,该装置用由谱抑制量计算装置6算出的每个小频带的谱抑制量,进行对上述时间/频率转换装置2转换的输入信号谱的谱振幅抑制,并输出噪声去除谱;8为频率/时间转换装置,该装置用经时间/频率转换装置2转换的相位谱,将谱抑制装置7所输出的噪声去除谱转换为时域的噪声抑制信号;9为重叠相加装置,该装置进行关于由频率/时间转换装置8转换的噪声抑制信号的帧边界部分的重叠处理,并输出经噪声减低处理的噪声去除信号;10为输出信号踹子。
图4是表示本发明实施例1的噪声抑制装置的次频带SN比计算装置5之结构的框图。图中,5A为频分滤波器,5B为混合率算出电路,5C为次频带SN比算出电路。
图5是表示本发明实施例1的噪声抑制装置的噪声类似性分析装置3之结构的框图。图中,3A为开窗电路,3B为低通滤波器,3C为线性预测分析电路,3D为逆向滤波器,3E为自相关系数算出电路,3F为最大值测出电路,3G为噪声类似性信号算出电路。
图6是表示本发明实施例1的噪声抑制装置的噪声谱估计装置4之结构的框图。图中,4A为更新速度系数算出电路,4B为频分滤波器,4C为估计噪声谱更新电路。
图7是表示本发明实施例1的噪声抑制装置的谱抑制量计算装置6之结构的框图。图中,6A为帧噪声能量算出电路,6B为谱抑制量算出电路。
图8是表示本发明实施例1的噪声抑制装置的谱抑制装置7之结构的框图。图中,7A为插值电路,7B为谱抑制电路。
接着,就动作进行说明输入信号s[t],以规定的取样频率(例如8kHz)抽样,分割为规定的帧单位(例如20ms)后由输入端子1输入。此输入信号s[t],为混入了背景噪声的语音信号,或只为背景噪声的信号。
时间/频率转换装置2,例如用256点的FFT,以帧单位将输入信号s[t]转换为输入信号谱S[f]和相位谱P[f]。再有,因FFT为众所周知的方法,其说明省略。
接着,次频带SN比计算装置5利用时间/频率转换装置2输出的输入信号谱S[f],后述的噪声类似性分析装置3输出的噪声类似性信号Noise_level,以及后述的噪声谱估计装置4输出的、作为从判定为过去的噪声的帧来估计的平均噪声谱的估计噪声谱Na[i],以下面的方法求得当前帧的各频带SN比(以下,称为次频带SN比)SNR[i]。
图9是表示本发明实施例1的噪声抑制装置的频率划分表。首先,进行求次频带SN比SNR[i]的准备,例如,如图9所示,分割为在低频区上带宽变窄、而随着成为高频区频带宽变宽的19个小频带(次频带)。这种频带划分,采用图4所示的频分滤波器5A,按照下面式(7)求出属于在每个次频带i上的次频带的频谱分量的平均值,而将各自的输入信号谱S[f]的f=0~127的功率谱分量,作为输入信号平均谱Sa[i]输出。Sa[i]=Σf=fl[i]fh[i]s[f]/(fh[i]-fl[i]+1),i=0,...,18·····(7)]]>接着,图4所示的混合率算出电路5B,在输入了后述的噪声类似性信号Noise_level后,算出在计算次频带SN比SNR[i]时使用的、后述的噪声谱估计装置4输出的估计噪声谱Na[i]和上述频分滤波器5A所输出的输入信号平均谱Sa[i]的混合率m。此处,将噪声类似性信号Noise_level作为混合率m来使用,确定混合率m的函数如式(8)所示。
m=Noise_level ……(8)例如,如式(8)所示,通过使混合率m跟噪声类似性信号Noise_level成比例,在噪声类似性信号Noise_level取较大值时混合率m变大,相反地在噪声类似性信号Noise_ievel取较小值时混合率m变小。
接着,在图4所示的次频带SN比算出电路5C中,使用上述频分滤波器5A输出的输入信号平均谱Sa[i]、噪声谱估计装置4输出的估计噪声谱Na[i]和以上述混合率算出电路5B求得的混合率m,按照以下的式(9)计算对应于次频带i的次频带SN比SNR[i]。 通过用混合率m求得次频带SN比SNR[i],能够在当前帧噪声大时加强次频带SN比SNR[i]的频率方向的平滑化程度,而在噪声小时减弱次频带SN比SNR[i]的频率方向的平滑化程度。因而,按照当前帧的噪声类似性,能够控制次频带SN比SNR[i]的频率方向的平滑化。
图10是表示本发明实施例1的噪声抑制装置上,当前帧为噪声帧时的输入信号平均谱Sa[i](当前帧的噪声谱实线)、从过去的噪声谱所估计的估计噪声谱Na[i](虚线)和由此得到次频带SN比SNR[i]三者之间关系的示图。图10(a)是在算出次频带SN比SNR[i]时,估计噪声谱Na[i]中不混入输入信号平均谱Sa[i]的情况下所得到的次频带SN比SNR[i],在频率方向形成变动大的形状。另一方面,图10(b)是以混合率m=0.9将输入信号平均谱Sa[i]混入估计噪声谱Na[i]的情况下,因为能够使估计噪声谱Na[i]近似当前帧的实际的噪声谱,所以次频带SN比SNR[i]在频率方向形成变动小的形状。因而,在噪声帧上含有功率较大的频谱分量的频带上,能够抑制将次频带SN比SNR[i]过大估计(或过小估计)的误估计,而将次频带SN比SNR[i]平滑化。
接着,在图5所示的噪声类似性分析装置3中,输入了输入信号s[t],而以如以下方法算出噪声类似性信号Noise_level,作为当前帧是否为噪声/语音的指标。
首先,在开窗电路3A中,按下面的式(10)进行输入信号s[t]的开窗处理,而输出被开窗的输入信号s_w[t]。例如使用Hanning窗Hanwin[t]作为窗函数。并且,设N帧长为N=160。s_w[t]=Hanwin[t]*s[t],t=0,…,N-1Hanwin[t]=0.5+0.5*cos(2πt/2N-1) ……(10)
在低通滤波器3B中,输入了开窗电路3A输出的被开窗的输入信号s_w[t],例如,进行截止频率2kHz的低通滤波处理,获得低通滤波信号s_lpf[t]。通过低通滤波处理,在后述的自相关分析上,能够去除高频区噪声的影响而能进行稳定的分析。
接着,在线性预测分析电路3C中,输入低通滤波器3B输出的低通滤波信号s_lpf[t],例如用Levinson-Durbin法等众所周知的方法计算线性预测系数(例如10阶的α参数)alpha,并加以输出。
在逆滤波器3D上,输入了低通滤波器3B输出的低通滤波信号s_lpf[t]和线性预测分析电路3C输出的线性预测系数alnha,进行低通滤波信号s_1pf[t]的逆滤波处理,而输出低通线性预测残留信号res[t]。
接着,在自相关系数算出电路3E上,输入了逆滤波器3D输出的低通线性预测残留信号res[t],而按照下面的式(11)进行低通线性预测残留信号res[t]的自相关分析,以求得N阶的自相关系数ac[k]。ac[k]=1-NΣt=0N-k-1res[t]*res[t+k]·····(11)]]>在最大值测出电路3F中输入自相关系数算出电路3E输出的自相关系数ac[k],而从自相关系数ac[k]检索成为正最大值的自相关系数,并输出自相关系数最大值AC_max。
接着,在噪声类似性信号算出电路3G中输入最大值测出电路3F输出的自相关系数最大值AC_max,而按照下面式(12)输出噪声类似性信号Noise_Level。式(1 2)中的AC_max h以及AC_max_1是用以规定AC_max的值的常数阈值,例如分别设AC_max_h=0.7,AC_max_l=0.2。 接着,在图6所示的噪声谱估计装置4中输入噪声类似性分析装置3输出的噪声类似性信号Noise_level,用以下方法确定对应于噪声类似性信号Noise_level的估计噪声谱更新速度系数r后,使用输入信号谱S[f]进行估计噪声谱Na[i]的更新。
在更新速度系数算出电路4A中,设定用于更新估计噪声谱Na[i]的估计噪声谱更新速度系数r,以使当前帧的输入信号谱S[f]更大地得到反映,这时噪声类似性信号Noise_level的值接近1.0左右,也就是认为当前帧为噪声的可能性大。例如,如下面的式(13)所示,使估计噪声谱更新速度系数r的设置按Noise_level的值的增大而加大。再有,在式(13)中,X1、X2、Y1、Y2各自为规定的常数,例如取x1=0.9,X2=0.5,Y1=0.1,Y2=0.01。 接着,使用和上述次频带SN比计算装置5所用的相同的频分滤波器4B,将输入信号谱S[f]转换成作为各次频带的平均谱的输入信号平均谱Sa[i],然后,在估计噪声谱更新电路4C中,按下面式(14)进行对根据过去的帧估计的估计噪声谱Na[i]的更新。在式(14)中Na_old[i]为更新前的估计噪声谱,被存储在噪声抑制装置内的存储器(未作图示)中,Na[i]为更新后的估计噪声谱。Na[i]=(1-r)·Na_old[i]+r·Sa[i];i=0,…,18 ……(14)接着,在图7所示的谱抑制量计算装置6中,基于从次频带SN比计算装置5输出的SN比SNR[i]和噪声谱估计装置4输出的估计噪声谱Na[i]求得的帧噪声能量npow,用以下的方法求得每个次频带的谱抑制量α[i]。
在帧噪声能量算出电路6A中,输入噪声谱估计装置4输出的估计噪声谱Na[i],按下面的式(15)算出作为当前帧的噪声功率的帧噪声能量npow。npow=20*log10(Σi=018Na[i])·····(15)]]>在噪声抑制量算出电路6B中,输入次频带SN比SNR[i]和帧噪声能量npow,按下面的式(16)算出谱抑制量A[i](dB),并在进行分贝→线性值转换的后,输出谱抑制量α[i]。再有,min(a,b)是返回2个自变量a,b中小的一方的值的函数。式(16)中的MIN_GAIN是用以限制过度抑制的规定常数阈值,例如取MIN_GAIN=10(dB)。A[i]=SNR[i]-min(MIN_GAIN,npow)α[i]=10A[i]/20……(16)接着,在图8所示的谱抑制装置7中,输入时间/频率转换装置2输出的输入信号谱S[f]和噪声谱抑制量计算装置6输出的谱抑制量α[i],进行输入信号谱S[f]的谱振幅抑制并输出噪声去除谱Sr[f]。
在插值电路7A中,输入谱抑制量α[i],将每个次频带i的谱抑制量展开为属于各次频带的频谱分量,然后将作为每个频谱分量f的值的谱抑制量αw[f]输出。
在谱抑制电路7B中,按照下面的式(17)进行输入信号谱S[f]的谱振幅抑制,并输出噪声去除谱Sr[f]。Sr[f]=αw[f]·S[f]……(17)在频率/时间转换装置8中,取跟时间/频率转换装置2相反的顺序,例如进行逆FFT变换,将用谱抑制装置7输出的噪声去除谱Sr[f]和时间/频率转换装置2输出的相位谱P[f],转换成作为时域信号的噪声抑制信号sr’[t]并加以输出。
在重叠相加装置9中,对于频率/时间转换装置8输出的各帧的逆FFT输出信号sr’[t]的帧边界部分进行重叠处理,并通过输出端子10输出经噪声减低处理的噪声去除信号sr[t]。
如以上图10(b)所示,根据本实施例1,在算出次频带SN比SNR[i]时,因为能够使估计噪声谱Na[i]近似当前帧的噪声谱,所以次频带SN比SNR[i]在频率方向的变动减小。因而,在噪声帧中,即使在含有功率大的频谱分量的频带上,亦能够抑制过大估计(或是过小估计)次频带SN比的误估计。使用在此频率方向上变动少的次频带SN比SNR[i],以求得谱抑制量α[i],通过用此谱抑制量α[i]进行谱振幅抑制处理,可获得能够以在全频带区域变动少的特性抑制噪声的发生而减轻残留噪声产生的效果。
例如,如下面的式(18)所示,在噪声类似性信号Noise_level大时,每个次频带i的混合率m[i]被设定为大的值,而在噪声类似性信号Noise_level小的场合,次频带混合率m[i]被设定为小的值。m
=Noise_level;1.0>=Noise_level>N_TH
,N_TH
=0.6m[1]=Noise_level;1.0>=Noise_level>N_TH[1],N_TH[1]=0.6m[9]=Noise_level;1.0>=Noise_level>N_TH[9],N_TH[9]=0.5m[10]=Noise_level;1.0>=Noise_level>N_TH[10],N_TH[10]=0.4m[11]=Noise_level;1.0>=Noise_level>N_TH[11],N_TH[11]=0.3m[18]=Noise_level;1.0>=Noise_level>N_TH[18],N_TH[18]=0.3m[i]=0.0;上述以外,i=0,...18 ……(18)并且,由于随着成为高频区噪声谱的估计精度一般会降低,所以在式(18)中次频带的混合率m[i]上,将交接噪声类似性信号Noise_level值的阈值N_TH[i]的值设为低值。因为随着变成高频区将阈值N_TH[i]的值的设定降低,可以增大高频区的次频带混合率m[i],所以能够加强高频区次频带SN比SNR[i]的平滑化,抑制高频区噪声谱的估计精度恶化,结果能进一步抑制高频区的残留噪声。
再有,并无必要在每个次频带准备式(18)中的阈值N_TH[i],例如,也可以如次频带0和1、次频带2和3、…那样,让相邻的两组次频带共用阈值。
在本实施例中,为全部的次频带准备阈值,而各自个别地执行次频带的混合率控制,但是例如在次频带0~9的低频区上,将从上述实施例1中的全频带求得的混合率m作为次频带混合率m
~m[9]输出,这以外的高频区混合率m[10]~m[18],当然也可以如使用本实施例2的形态那样采用复合结构。通过采用这种复合构造,削减用以求得混合率的运算量与存储量。
如上,依据本实施例2,在每个次频带i上使用例如噪声类似性信号Noise_level的函数,将混合率m作为次频带混合率m[i],并把随着成为高频区将噪声类似性信号Noise_level值交接至次频带混合率m[i]的阈值N-TH[i]的值设定为低值,从而增大高频区的次频带的混合率m[i],因此具有能加强高频区的次频带SN比SNR[i]的平滑化,抑制高频区噪声谱的估计精度恶化,而取得能进一步抑制高频区的残留噪声的效果。
如上,根据本实施例3,通过以对应于噪声类似性信号Noise_level的多个规定的值来设定混合率m,跟实施例1中通过时间方向上的变动的噪声类似性信号Noise_level的函数进行的混合率m控制相比较,因为混合率m的时间方向的微细的变动被吸收至规定的常数值,所以具有能够稳定地求得混合率m,并进一步抑制残留噪声产生的效果。
如上,依据本实施例4,通过用对应于噪声类似性信号Noise_level的多个规定的值来设定混合率m,跟在实施例2中用时间方向上变动的噪声类似性信号Noise_level的函数进行混合率m的控制相比较,因为次频带混合率m[i]的时间方向的微细的变动被吸收至规定的常数值,所以具有能够稳定地求得混合率m[i],并进一步抑制残留噪声产生的效果。
例如,如下面的式(20)所示,通过将噪声类似性信号Noise_level乘以基于频率的加权系数w[i],使高频区的次频带混合率m[i]变大。式(20)中的加权系数W[i]是将高频区的次频带混合率m[i]变大的加权系数。但是,加权后的次频带混合率m[i]超过1.0时,则取m[i]为1.0。
图11中所示为以式(20)的条件对混合率m[i]进行频率方向加权的例子,可以确认,高频区的次频带SN比SNR[i]的平滑化程度被加强。m
=w
*Noise_level;1.0>=Noise_level>N_TH
=0.6m[1]=w[1]*Noise_level;1.0>=Noise_level>N_TH[1]=0.6m[9]=w[9]*Noise_level;1.0>=Noise_level>N_TH[9]=0.5m[10]=w[10]*Noise_level;1.0>=Noise_level>N_TH[10]=0.4m[11]=w[1l]*Noise_level;1.0>=Noise_level>N_TH[11]=0.3m[18]=w[18]*Noise_level;1.0>=Noise_level>N_TH[18]=0.3m[i]=0.0;else,i=0,...18式中、w[i]=1.0+0.2*i/19 ……(20)如上,依据本实施例5,因为通过频率方向的加权使高频区的次频带混合率m[i]增大,而进一步减小高频区的次频带SN比SN[i]的变动而达到平滑化,所以具有能进一步抑制高频区残留噪声产生的效果。
再有,本实施例中,虽然对全部次频带进行频率方向的加权,但是也可只对于高频区的次频带加权,例如只对次频带10~18加权。
如上,根据本实施例6,通过进行频率方向的加权以增大高频区次频带混合率m[i],除了具有用规定常数的次频带混合率m[i]抑制时间方向变动的效果外,还具有能使高频区的次频带SN比SNR[i]变小来平滑化的效果,从而能进一步抑制高频的残留噪声的发生。
工业上的利用可能性综上所述,本发明的噪声抑制装置适用于在全频带范围内微小波动地抑制噪声而减轻残留噪声发生的场合。
权利要求
1.一种噪声抑制装置,其特征在于包括时间/频率转换装置、噪声类似性分析装置、噪声谱估计装置、次频带SN比计算装置、谱抑制量计算装置、谱抑制装置和频率/时间转换装置;在所述时间/频率转换装置中,每个帧上对输入信号作频率分析并将它转换为输入信号频谱和相位谱;在所述噪声类似性分析装置中计算噪声类似性信号,作为判断输入信号的帧是噪声还是语音的指标;在所述噪声谱估计装置中,输入由所述时间/频率转换装置转换的输入信号谱,算出每个小频带的输入信号平均谱,基于算出的每个小频带的输入信号平均谱和由所述噪声类似性分析装置算出的噪声类似性信号,更新根据过去的帧估计的每个小频带的估计噪声谱;在所述次频带SN比计算装置中,输入由所述噪声类似性分析装置算出的噪声类似性信号、由所述时间/频率转换装置转换的输入信号谱、由所述噪声谱估计装置更新的每个小频带的估计噪声谱,根据输入的输入信号谱计算每个小频带的输入信号平均谱,并基于输入的噪声类似性信号计算输入的每个小频带的估计噪声谱和算出的每个小频带的输入信号平均谱的混合率,然后基于输入的每个小频带的估计噪声谱、算出的每个小频带的输入信号平均谱和算出的混合率,计算每个小频带的SN比;在所述谱抑制量计算装置中,用由所述次频带SN比计算装置算出的每个小频带的SN比,计算与由上述噪声谱估计装置更新的每个小频带的估计噪声谱对应的每个小频带的谱抑制量;在所述谱抑制装置中,用由所述谱抑制量计算装置算出的每个小频带的谱抑制量,执行根据所述时间/频率转换装置转换的输入信号谱的谱振幅抑制,并输出噪声去除谱;在所述频率/时间转换装置中,用由所述时间/频率转换装置转换的相位谱,将所述谱抑制装置输出的噪声去除谱转换为时域的噪声抑制信号。
2.如权利要求1所述的噪声抑制装置,其特征在于经次频带SN比计算装置算出的混合率,由与噪声类似性信号成比例的函数确定。
3.如权利要求1所述的噪声抑制装置,其特征在于经次频带SN比计算装置算出的混合率,由在每个小频带上越往高频区将规定阈值设得越低的、与噪声类似性信号成比例的函数确定。
4.如权利要求3所述的噪声抑制装置,其特征在于经次频带SN比计算装置算出的混合率,随频率增高而增大加权。
5.如权利要求4所述的噪声抑制装置,其特征在于经次频带SN比计算装置算出的混合率,在噪声类似性信号超过规定阈值时进行加权。
6.如权利要求1所述的噪声抑制装置,其特征在于经次频带SN比计算装置算出的混合率,根据对应于噪声类似性信号的规定值进行设定。
7.如权利要求6所述的噪声抑制装置,其特征在于经次频带SN比计算装置算出的混合率,根据每个小频带的规定值进行设定。
8.如权利要求7所述的噪声抑制装置,其特征在于经次频带SN比计算装置算出的混合率,随频率增高而增大加权。
9.如权利要求8所述的噪声抑制装置,其特征在于经次频带SN比计算装置算出的混合率,在噪声类似性信号超过规定阈值时进行加权。
全文摘要
一种设有次频带SN比计算装置的噪声抑制装置,在SN比计算装置中输入噪声类似性信号、输入信号谱与每个小频带的估计噪声谱,计算每个小频带的输入信号平均谱,基于噪声类似性信号计算每个小频带的估计噪声谱和每个小频带的输入信号平均谱的混合率,再基于每个小频带的估计噪声谱、每个小频带的输入信号平均谱及混合率,算出每个小频带的SN比。
文档编号G10L19/14GK1430778SQ01810114
公开日2003年7月16日 申请日期2001年3月28日 优先权日2001年3月28日
发明者古田训, 高桥真哉 申请人:三菱电机株式会社

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:透光软膜灯饰的安装结构的制作方法技术领域:透光软膜灯饰的安装结构技术领域[0001 ] 本实用新型涉及一种透光软膜灯饰的安装结构。背景技术:[0002]用于装饰工程的透光膜,又称软膜天花可配合各种灯光系统(如霓虹灯、荧光灯) 营造

    专利发布时间:2025-05-15阅读:(88)

    专利名称:等离子刻蚀机反应室的制作方法技术领域:本实用新型涉及晶体硅太阳能电池生产领域,具体来说涉及一种晶体硅太阳能电池等离子刻蚀工艺中等离子刻蚀机反应室。背景技术:在晶体硅太阳能电池生产过程中的扩散工序中,硅片的边缘部分形成了 PN结,等

    专利发布时间:2025-05-15阅读:(77)

    专利名称:新型笛子结构的制作方法技术领域:本实用新型涉及一种中国传统民族乐器,具体涉及笛子。背景技术:近年来,围绕着如何进一步改善笛子的性能、丰富笛子的表现力,广大的专业和业余音乐工作者以及乐器制作部门进行了不懈的努力,使笛子的改革已经颇有

    专利发布时间:2025-05-15阅读:(79)

    专利名称:一种气浮导轨系统的制作方法技术领域:本发明属于精密仪器领域,具体涉及一种包括压缩空气控制气路、真空 控制气路的气浮导轨系统。背景技术:超精密气浮工件台系统是当前主流光刻机的核心子系统,要求具有纳米 级的重复定位精度与同步运动精度。

    专利发布时间:2025-05-15阅读:(91)

    专利名称:带气囊的气喇叭的制作方法技术领域:本实用新型是一种改进带气囊的气喇叭,适合于套在脚踏车等的车把上。目前,带气囊的气喇叭主要有气囊,输气管以及发声器等连接而成。当使用时,用手挤压有弹性的橡胶制成的空心球状气囊,产生压缩气体,通过输气

    专利发布时间:2025-05-15阅读:(72)

    专利名称:台灯的制作方法技术领域:台灯技术领域[0001]本实用新型涉及一种台灯,主要适用于日常生活中。背景技术:[0002]现有技术的台灯通常包括灯座和灯罩,结构设计不够合理,灯光不容易透过灯罩,照明范围不够广,不方便携带。实用新型内容[

    专利发布时间:2025-05-15阅读:(81)