当前位置:网站首页>专利 >正文

噪声抑制装置及噪声抑制方法

专利名称:噪声抑制装置及噪声抑制方法
技术领域
本发明涉及噪声抑制装置及噪声抑制方法,特别涉及用于语音通信装置及语音识别装置而抑制背景噪声的噪声抑制装置及噪声抑制方法。
背景技术
通常,低比特率语音编码装置对于没有背景噪声的语音,可以提供高质量的语音通话,但对于含有背景噪声的语音,会产生低比特率编码特有的刺耳的失真,而带来音质的恶化。
作为用于对付这样的音质恶化而施行的噪声抑制/语音强调技术,比如有频谱减少法(以下,称为“SS法”)等。
SS法中,在无声区间估计噪声分量的性质。然后,通过从含有噪声分量的语音信号的短时功率频谱(以下,称为“语音功率频谱”)减去噪声分量的短时功率频谱,或通过对该语音功率频谱乘以衰减系数,而生成抑制了噪声分量的语音功率频谱(例如,参照非专利文献1)。
又,SS法中,将估计出的噪声分量的频谱特性视为是稳定的,作为基底噪声从语音功率频谱中被均一地减去。但是,实际上噪声分量的频谱特性并不是稳定的,所以减去基底噪声后的残留噪声,特别是由于语音音调之间的残留噪声,会产生称为乐音噪声的不自然的失真。
作为用于抑制这种乐音噪声的现有的噪声抑制方法,有人提出使用基于语音功率与噪声功率之比值(SNR)的衰减系数进行乘法运算的手法(例如,参照专利文献1及专利文献2)等。根据这个方法,将语音相对较大的频带(SNR较高的频带)及噪声相对较大的频带(SNR较低的频带)相互区别开来,使用不同的衰减系数。
专利文献1日本专利公报2714656号专利文献1日本专利公表公报特表平10-513030号非专利文献1″Suppression of acoustic noise in speech using spectralsubtraction″,Boll,IEEE Trans.Acoustics,Speech,and Signal Processing,vol.ASSP-27,pp.113-120,1979发明内容发明需要解决的问题但是,上述现有的噪声抑制方法中,虽然利用SNR区别声音频带和噪声频带,但特别是当噪声分量的频谱特性不稳定的时候,不能够高精度地进行所述区别,即,语音失真的减少和噪声抑制的精确度存在一定的限度。
因此,本发明的目的是,提供一种能够减在少语音失真的同时,提高噪声抑制精确度的噪声抑制装置及噪声抑制方法。
解决该问题的方案本发明的噪声抑制装置包括抑制单元,利用含有了噪声分量的语音功率频谱中的有声频带和噪声频带的检测结果,抑制所述语音功率频谱中的噪声分量;提取单元,从所述语音功率频谱中提取音调谐波功率频谱;有声性判定单元,根据提取出的音调谐波功率频谱,判定所述语音功率频谱的有声性;修复单元,修复提取出的音调谐波功率频谱;以及修正单元,在经修复的音调谐波功率频谱及提取出的音调谐波功率频谱中,基于所述有声性判定单元的判定结果所选择的音调谐波功率频谱,修正所述检测结果。
本发明的噪声抑制方法为一种利用含有噪声分量的语音功率频谱中的有声频带和噪声频带的检测结果,从所述语音功率频谱抑制所述噪声分量的噪声抑制方法,包括提取步骤,从所述语音功率频谱中提取音调谐波功率频谱;有声性判定步骤,根据提取出的音调谐波功率频谱,判定所述语音功率频谱的有声性;修复步骤,修复提取出的音调谐波功率频谱;以及修正步骤,在经修复的音调谐波功率频谱及提取出的音调谐波功率频谱中,基于所述有声性判定单元的判定结果所选择的音调谐波功率频谱,修正所述检测结果。
本发明的噪声抑制程序为一种利用含有噪声分量的语音功率频谱中的有声频带和噪声频带的检测结果,抑制所述语音功率频谱中的噪声分量的噪声抑制程序,该程序使计算机实现提取步骤,从所述语音功率频谱中提取音调谐波功率频谱;有声性判定步骤,根据提取出的音调谐波功率频谱,判定所述语音功率频谱的有声性;修复步骤,修复提取出的音调谐波功率频谱;以及修正步骤,在经修复的音调谐波功率频谱及提取出的音调谐波功率频谱中,基于所述有声性判定单元的判定结果所选择的音调谐波功率频谱,修正所述检测结果。
发明的有益效果根据本发明,能够在减少语音失真的同时,提高噪声抑制精确度。


图1是表示本发明实施方式1的噪声抑制装置的结构的方框2A是表示有声频带及噪声频带的检测结果的2B是表示音调(pitch)谐波功率频谱的提取结果的2C是表示音调谐波的峰值的提取结果的2D是表示音调谐波功率频谱的修复结果的2E是表示图2A所示的检测结果的修正结果的3是表示本发明实施方式2的噪声抑制装置的结构的方框4是表示本发明实施方式3的噪声抑制装置的结构的方框5是表示本发明实施方式4的噪声抑制装置的结构的方框6是说明本发明实施方式4的噪声抑制装置中的操作的流程图具体实施方式
以下,参照附图对本发明的实施方式进行详细说明。
(实施方式1)图1是表示根据本发明实施方式1的噪声抑制装置的结构的方框图。本实施方式的噪声抑制装置100包括开窗单元101、FFT(Fast Fourier Transform)单元102、基底噪声估计单元103、频带有声/噪声检测单元104、音调谐波构造提取单元105、有声性判定单元106、音调频率估计单元107、音调谐波构造修复单元108、每频带有声/噪声修正单元109、减法/衰减系数计算单元110、乘法单元111以及IFFT(Inverse Fast Fourier Transform)单元112。
开窗单元101,将含有噪声分量的输入语音信号分割为规定的时间单位的帧单位,并对这种帧进行利用汉宁窗(Hanning Window)等的开窗处理,并输出到FFT单元102。
FFT单元102,对于从开窗单元101输入的帧,即分割为帧单位的语音信号进行FFT,将语音信号变换到频域。由此,得到语音功率频谱。而帧单位的语音信号成为具有规定的频带的语音功率频谱。由此从帧所生成的语音功率频谱输出到基底噪声估计单元103、频带有声/噪声检测单元104、音调谐波构造提取单元105、音调频率估计单元107、减法/衰减系数计算单元110以及乘法单元111。
基底噪声估计单元103,根据输入的语音功率频谱估计只含有噪声分量的信号的频率振幅频谱,即基底噪声。估计出的基底噪声输出到频带有声/噪声检测单元104、音调谐波构造提取单元105、有声性判定单元106、音调频率估计单元107以及减法/衰减系数计算单元110。
另外,基底噪声估计单元103,在语音功率频谱的频带的各频率分量中,对于基于来自FFT112的最新帧所生成的语音功率频谱及根据基于之前的帧所生成的语音功率频谱所估计出的基底噪声进行比较。然后,根据比较结果,当两者的功率差超过事先规定的阈值时,判定最新帧含有语音分量而不进行基底噪声的估计。而当此差值不超过上述阈值时,判定最新帧不含有语音分量而进行基底噪声的更新。
每频带有声/噪声检测单元104,基于来自FFT单元102的语音功率频谱及基底噪声估计单元103的基底噪声,检测出语音功率频谱中的有声频带及噪声频带。检测结果输出到每频带有声/噪声修正单元109。
音调谐波构造提取单元105,基于从FFT单元102的语音功率频谱及基底噪声估计单元103的基底噪声,从语音功率频谱中提取音调谐波构造,即音调谐波功率频谱。提取出的音调谐波功率频谱输出到有声性判定单元106及音调谐波构造修复单元108。
有声性判定单元106,基于来自基底噪声估计单元103的基底噪声及来自音调谐波构造提取单元105的音调谐波功率频谱,判定语音功率频谱的有声性。判定结果输出到音调频率估计单元107及音调谐波构造修复单元108。
音调频率估计单元107,基于来自FFT单元102的语音功率频谱及来自基底噪声估计单元103的基底噪声,估计语音功率频谱的音调频率。另外,根据有声性判定单元106的判定结果,当语音功率频谱的有声性为规定水平以下时,不进行音调频率估计。估计结果输出到音调谐波构造修复单元108。
音调谐波构造修复单元108,基于来自音调谐波构造提取单元105的音调谐波功率频谱及来自音调频率估计单元107的估计结果,修复音调谐波构造,即音调谐波功率频谱。另外,在有声性判定单元106的判定结果是,语音功率频谱的有声性为规定水平以下时,不进行音调谐波功率频谱的修复。经修复的音调谐波功率频谱输出到每频带有声/噪声修正单元109。
每频带有声/噪声修正单元109,根据经音调谐波构造修复单元108修复的音调谐波功率频谱及由音调谐波构造提取单元105提取出的音调谐波功率频谱中,依据有声性判定单元106的判定结果所选择的音调谐波功率频谱,修正检测结果。例如,根据有声性判定的结果,当判定语音功率频谱的有声性为规定水平以下时,选择提取出的音调谐波功率频谱。此时,通过组合来自音调谐波构造提取单元105的音调谐波功率频谱及来自每频带有声/噪声检测单元104的检测结果,来修正检测结果。而当判定语音功率频谱的有声性高于规定水平时,选择经修复的音调谐波功率频谱。此时,每频带有声/噪声修正单元109通过组合来自音调谐波构造修复单元108的音调谐波功率频谱及来自每频带有声/噪声检测单元104的检测结果,来修正检测结果。经修正的检测结果输出到减法/衰减系数计算单元110。
减法/衰减系数计算单元110,基于来自FFT单元102的语音功率频谱、来自基底噪声估计单元103的基底噪声以及来自每频带有声/噪声修正单元109的检测结果,计算减法/衰减系数。计算出的减法/衰减系数输出到乘法单元111。
乘法单元111,将来自FFT单元102的语音功率频谱中的有声频带及噪声频带,乘上来自减法/衰减系数计算单元110的减法/衰减系数。由此,得到抑制了噪声分量的语音功率频谱。此乘法运算结果输出到IFFT单元112。
换言之,减法/衰减系数计算单元110及乘法单元111的组合构成利用包含噪声分量的语音功率频谱中的有声频带和噪声频带的检测结果从语音功率频谱抑制噪声分量的抑制单元。
IFFT单元112,对于作为来自乘法单元111的乘法运算结果的语音功率频谱进行IFFT。由此,基于抑制了噪声分量的语音功率频谱生成语音信号。
以下,对具有上述结构的噪声抑制装置100的操作进行说明。图2A~图2E是为了说明有声频带及噪声频带的检测结果的修正操作的图。
首先,在FFT单元102中,取得语音功率频谱SF(k)。语音功率频谱SF(k)可以用下面的算式(1)来表示。
数1SF(k)=Re{DF(k)}2+Im{DF(k)}2,1≤k≤HB/2...(1)]]>
这里,k表示指定语音功率频谱的频带的频率分量的号码。HB为FFT变换长度,即进行高速傅立叶变换的对象的数据数目,例如HB=512。Re{DF(k)}及Im{DF(k)}分别表示FFT变换后的语音功率频谱DF(k)的实部和虚部。另外,在算式(1)中使用了平方根,但不使用平方根也可以计算出SF(k)。
接着,在基底噪声估计单元103中,利用算式(2)进行基于语音功率频谱SF(k)的基底噪声NB(N,k)的估计。
数2NB(n,k)=NB(n-1,k)SF(k)>ΘB·NB(n-1,k)(1-α)·NB(n-1,k)+α·SF(k)SF(k)≤ΘB·NB(n-1,k),1≤k≤HB/2...(2)]]>其中,N表示帧号码。又,NB(N-1,k)为在前一帧中的基底噪声的估计值。α为基底噪声的移动平均系数,ΘB为辨别语音分量及噪声分量的阈值。
接着,在每频带有声/噪声检测单元104中,如图2A所示,基于语音功率频谱SF(k)及基底噪声NB(N,k),检测出语音功率频谱SF(k)中的有声频带及噪声频带。有声频带及噪声频带的检测结果SN(k)通过使用了算式(3)的计算而得到。如果通过计算所得的差大于零,则判定为含有语音分量的语音频带。如果差为零以下,则判定为不含有语音分量的噪声频带。其中,γ1为常数。
数3SN(k)=SF(k)-γ1·NB(n,k)SF(k)>γ1·NB(n,k)0SF(k)≤γ1·NB(n,k),1≤k≤HB/2...(3)]]>接着,在音调谐波构造提取单元105中,如图2B所示,基于语音功率频谱SF(k)及基底噪声NB(N,k),提取音调谐波功率频谱HM(k)。音调谐波功率频谱HM(k)通过使用了算式(4)的计算而提取出来。其中,γ2为满足γ2>γ1的常数。
数4HM(k)=SF(k)-γ2·NB(n,k)SF(k)>γ2·NB(n,k)0SF(k)≤γ2·NB(n,k),1≤k≤HB/2...(4)]]>
接着,在有声性判定单元106中,基于基底噪声NB(n,k)及音调谐波功率频谱HM(k),判定语音功率频谱SF(k)的有声性。在本实施方式中,将语音功率频谱SF(k)的频带(1~HB/2)中的特定的频带(1~HP)作为有声性判定的对象频带。即,HP为判定对象频带内的上限的频率分量。
将频带(1~HB/2)三分为低频、中频、高频,将各频带作为特定的频带进行有声性判定则更好。或者,采用将频带(1~HB/2)二分为低频及高频,将各频带作为特定的频带进行有声性判定的结构亦可。如此,通过在分割频带而得到的各个频带中进行有声性判定,能够将在高质量地提取到音调谐波功率频谱HM(k)的频带与并非如此的频带中是否进行音调谐波功率频谱HM(k)的修复分开。
另外,当有声性判定单元106采用如下结构时,即基于分割频带而得到的各频带的有声性判定结果,识别原来的语音为辅音还是元音时,能够根据辅音或元音而决定是否进行音调谐波功率频谱HM(k)的修复。
特定的频带的有声性判定通过使用算式(5)计算对应于音调谐波功率频谱HM(k)中的特定频率部分的功率总和值与对应于基底噪声NB(N,k)中的特定频率部分的功率总和值之比而得到。根据此判定结果,当特定的频带的有声性高于规定水平时,进行后述的音调频率估计及音调谐波构造修复。
数5VS=Σk=1HPHM(k)/ΣkHPNB(n,k)...(5)]]>另一方面,当特定的频带的有声性为规定水平以下时,不进行音调频率估计及音调谐波构造修复。此时,在每频带有声/噪声修正单元109中,基于提取出的音调谐波功率频谱HM(k),修正语音功率频谱SF(k)中的有声频带及噪声频带的检测结果SN(k)中对应于特定频带的部分。换言之,不进行基于经修复的音调谐波功率频谱HM(k)的、对检测结果SN(k)中对应于特定频带的部分的修正。因此,可以有选择性地使用高精度的音调谐波功率频谱HM(k),显著提高有声频带及噪声频带的检测精确度。
另外,在以下的说明中,设想特定的频带的有声性高于规定水平的情况。
在音调频率估计单元107,利用算式(6),从对应于语音功率频谱SF(k)中的特定频带的部分中,减去对应于基底噪声NB(n,k)中的特定频带的部分的β倍。接着,利用算式(7)计算减法运算结果QF(k)的自相关函数RP(m)。然后,将对应于自相关函数RP(m)的最大值的m作为音调频率。
数6QF(k)=SF(k)-β·NB(m,k)1≤k≤HM…(6)数7RP(m)=Σk=1HM-mQF(k)·QF(k+m),1≤m≤PM...(7)]]>接着,在音调谐波构造修复单元108中,修复音调谐波功率频谱HM(k)中对应于特定频带的部分。更具体而言,当特定的频带的有声性被判定为高于规定水平时,按下面的步骤进行修复。
第一,如图2C所示,提取音调谐波功率频谱HM(k)中的音调谐波的峰值(p1~p5、p9~p12)。另外,音调谐波峰值的提取也可以只针对特定的频带而进行。第二,计算提取出的峰值的间隔。计算出的间隔超过规定的阈值(例如,音调频率的1.5倍)时,如图2D所示,根据估计出的音调频率m,插入音调谐波功率频谱HM(k)中所欠缺的峰值。这样,音调谐波功率频谱HM(k)得到修复。
接着,在每频带有声/噪声修正单元109中,如图2E所示,在检测结果SN(k)中,将与经修复的音调谐波功率频谱HM(k)重复的部分作为有声频带,而将不与经修复的音调谐波功率频谱HM(k)重复的部分作为噪声频带。如此来进行检测结果SN(k)的修正。
接着,在减法/衰减系数计算单元110中,基于语音功率频谱SF(k)及基底噪声NB(n,k),对经修正的检测结果SN(k)内的有声频带及噪声频带分别计算减法/衰减系数GC(k)。计算中使用下面的算式(8)。这里,μ为常数,又,gC为大于零且小于1的规定的常数。
数8
这样,根据本实施方式,因为基于音调谐波功率频谱HM(k)修正有声频带及噪声频带的检测结果SN(k),所以即使当噪声分量的频谱特性不稳定时,也能够以高精度进行有声频带及噪声频带的检测。其结果,能够对有声频带及噪声频带分别进行衰减程度相对较弱的减法运算处理及衰减程度相对较强的衰减处理。据此,即使增大衰减量,也能够在减少语音失真的同时,提高噪声抑制精确度。再者,根据本实施方式,根据提取出的音调谐波功率频谱HM(k)及经修复的音调谐波功率频谱HM(k)当中,依据语音功率频谱SF(k)的有声性的判定结果所选择的音调谐波功率频谱,修正检测结果SN(k),所以能够进一步提高检测结果SN(k)的精确度,进一步提高噪声抑制的精确度。
(实施方式2)图3是表示根据本发明实施方式2的噪声抑制装置的结构的方框图。另外,在本实施方式中所说明的噪声抑制装置与在实施方式1中所说明的噪声抑制装置具有基本相同的结构,因此对相同或对应的结构单元赋予相同的参考符号,省略其详细说明。
图3所示的噪声抑制装置200的结构为除了具有实施方式1中所说明的噪声抑制装置100的结构单元,还具有语音/噪声帧判定单元201。
语音/噪声帧判定单元201,基于来自FFT单元102的语音功率频谱及来自基底噪声估计单元103的基底噪声,判定语音功率频谱所得到的帧为语音帧还是噪声帧。判定结果输出到有声性判定单元106及每频带有声/噪声修正单元109。
以下,对语音/噪声帧判定单元201的帧判定操作进行更加详细的说明。
在语音/噪声帧判定单元201中,首先,根据来自FFT部102的语音功率频谱SF(k)及来自基底噪声估计单元103的基底噪声NB(n,k),利用下面的算式(9)及算式(10)计算两个比值。两个比值中的一个为语音功率频谱SF(k)的频带中低频带上的语音功率与噪声功率之比SNRL,而另一个为语音功率频谱SF(k)的频带中全频带上的语音功率与噪声功率之比SNRF。其中,HL为上述低频带中的上限频率分量,HF为语音功率频谱SF(k)的频带中的上限频率分量。
数9SNRL={Σk=1HLSF(k)-βL·Σk=1HLNB(n,k)}/Σk=1HLNB(n,k)...(9)]]>
数10SNRF={Σk=1HFSF(k)-βF·Σk=1HFNB(n,k)}/Σk=1HFNB(n,k)...(10)]]>接着,计算算出的两个比值SNRL、SNRF的相关值RLF(=SNRL·SNRL)。然后,利用下面的算式(11)进行帧判定。作为利用了算式(11)的帧判定的结果,生成帧信息SNF。帧信息SNF是表示作为判定对象的帧为语音帧还是噪声帧的信息。在算式(11)中,M为拖尾帧(Hang-over Frame)的数目。另外,当RLF为ΘSN以下的情况不持续M帧时,帧判定结果为语音帧。
数11
当判定对象的帧被判定为语音帧时,在有声性判定单元106及每频带有声/噪声修正单元109中,进行通常的操作(实施方式1中所说明的操作)。另一方面,当判定对象的帧被判定为噪声帧时,在有声性判定单元106中,强制性地判定从作为判定对象的帧所生成的语音功率频谱SF(k)的频带中的全频带的有声性为规定的水平以下。其结果,在每频带有声/噪声修正单元109中,将全频带视为噪声频带而进行修正。
这样,根据本实施方式,因为作为判定对象的帧被判定为噪声帧时,语音功率频谱SF(k)的全频带的有声性被判定为规定的水平以下,所以能够省去对噪声帧的不必要的检测结果SN(k)修正处理,能够减轻修正单元的负荷。
另外,根据本实施方式,因为计算语音功率频谱SF(k)的低频带上的功率比SNRL与语音功率频谱SF(k)的全频带上的功率比SNRF的相关值RLF,并基于此相关值RLF进行帧判定,所以除了能够强调低频带和全频带之间的相关性较高的语音分量的功率频谱,还能够降低相关性较低的噪声分量的功率频谱。其结果,能够提高帧判定的精确度。
(实施方式3)图4是表示根据本发明实施方式3的噪声抑制装置的结构的方框图。另外,在本实施方式中所说明的噪声抑制装置与在实施方式1中所说明的噪声抑制装置具有基本相同的结构,因此对相同或对应的结构单元赋予相同的参考符号,省略其详细说明。
图4所示的噪声抑制装置300的结构为除了具有实施方式1中所说明的噪声抑制装置100的结构单元以外,还附加了减法/衰减系数平均处理单元301。
减法/衰减系数平均处理单元301对作为减法/衰减系数计算单元110的计算结果而得到的减法/衰减系数,在时域及频域分别进行平均化。经平均化的减法/衰减系数输出到乘法单元111。
换言之,在本实施方式中,减法/衰减系数计算单元110、减法/衰减系数平均处理单元301以及乘法单元111的组合构成利用含有噪声分量的语音功率频谱中的有声频带及噪声频带的检测结果而从语音功率频谱抑制噪声分量的抑制单元。
以下,对减法/衰减系数平均处理单元301的系数平均处理进行更加详细的说明。
首先,在减法/衰减系数平均处理单元301中,对于由减法/衰减系数计算单元110中的计算而得到的减法/衰减系数,利用算式(12)在时域进行平均化。其中,αF及αL为满足αF>αL关系的移动平均系数。
数12G‾T(n,k)=(1-αF)·G‾T(n-1,k)+αF·GC(k)GC(k)>G‾T(n-1,k)(1-αL)·G‾T(n-1,k)+αL·GC(k)GC(k)≤G‾T(n-1,k),1≤k≤HB/2...(12)]]>另外,利用下面的算式(13),对减法/衰减系数在频域进行平均化。这里,KH-KL是作为平均化对象范围的频率分量的数目。
数13G‾F(k)=1KH-KLΣi=k-KLk+KHG‾T(n,i),1≤k≤HB/2...(13)]]>接着,对于利用算式(12)而进行了时间平均处理的减法/衰减系数及利用算式(13)而进行了频率平均处理的减法/衰减系数进行比较,按照它们的大小关系,选择在乘法单元111中所使用的减法/衰减系数。例如,如算式(14)所示,当经时间平均处理的减法/衰减系数大于经频率平均处理的减法/衰减系数时,选择经时间平均处理的减法/衰减系数,否则选择经频率平均处理的减法/衰减系数。
数14G‾C(k)=G‾T(n,k)G‾T(n,k)>G‾F(k)G‾F(k)G‾T(n,k)≤G‾F(k),1≤k≤HB/2...(14)]]>这样,根据本实施方式,因为对用于噪声抑制的减法/衰减系数进行时间平均处理,所以能够改善由于减法/衰减系数在时间轴上的急剧变化而产生的语音的不连续性,并减少随残留噪声的变动而生的语音失真。
再者,根据本实施方式,因为对用于噪声抑制的减法/衰减系数进行频率平均处理,所以能够降低在频率轴上的衰减量的不连续性,即使增大噪声衰减量也能够减少语音失真。
另外,本实施方式中所说明的减法/衰减系数平均处理单元301也可以应用于在实施方式2中所说明的噪声抑制装置200中。
(实施方式4)图5是表示根据本发明实施方式4的噪声抑制装置的结构的方框图。另外,在本实施方式中所说明的噪声抑制装置与在实施方式1中所说明的噪声抑制装置具有基本相同的结构,因此对相同或对应的结构单元赋予相同的参考符号,省略其详细说明。
图5所示的噪声抑制装置400的结构为除了具有实施方式1中所说明的噪声抑制装置100的结构单元以外,还附加了死锁防止单元401。
噪声抑制单元400中的基底噪声估计单元103除了进行在实施方式1中所说明的操作外,还在噪声分量的水平急剧变化时,停止基底噪声的更新,即产生死锁(dead lock)状态。
死锁防止单元401具有计数器。计数器对应于语音功率频谱的频带中的频率分量设计而成,并对由基底噪声估计单元103估计出的基底噪声中相应的频率分量的功率持续地高于规定值的次数进行计数。死锁防止单元401基于所计的次数防止基底噪声估计单元103的基底噪声更新停止,即防止死锁状态。
以下,对于噪声抑制装置400中防止死锁状态的操作,利用图6进行详细说明。
首先,在步骤S1000,死锁防止单元401判定语音功率频谱SF(k)是否为基底噪声NB(n,k)的ΘB倍以下。根据判定结果,当语音功率频谱SF(k)为基底噪声NB(n,k)的ΘB倍以下时(S1000YES),在基底噪声估计单元103中,进行通常的基底噪声估计(S1010)。接着,在步骤S1020中,将设在死锁防止单元401中的计数器所计的次数count(k)重设为零。然后,返回步骤S1000。
又,根据步骤S1000中的判定结果,当语音功率频谱SF(k)大于基底噪声NB(N,k)的ΘB倍时(S1000“否”),计数器则计上次数count(k)(S1030)。接着,在步骤S1040中,死锁防止单元401将次数count(k)与规定的阈值比较。比较的结果,当次数count(k)大于阈值时(S1040“是”),死锁防止单元401将含有相应的频率分量k的规定频带中的噪声功率频谱的最小值作为基底噪声NB(n,k)的更新值(S1050),利用这个更新值更新基底噪声(S1060)。然后,返回步骤S1000。另外,在步骤S1040中的比较结果是次数count(k)为阈值以下时(S1040“否”),直接返回步骤S1000。
这样,当语音功率频谱SF(k)中的功率持续为规定值以上规定次数时,能够使用含有频率分量k的规定频带中的噪声功率频谱的功率最小值更新基底噪声NB(n,k),据此,无论是语音区间还是噪声区间都能够防止死锁状态。另外,上述规定频带设在音调谐波上的峰值之间则更好。这样,能够检测出噪声功率频谱的波谷,能够轻易的检测出作为更新值的噪声功率频谱的最小值。
另外,本实施方式中所说明的死锁防止单元401,也可以在实施方式2、3中所说明的噪声抑制装置200、300中使用。
另外,本发明可以采用各种各样的实施方式,并不只限于实施方式1~4中所说明的方式。例如,将上述的噪声抑制方法作为软件在计算机上实行亦可。即,将实行上述实施方式中所说明的噪声抑制方法的程序预先存储在比如ROM(Read Only Memory)等存储媒质中,通过CPU(Central Processor Unit)运行该程序,能够施行本发明的噪声抑制方法。
另外,用于上述各实施方式说明的各功能模块,典型地由集成电路LSI来实现。这些功能块既可以分别实行单芯片化,也可以包括其中一部分或者是全部而实行单芯片化。
这里,虽然称作LSI,但根据集成度的不同也可以称为IC(集成电路)、系统LSI(系统大规模集成电路)、超LSI(超大规模集成电路)、极大LSI(极大规模集成电路)。
另外,集成电路化的技术不仅限于LSI,也可以使用专用电路或通用处理器来实现。可利用在制造LSI后,可编程的FPGA(Field Programmable GateArray,现场可编程门阵列),或可重构LSI内部的电路单元的连接或设定的可重构处理器(Reconfigurable Processor)。
再有,如果随着半导体技术的进步或者其他技术的派生,出现了替换LSI集成电路的技术,当然,也可以利用该技术来实现功能模块的集成化。也有应用生物工程学技术等的可能性。
本说明书基于2004年6月18日申请的日本专利申请第2004-181454号。该全部内容包括在此作参考。
工业实用性本发明的噪声抑制装置及噪声抑制方法具有在减少语音失真的同时,提高噪声抑制精确度的效果,可以适用于语音通信装置及语音识别装置等。
权利要求
1.一种噪声抑制装置,包括抑制单元,利用包含了噪声分量的语音功率频谱中的有声频带和噪声频带的检测结果,从所述语音功率频谱抑制所述噪声分量;提取单元,从所述语音功率频谱中提取音调谐波功率频谱;有声性判定单元,基于提取出的音调谐波功率频谱,判定所述语音功率频谱的有声性;修复单元,修复提取出的音调谐波功率频谱;以及修正单元,在经修复的音调谐波功率频谱及提取出的音调谐波功率频谱中,基于所述有声性判定单元的判定结果所选择的音调谐波功率频谱,修正所述检测结果。
2.根据权利要求1所述的噪声抑制装置,其中,所述语音功率频谱具有规定的频带,所述有声性判定单元,判定所述规定的频带中特定频带的有声性,所述修正单元,在所述有声性判定单元的判定结果是所述特定频带的有声性为所述规定水平以上时,对于所述检测结果中对应于所述特定频带的部分,基于经修复的音调谐波功率频谱进行修正,而当所述特定频带的有声性为所述规定水平以下时,对于所述部分,基于提取出的音调谐波功率频谱进行修正。
3.根据权利要求2所述的噪声抑制装置,其中,还包括基底噪声估计单元,根据所述语音功率频谱估计出基底噪声,所述有声性判定单元,基于提取出的音调谐波功率频谱中对应于所述特定频带的部分的功率总和值与估计出的基底噪声中对应于所述特定频带的部分的功率总和值的比值,判定所述特定频带的有声性。
4.根据权利要求2所述的噪声抑制装置,其中,所述语音功率频谱从所输入的帧中得到,还包括帧判定单元,判定所述帧为语音帧还是噪声帧,所述有声性判定单元,在所述帧判定单元的判定结果是所述帧被判定为噪声帧时,判定为所述规定的频带中全频带的有声性在所述规定水平以下。
5.根据权利要求2所述的噪声抑制装置,其中,所述抑制单元包括时间平均处理单元,对于从所述检测结果中得到的系数,在时域进行平均化;以及乘法单元,将经平均化的所述系数乘以所述语音功率频谱。
6.根据权利要求2所述的噪声抑制装置,其中,所述抑制单元包括频率平均处理单元,对于从所述检测结果中得到的系数,在频域进行平均化;以及乘法单元,将经平均化的所述系数乘以所述语音功率频谱。
7.根据权利要求2所述的噪声抑制装置,其中包括更新停止单元,停止基底噪声的更新;以及防止单元,当所述语音功率频谱中的所述规定的频带上的频率分量的功率持续为规定值以上规定次数时,防止所述更新停止单元停止基底噪声更新。
8.一种噪声抑制方法,利用含有噪声分量的语音功率频谱中的有声频带和噪声频带的检测结果,从所述语音功率频谱抑制所述噪声分量,其特征在于,该方法包括提取步骤,从所述语音功率频谱中提取音调谐波功率频谱;有声性判定步骤,基于提取出的音调谐波功率频谱,判定所述语音功率频谱的有声性;修复步骤,修复提取出的音调谐波功率频谱;以及修正步骤,在经修复的音调谐波功率频谱及提取出的音调谐波功率频谱当中,基于所述有声性判定单元的判定结果所选择的音调谐波功率频谱,修正所述检测结果。
9.一种噪声抑制程序,利用含有噪声分量的语音功率频谱中的有声频带和噪声频带的检测结果,从所述语音功率频谱抑制所述噪声分量,该程序使计算机实现提取步骤,从所述语音功率频谱中提取音调谐波功率频谱;有声性判定步骤,基于提取出的音调谐波功率频谱,判定所述语音功率频谱的有声性;修复步骤,修复提取出的音调谐波功率频谱;以及修正步骤,在经修复的音调谐波功率频谱及提取出的音调谐波功率频谱当中,基于所述有声性判定单元的判定结果所选择的音调谐波功率频谱,修正所述检测结果。
全文摘要
公开了能够在减少语音失真的同时,提高噪声抑制精确度的噪声抑制装置。在该装置中,抑制单元利用包含了噪声分量的语音功率频谱中的有声频带和噪声频带的检测结果,从语音功率频谱抑制噪声分量。音调谐波构造提取单元(105)从语音功率频谱中提取音调谐波功率频谱。有声性判定单元(106)基于提取出的音调谐波功率频谱,判定语音功率频谱的有声性。音调谐波构造修复单元(108)修复所提取出的音调谐波功率频谱。每频带有声/噪声修正单元(109)在经修复的音调谐波功率频谱及提取出的音调谐波功率频谱中,基于有声性判定单元(106)的判定结果所选择的音调谐波功率频谱,修正检测结果。
文档编号G10L21/0232GK1969320SQ200580020128
公开日2007年5月23日 申请日期2005年5月30日 优先权日2004年6月18日
发明者王幼华, 河嵨拓也, 吉田幸司 申请人:松下电器产业株式会社

喜欢就赞一下

上一篇
下一篇

相关推荐

    便携式led灯具的制作方法【专利摘要】一种便携式LED灯具,包括:壳体,为椭球形或圆球形的球缺结构,壳体的平面形表面设有开口;透明件,可拆卸地设于壳体的开口,并密封壳体的开口;LED光源结构,设于壳体的开口处,并对应透明件设置,LED光源结

    专利发布时间:2025-05-15阅读:(89)

    专利名称:照像机机内胶片切割装置的制作方法技术领域:本发明涉及一种照像机机内胶片切割装置。在使用现在市场上出售的照像机时,人们一般都要将36张胶卷全部照完后,才把胶卷取出冲洗。当遇到紧急情况需要尽早看到照片结果而胶卷又未全部照完时,只得在暗

    专利发布时间:2025-05-15阅读:(76)

    专利名称:可部分旋转的眼镜镜腿的制作方法技术领域:本实用新型涉及一种日常用品,具体地说,涉及一种眼镜框架的组件。背景技术:常见的眼镜框架,其镜腿是由一根金属脚丝外面包裹树脂或塑料等相对软质的材料所构成,该结构一般是一体成型的,结构稳固但过于

    专利发布时间:2025-05-15阅读:(72)

    专利名称:喇曼放大的色散补偿组件的制作方法背景技术:发明领域本发明涉及对通过光纤传输的光信号的色散进行补偿的组件。对现有技术的讨论通常,将包括一或多根色散补偿光纤(DCF)的色散补偿组件(DCM)称为用于对通过光纤通信系统的光纤传输的光信号

    专利发布时间:2025-05-15阅读:(80)

    专利名称:一种基于听觉感知特性的语音质量客观评价方法技术领域:本发明涉及一种基于人耳听觉感知特性的语音质量客观评价技术,更具体地,涉及一种将人耳的听觉模型引入MFCC特征参数的提取过程中,通过计算特征参数的失真程度来实现语音质量客观评价的方

    专利发布时间:2025-05-15阅读:(71)

    专利名称:图像形成设备的制作方法技术领域:本发明的一方面涉及一种图像形成设备,更具体地讲,涉及这样一种图像形成设备,其具有用于将从墨粉盒中泄漏的墨粉去除的墨粉去除器。背景技术: 通常,图像形成设备通过将光照射到充到期望电势的感光介质上以在其

    专利发布时间:2025-05-15阅读:(85)