当前位置:网站首页>专利 >正文

基于非局部均值滤波的语音增强方法

基于非局部均值滤波的语音增强方法
【专利摘要】本发明公开了一种基于非局部均值滤波的语音增强方法,主要解决现有技术在语音增强后易产生音乐噪声的问题。其实现步骤是:(1)输入带噪语音,计算带噪语音信号功率谱;(2)对带噪语音信号功率谱进行修改谱减法预处理,得到带噪语音估计功率谱;(3)由估计功率谱得到估计频谱,再对估计频谱进行短时傅立叶逆变换,得到预处理后语音;(4)对预处理后语音进行非局部均值滤波,计算语音修正值;(5)使用计算出来的修正值替代原始含噪语音信号。本发明为以非局部原理为基础,通过对待增强点邻域内的相似点进行加权平均,既能抑制背景噪声同时保持了语音清晰度,有效提高了语音质量,可用于移动通信。
【专利说明】基于非局部均值滤波的语音增强方法
【技术领域】
[0001]本发明属于语音处理【技术领域】,具体地说是基于非局部均值滤波,利用信号邻域内相似信号点加权平均来降低语音噪声,可用于移动通信。
【背景技术】
[0002]语音是人类特有的功能,也是相互传递信息的最主要手段。现实生活中的语音不可避免的要受到周围环境的影响。一些较强的背景噪声,如机械噪声、其他说话者的语音等均会严重的影响语音信号的质量。此外,传输系统本身也会产生各种噪声,因此在接收端的信号为带噪语音信号。语音增强的主要目标就是在接收端尽可能从带噪语音中提取纯净的语音信号,降低听众的听觉疲劳程度,提高可懂度。
[0003]语音增强是语音信号处理的一个重要分支,一直活跃的研究领域。人们对语音增强的研究已有一个世纪的历史。早在上个世纪初,Bell实验室的研究人员就对电话系统的音节清晰度进行了系统的实验。七十年代后期,电子计算机技术的进步促进了语音信号处理技术的迅速发展。谱减法是这个时期最具影响的语音增强算法。在八十年代至今,语音识别与移动通信技术的飞速发展为语音增强的研究提供了动力,各种新算法以及原有算法的改进形式相继问世。如基于信号子带空间的语音增强算法;利用人工神经网络实现语音增强的方法;基于小波分解的滤波方法;最小均方误差滤波丽SE ;对数谱最小均方误差估计 LSA-MMSE 等。
[0004]语音信号是一个非平稳信号,但在10_30ms —段时间内可以认为人的声带、声道等特征基本不变,语音 的短时谱具有相对的稳定性和较强的相关性,而噪声的前后相关性很弱,所以可以利用短时谱这种特性进行语音增强,由于人耳对相位的信息不敏感,仅考虑幅度的估计即可。因此,基于短时谱幅度估计shorttimespectralamplitude的语音增强算法,是现在人们研究较多的一种语音增强技术。
[0005]上述传统的语音增强方法,由于需要得到准确的噪声功率谱和先验信噪比,而现实中噪声功率谱和先验信噪比的准确估计是难以实现的,因而导致语音增强后背景易残留噪声,影响听觉质量。

【发明内容】

[0006]本发明的目的在于针对上述已有技术的问题,提出一种基于非局部的语音增强方法,以有效避免对噪声功率谱和先验信噪比准确估计的过分依赖,减少语音背景中平稳或非平稳噪声,提高语音清晰度。
[0007]为实现上述目的,本发明包括如下步骤:
[0008]I)采集带噪语音y (i),以每帧256个语音点将带噪语音分为N帧,帧间重叠128个点,并逐帧加汉明窗,通过短时傅里叶变换获得逐帧的频谱Υλ(ω),进而得到带噪语音逐中贞功率谱|yλ (ω) I2,i表示时域信号离散点序列,1 = 1,2,...,m,m表示语音序号总数目,λ表示帧序列数,λ = I, 2,..., N, ω表示离散频率点,ω = I, 2,..., 256 ;[0009]2)根据带噪语音前η帧功率谱I Υλ (ω) |2,得到噪声估计功率谱|N(w) |2:
[0010]
【权利要求】
1.一种基于非局部均值滤波的语音增强方法,包括如下步骤: 1)采集带噪语音I(i),以每帧256个语音点将带噪语音分为N帧,帧间重叠128个点,并逐帧加汉明窗,通过短时傅里叶变换获得逐帧的频谱Υλ (ω ),进而得到带噪语音逐帧功率谱|Υλ (ω) |2,i表示时域信号离散点序列,i = 1,2,...,m,m表示语音序号总数目,λ表示中贞序列数,λ = I, 2,..., N, ω表示离散频率点,ω = I, 2,..., 256 ; 2)根据带噪语音前η帧功率谱IΥλ (ω) 12,得到噪声估计功率谱IN (w) |2:
2.根据权利要求书I所述的基于非局部均值滤波的语音增强方法,其中步骤6)所述的用非局部均值滤波算法计算出语音信号.?.(/)内所有语音点的修正值,按如下步骤进行: 6a)对于语音点i,以其当前位置为中心,在语音点i的邻域内左右各取f个语音点构成一列向量為;再在其邻域内左右各取t个语音点构成搜索窗Λ,Δ内各语音点的位置依次用j标记,j = 1,2,...,2t+l,对于搜索窗内第j个语音点,以其当前位置为中心,在其邻域内左右各取f个语音点构成另一列向量:?, 6b)根据步骤6a)所取的两列向量,将语音点i与其搜索窗内语音点j的相似性权值表示为
【文档编号】G10L21/0232GK103971697SQ201410227922
【公开日】2014年8月6日 申请日期:2014年5月27日 优先权日:2014年5月27日
【发明者】钟桦, 焦李成, 周伟, 田小林, 王爽, 侯彪, 王桂婷, 马文萍, 尚荣华 申请人:西安电子科技大学

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:一种隧道南出口的太阳光照明的机械跟踪结构的制作方法技术领域:本实用新型涉及太阳光照明领域,尤其是涉及到一种隧道南出口的太阳光照明的机械跟踪结构。背景技术:对于公路隧道来说,除了必须安装昼夜照明系统保证基本照明亮度要求外,还有一个很

    专利发布时间:2025-07-01阅读:(158)

    专利名称:半导体激光放大器输入偏振态自动控制器的制作方法技术领域:本发明涉及一种半导体激光放大器,半导体激光放大器是一种直接放大单模光纤中传输的光信号的有源器件。在单模光纤中传输的基模(HE11模)一般含有两个互相正交的偏振模,即HE和HE

    专利发布时间:2025-07-01阅读:(96)

    专利名称:一种电调谐光衰减器的制作方法技术领域:本发明涉及一种新颖的电调谐光衰减器结构,属于光通信、光电传感和光信息处理器件的技术领域。背景技术:电控可调光衰减器是光通信系统中的重要无源器件之一,它广泛应用于密集波分复用(DWDM)各信道的

    专利发布时间:2025-07-01阅读:(136)

    专利名称:碳粉盒的制作方法技术领域:本实用新型涉及一种电子照相成像设备用的碳粉盒。背景技术:电子照相成像设备内通常具有图像处理单元和显影单元,利用显影单元提供的碳粉等显影剂,为图像处理单元上形成的静电潜像显影以在纸张等介质上形成可见图像。其

    专利发布时间:2025-07-01阅读:(98)

    专利名称:一种充电辊清洁装置的制作方法技术领域:本实用新型涉及电子照相成像装置中充电辊的清洁装置。背景技术:通常复印机或激光打印机等电子照相成像装置依据图像数据在感光鼓的表面形成潜影,然后将图像成像于介质上。成像装置的碳粉盒结构及工作原理参

    专利发布时间:2025-07-01阅读:(127)

    专利名称:正弦编码的制作方法技术领域:本发明涉及信号编码,其中至少一个正弦分量的频率和幅度信息被确定并且表示频率和幅度信息的正弦参数被传输。US-A 5,664,051公开了一种语音译码器装置,用于从通过用语音编码器处理语音得到的类型的数字

    专利发布时间:2025-07-01阅读:(145)