当前位置:网站首页>专利 >正文

基于非局部均值滤波的语音增强方法

基于非局部均值滤波的语音增强方法
【专利摘要】本发明公开了一种基于非局部均值滤波的语音增强方法,主要解决现有技术在语音增强后易产生音乐噪声的问题。其实现步骤是:(1)输入带噪语音,计算带噪语音信号功率谱;(2)对带噪语音信号功率谱进行修改谱减法预处理,得到带噪语音估计功率谱;(3)由估计功率谱得到估计频谱,再对估计频谱进行短时傅立叶逆变换,得到预处理后语音;(4)对预处理后语音进行非局部均值滤波,计算语音修正值;(5)使用计算出来的修正值替代原始含噪语音信号。本发明为以非局部原理为基础,通过对待增强点邻域内的相似点进行加权平均,既能抑制背景噪声同时保持了语音清晰度,有效提高了语音质量,可用于移动通信。
【专利说明】基于非局部均值滤波的语音增强方法
【技术领域】
[0001]本发明属于语音处理【技术领域】,具体地说是基于非局部均值滤波,利用信号邻域内相似信号点加权平均来降低语音噪声,可用于移动通信。
【背景技术】
[0002]语音是人类特有的功能,也是相互传递信息的最主要手段。现实生活中的语音不可避免的要受到周围环境的影响。一些较强的背景噪声,如机械噪声、其他说话者的语音等均会严重的影响语音信号的质量。此外,传输系统本身也会产生各种噪声,因此在接收端的信号为带噪语音信号。语音增强的主要目标就是在接收端尽可能从带噪语音中提取纯净的语音信号,降低听众的听觉疲劳程度,提高可懂度。
[0003]语音增强是语音信号处理的一个重要分支,一直活跃的研究领域。人们对语音增强的研究已有一个世纪的历史。早在上个世纪初,Bell实验室的研究人员就对电话系统的音节清晰度进行了系统的实验。七十年代后期,电子计算机技术的进步促进了语音信号处理技术的迅速发展。谱减法是这个时期最具影响的语音增强算法。在八十年代至今,语音识别与移动通信技术的飞速发展为语音增强的研究提供了动力,各种新算法以及原有算法的改进形式相继问世。如基于信号子带空间的语音增强算法;利用人工神经网络实现语音增强的方法;基于小波分解的滤波方法;最小均方误差滤波丽SE ;对数谱最小均方误差估计 LSA-MMSE 等。
[0004]语音信号是一个非平稳信号,但在10_30ms —段时间内可以认为人的声带、声道等特征基本不变,语音 的短时谱具有相对的稳定性和较强的相关性,而噪声的前后相关性很弱,所以可以利用短时谱这种特性进行语音增强,由于人耳对相位的信息不敏感,仅考虑幅度的估计即可。因此,基于短时谱幅度估计shorttimespectralamplitude的语音增强算法,是现在人们研究较多的一种语音增强技术。
[0005]上述传统的语音增强方法,由于需要得到准确的噪声功率谱和先验信噪比,而现实中噪声功率谱和先验信噪比的准确估计是难以实现的,因而导致语音增强后背景易残留噪声,影响听觉质量。

【发明内容】

[0006]本发明的目的在于针对上述已有技术的问题,提出一种基于非局部的语音增强方法,以有效避免对噪声功率谱和先验信噪比准确估计的过分依赖,减少语音背景中平稳或非平稳噪声,提高语音清晰度。
[0007]为实现上述目的,本发明包括如下步骤:
[0008]I)采集带噪语音y (i),以每帧256个语音点将带噪语音分为N帧,帧间重叠128个点,并逐帧加汉明窗,通过短时傅里叶变换获得逐帧的频谱Υλ(ω),进而得到带噪语音逐中贞功率谱|yλ (ω) I2,i表示时域信号离散点序列,1 = 1,2,...,m,m表示语音序号总数目,λ表示帧序列数,λ = I, 2,..., N, ω表示离散频率点,ω = I, 2,..., 256 ;[0009]2)根据带噪语音前η帧功率谱I Υλ (ω) |2,得到噪声估计功率谱|N(w) |2:
[0010]
【权利要求】
1.一种基于非局部均值滤波的语音增强方法,包括如下步骤: 1)采集带噪语音I(i),以每帧256个语音点将带噪语音分为N帧,帧间重叠128个点,并逐帧加汉明窗,通过短时傅里叶变换获得逐帧的频谱Υλ (ω ),进而得到带噪语音逐帧功率谱|Υλ (ω) |2,i表示时域信号离散点序列,i = 1,2,...,m,m表示语音序号总数目,λ表示中贞序列数,λ = I, 2,..., N, ω表示离散频率点,ω = I, 2,..., 256 ; 2)根据带噪语音前η帧功率谱IΥλ (ω) 12,得到噪声估计功率谱IN (w) |2:
2.根据权利要求书I所述的基于非局部均值滤波的语音增强方法,其中步骤6)所述的用非局部均值滤波算法计算出语音信号.?.(/)内所有语音点的修正值,按如下步骤进行: 6a)对于语音点i,以其当前位置为中心,在语音点i的邻域内左右各取f个语音点构成一列向量為;再在其邻域内左右各取t个语音点构成搜索窗Λ,Δ内各语音点的位置依次用j标记,j = 1,2,...,2t+l,对于搜索窗内第j个语音点,以其当前位置为中心,在其邻域内左右各取f个语音点构成另一列向量:?, 6b)根据步骤6a)所取的两列向量,将语音点i与其搜索窗内语音点j的相似性权值表示为
【文档编号】G10L21/0232GK103971697SQ201410227922
【公开日】2014年8月6日 申请日期:2014年5月27日 优先权日:2014年5月27日
【发明者】钟桦, 焦李成, 周伟, 田小林, 王爽, 侯彪, 王桂婷, 马文萍, 尚荣华 申请人:西安电子科技大学

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:军鼓拉码结构的制作方法技术领域:本实用新型是一种军鼓上的配件,特别是一种用于将军鼓上的拉 簧拉绷紧,并在军鼓不断被敲击的情况下拉簧仍不会松弛的军鼓拉码 结构。背景技术:现有技术中的军鼓拉码结构,在拉簧被拉绷紧后,由于军鼓不断 被敲

    专利发布时间:2025-05-15阅读:(75)

    专利名称:载玻片标本定位器的制作方法技术领域:本实用新型属于显微镜用载玻片标本观察定位装置。目前,在显微镜下观察标本时,一般都是将待观察的标本放在玻璃载片上,再将该玻璃载片放在显微镜物镜下面,进行观察,采用这种方法,如果需要再次观察已从显微

    专利发布时间:2025-05-15阅读:(69)

    专利名称:处理盒的再生方法、拆卸方法和装配方法,定位和连接装置及处理盒的制作方法技术领域:本发明涉及处理盒的再生方法,处理盒再生方法中涉及的处理盒的拆卸方法,处理盒的装配方法,定位紧固装置,和处理盒。背景技术: 处理盒的含意是充电装置、显影

    专利发布时间:2025-05-15阅读:(66)

    专利名称:液晶模组背光源的测试装置的制作方法技术领域:本实用新型涉及一种液晶模组的测试装置,尤其是涉及一种液晶模组背光源的光学参数对比测试装置。背景技术:在液晶模组开发、生产和维修过程中,都需要对LED背光源进行测试,以检测其是否合格,进而

    专利发布时间:2025-05-15阅读:(69)

    专利名称:低辐射中空镶嵌玻璃的制作方法技术领域:本发明涉及一种低辐射中空镶嵌玻璃,特别是一种建筑物、车船之类的交通工具上所用的低辐射中空镶嵌玻璃,属于建筑物及交通工具上的门窗构件。例如中国专利公告号为CN2507668Y介绍了一种中空镶嵌玻

    专利发布时间:2025-05-15阅读:(143)

    专利名称:一种基于语音识别的呼叫中心用户识别方法技术领域:本发明涉及呼叫中心语音平台技术领域,特别是指一种基于语音识别的呼叫中心用户识别方法。背景技术:随着通信业务的发展,特别是各种通信业务技术的发展,通讯用户越来越多,如何为用户提供更多更

    专利发布时间:2025-05-15阅读:(81)