基于非局部均值滤波的语音增强方法
【专利摘要】本发明公开了一种基于非局部均值滤波的语音增强方法,主要解决现有技术在语音增强后易产生音乐噪声的问题。其实现步骤是:(1)输入带噪语音,计算带噪语音信号功率谱;(2)对带噪语音信号功率谱进行修改谱减法预处理,得到带噪语音估计功率谱;(3)由估计功率谱得到估计频谱,再对估计频谱进行短时傅立叶逆变换,得到预处理后语音;(4)对预处理后语音进行非局部均值滤波,计算语音修正值;(5)使用计算出来的修正值替代原始含噪语音信号。本发明为以非局部原理为基础,通过对待增强点邻域内的相似点进行加权平均,既能抑制背景噪声同时保持了语音清晰度,有效提高了语音质量,可用于移动通信。
【专利说明】基于非局部均值滤波的语音增强方法
【技术领域】
[0001]本发明属于语音处理【技术领域】,具体地说是基于非局部均值滤波,利用信号邻域内相似信号点加权平均来降低语音噪声,可用于移动通信。
【背景技术】
[0002]语音是人类特有的功能,也是相互传递信息的最主要手段。现实生活中的语音不可避免的要受到周围环境的影响。一些较强的背景噪声,如机械噪声、其他说话者的语音等均会严重的影响语音信号的质量。此外,传输系统本身也会产生各种噪声,因此在接收端的信号为带噪语音信号。语音增强的主要目标就是在接收端尽可能从带噪语音中提取纯净的语音信号,降低听众的听觉疲劳程度,提高可懂度。
[0003]语音增强是语音信号处理的一个重要分支,一直活跃的研究领域。人们对语音增强的研究已有一个世纪的历史。早在上个世纪初,Bell实验室的研究人员就对电话系统的音节清晰度进行了系统的实验。七十年代后期,电子计算机技术的进步促进了语音信号处理技术的迅速发展。谱减法是这个时期最具影响的语音增强算法。在八十年代至今,语音识别与移动通信技术的飞速发展为语音增强的研究提供了动力,各种新算法以及原有算法的改进形式相继问世。如基于信号子带空间的语音增强算法;利用人工神经网络实现语音增强的方法;基于小波分解的滤波方法;最小均方误差滤波丽SE ;对数谱最小均方误差估计 LSA-MMSE 等。
[0004]语音信号是一个非平稳信号,但在10_30ms —段时间内可以认为人的声带、声道等特征基本不变,语音 的短时谱具有相对的稳定性和较强的相关性,而噪声的前后相关性很弱,所以可以利用短时谱这种特性进行语音增强,由于人耳对相位的信息不敏感,仅考虑幅度的估计即可。因此,基于短时谱幅度估计shorttimespectralamplitude的语音增强算法,是现在人们研究较多的一种语音增强技术。
[0005]上述传统的语音增强方法,由于需要得到准确的噪声功率谱和先验信噪比,而现实中噪声功率谱和先验信噪比的准确估计是难以实现的,因而导致语音增强后背景易残留噪声,影响听觉质量。
【发明内容】
[0006]本发明的目的在于针对上述已有技术的问题,提出一种基于非局部的语音增强方法,以有效避免对噪声功率谱和先验信噪比准确估计的过分依赖,减少语音背景中平稳或非平稳噪声,提高语音清晰度。
[0007]为实现上述目的,本发明包括如下步骤:
[0008]I)采集带噪语音y (i),以每帧256个语音点将带噪语音分为N帧,帧间重叠128个点,并逐帧加汉明窗,通过短时傅里叶变换获得逐帧的频谱Υλ(ω),进而得到带噪语音逐中贞功率谱|yλ (ω) I2,i表示时域信号离散点序列,1 = 1,2,...,m,m表示语音序号总数目,λ表示帧序列数,λ = I, 2,..., N, ω表示离散频率点,ω = I, 2,..., 256 ;[0009]2)根据带噪语音前η帧功率谱I Υλ (ω) |2,得到噪声估计功率谱|N(w) |2:
[0010]
【权利要求】
1.一种基于非局部均值滤波的语音增强方法,包括如下步骤: 1)采集带噪语音I(i),以每帧256个语音点将带噪语音分为N帧,帧间重叠128个点,并逐帧加汉明窗,通过短时傅里叶变换获得逐帧的频谱Υλ (ω ),进而得到带噪语音逐帧功率谱|Υλ (ω) |2,i表示时域信号离散点序列,i = 1,2,...,m,m表示语音序号总数目,λ表示中贞序列数,λ = I, 2,..., N, ω表示离散频率点,ω = I, 2,..., 256 ; 2)根据带噪语音前η帧功率谱IΥλ (ω) 12,得到噪声估计功率谱IN (w) |2:
2.根据权利要求书I所述的基于非局部均值滤波的语音增强方法,其中步骤6)所述的用非局部均值滤波算法计算出语音信号.?.(/)内所有语音点的修正值,按如下步骤进行: 6a)对于语音点i,以其当前位置为中心,在语音点i的邻域内左右各取f个语音点构成一列向量為;再在其邻域内左右各取t个语音点构成搜索窗Λ,Δ内各语音点的位置依次用j标记,j = 1,2,...,2t+l,对于搜索窗内第j个语音点,以其当前位置为中心,在其邻域内左右各取f个语音点构成另一列向量:?, 6b)根据步骤6a)所取的两列向量,将语音点i与其搜索窗内语音点j的相似性权值表示为
【文档编号】G10L21/0232GK103971697SQ201410227922
【公开日】2014年8月6日 申请日期:2014年5月27日 优先权日:2014年5月27日
【发明者】钟桦, 焦李成, 周伟, 田小林, 王爽, 侯彪, 王桂婷, 马文萍, 尚荣华 申请人:西安电子科技大学
基于非局部均值滤波的语音增强方法
相关推荐
专利名称:改进的3d眼镜构造的制作方法技术领域:本实用新型涉及一种改进的3D眼镜构造,特别涉及一种专供使用于3D剧场或3D 电影院等场所的3D眼镜,配合RFID(Radio FrequencyIdentification-无线射频辨识系统)
专利名称:一种显示面板及像素结构的制作方法技术领域:本实用新型涉及彩色显示领域,尤其涉及一种显示面板及像素结构。背景技术:彩色滤光阵列(Color Filter Array,简称为CFA)是影响显示器分辨率和色彩表现力的关键因素,现有的液晶
用于构建多语言声学模型的设备和方法【专利摘要】提供了一种用于构建多语言声学模型的设备和方法。用于构建多语言声学模型的方法包括:将输入特征划分为共同语言部分和区别语言部分,通过使用神经网络训练划分的共同语言部分和区别语言部分以估计和去除音素之
提高统计语言模型准确度的方法及系统的制作方法【专利摘要】本发明公开了一种提高统计语言模型准确度的方法及系统,该方法包括:获取训练语料,并将所述训练语料分为两部分:训练集和保留集;在所述训练集上统计各阶语言模型对应的词频,并对词频为0的语言模
专利名称:变焦镜头、成像设备和信息设备的制作方法技术领域:本发明涉及通过改变焦距以改变张角而具有变焦功能的透镜,特别地,优选用于数字相机、摄影机等通过使用固态图像拾取设备获取目标的数字图像数据的变焦镜头、具有这种变焦镜头作为照相光学系统的成
专利名称:一种新型吉他面板的制作方法技术领域:本实用新型涉及吉他面板。背景技术:吉他(英语:Guitar),又译为杰他或六弦琴,属于弹拨乐器,在流行音乐、摇滚音乐、蓝调、民歌等音乐中是主要乐器。吉他一般包括共鸣箱、琴颈和琴头三部分,琴颈安装