当前位置:网站首页>专利 >正文

一种可抑制移动噪声的麦克风阵列语音增强装置的制作方法

专利名称:一种可抑制移动噪声的麦克风阵列语音增强装置的制作方法
技术领域
本发明涉及一种麦克风语音增强装置,尤其是涉及一种可抑制移动噪声的麦克风阵列语音增强装置。
背景技术
在众多语音相关应用领域,如舞台、远程会议、声纹识别、语音识别以及语音通信中,普遍用单个的孤立麦克风进行语音信号采集。但在实际使用环境中,麦克风可以拾取拾音范围内的任何声音,因此不可避免地引入背景噪音,从而影响对语音信号的处理性能。利用多个麦克风排成线形或环形等阵列,可以通过结合阵列信号处理而达到智能的语音信号处理。阵列式麦克风在时域和频域的基础上增加一个空间域,对接收到的来自空间不同方向的空时信号进行处理,能够采用自适应算法自动跟踪说话人的方向和位置变 化并提高信噪比。例如可通过传统时延差算法或超分辨方位估计算法获取语音声源方位之后,利用波束形成技术(beam forming)形成一个指向感兴趣的说话人的波束来增强该方向的接收信号。因此,麦克风阵列技术可广泛利用于具有嘈杂背景的语音处理场合,例如会场、多媒体教室、车载免提电话和助听器等。阵列麦克风技术已成为语音信号处理研究的一个热点。获取声源的位置或者方位是麦克风阵列语音增强技术的前提条件,因此,基于麦克风阵列的声源定位和语音增强技术是密切相关的,位置估计是进行波束形成的依据,是麦克风阵列语音增强的基础,也直接影响其语音增强性能。如麦克风阵列语音增强中常用的“广义旁瓣对消器”(GSC, Generalized sidelobe canceller)(参见文献I),利用一个对准声源方向的固定波束通路和具有阻塞矩阵和对消器的自适应通路实现信号中的干扰抵消,其使用前提是必须首先获取说话人的方位。对于以固定系数阻塞矩阵输出噪声参考信号的经典GSC算计结构,由于存在时延估计等因素带来的语音信号方向估计误差,使得噪声参考信号中不可避免地含有与语音相关的信号成分,从而导致自适应波束形成输出端的语音信号抵消现象,降低了语音增强效果。中国专利ZL 200510105526. 7提出一种使用噪声降低的多通道自适应语音信号处理方法,该方法通过对GSC的固定波束通路增加一个自适应处理器改善信号通道的信噪t匕。该方法借助频域时延估计来补偿各通道时延,以使得波束对准声源方向。该方法在获取了声源方向后,按照声源方向通过阻塞矩阵形成参考噪声通路,因此当部分语音信号成分泄漏到参考噪声通路时将影响GSC算法的语音增强性能。针对经典GSC算法的上述缺点,涌现了几种可抑制语音信号泄漏到噪声通路的改进算法,包括1996年Hoshuyama等在经典GSC算法基础上提出一种具有鲁棒性的自适应约束波束形成方法(参见文献3),用一个自适应阻塞滤波器取代固定系数的阻塞矩阵来产生噪声参考信号,从而可降低噪声参考信号中含有的语音相关成分。2004年,Gannot等人以GSC结构为基础,提出了一种基于声学转移函数的广义旁瓣抵消器(TF-GSC)算法(参见文献4),该算法采用声学通道转移函数比率组成自适应阻塞矩阵,由于通过语音信号传递函数比率而不是通过传递函数本身来构造阻塞矩阵的,因此该算法从一定程度上能够减小了语音信号泄漏到噪声参考信号通道的可能,从而可减弱了语音信号的内部抵消。但是,由于上述改进算法在GSC结构中引入了第二个自适应滤波器用于产生参考噪声信号,使得算法中两个自适应滤波器同时收敛的速度减慢、算法性能受参数设置的影响也比较明显。同时,对于语音识别、声纹识别、远程会议等应用中背景噪声源为移动说话人、移动车辆的场合,说话过程中背景噪声源的位置将发生变化。此时,由于上述改进算法中引入用于替代固定阻塞矩阵的自适应滤波器、自适应阻塞矩阵中的输入信号均来自对准的语音方向,无法处理背景噪声方向变化对语音信号泄漏造成的影响,其抑制语音信号泄漏到参考噪声通道的性能下降,因此也将影响到算法的语音增强效果。

发明内容
本发明的目的在于针对传统的GSC类型麦克风阵列语音增强算法在背景噪声移 动时的性能下降等不足,提供一种可抑制移动噪声的麦克风阵列语音增强装置。本发明设有5元麦克风组成的等间距线阵、端点检测模块、语音波束形成器模块、固定系数滤波器模块、噪声波束形成器模块、语音信号段波束扫描模块、噪声信号段波束扫描模块、和自适应噪声对消器模块;所述5元麦克风组成的等间距线阵的输出端分别与端点检测模块、语音波束形成器模块和噪声波束形成器模块的输入端连接,端点检测模块的语音信号段输出端接语音信号段波束扫描模块的输入端,端点检测模块的噪声信号段输出端接噪声信号段波束扫描模块的输入端,语音信号段波束扫描模块的语音声源方位信息输出端接语音波束形成器模块的输入端,噪声信号段波束扫描模块的噪声源方位信息输出端接噪声波束形成器模块的输入端;语音波束形成器模块的增强后语音信号输出端接固定系数滤波器模块的输入端,固定系数滤波器模块的语音信号输出端和噪声波束形成器模块的噪声信号输出端分别接自适应噪声对消器模块的输入端,经过自适应噪声对消器模块的噪声对消处理后的增强语音信号由自适应噪声对消器模块的输出端输出。5元麦克风阵列用于进行语音信号多通道采集,麦克风阵列采集的语音信号经前置放大、模数转换后通过数据线直接输入端点检测模块、波束扫描模块(包括语音信号段波束扫描模块和噪声信号段波束扫描模块)、语音波束形成模块和噪声波束形成模块;端点检测模块根据能量、过零率参数对输入信号进行语音信号段、背景噪声段(即无语音信号部分)的分割;方位扫描模块根据端点检测结果分别对噪声信号段、语音信号段进行波束扫描,获取语音声源方向信息及语音开始前、结束后的噪声方向信息;获取的声源方位信息输入语音波束形成模块,根据声源方向信息计算各通道时延补偿值,并据此对麦克风阵列各通道接收信号进行时延补偿、叠加以增强声源方向语音信号;固定系数滤波器模块对增强后的语音信号进行滤波获取希望的频率响应;获取的噪声方位信息输入噪声波束形成模块,根据噪声方向信息计算各通道时延补偿值,并据此对麦克风阵列各通道接收信号进行时延补偿、叠加以增强声源方向语音信号;自适应噪声消除器模块则利用输入的语音信号、噪声信号进行自适应噪声对消处理,并输出增强语音信号。本发明实现语音增强功能的步骤包括端点检测、波束扫描、语音波束形成、噪声波束形成和噪声消除等步骤。在端点检测步骤对输入信号进行语音段、背景噪声段检测;在波束扫描步骤对背景噪声段、语音段信号分别进行波束扫描获取噪声、语音声源方向;通过扫描获得噪声、语音声源方向后,噪声波束形成器模块、语音波束形成器模块根据几何关系分别计算麦克风阵列信号各通道的时延补偿值以形成对准噪声源、语音声源的波束;自适应噪声消除模块根据语音通路和 噪声通路的输出进行自适应噪声对消处理。本发明简单方便,可抑制移动噪声。针对声纹识别、语音识别等麦克风阵列语音增强的情况,本发明提出采用技术成熟、使用简单方便的波束扫描手段来获取目标声源和噪声的方向信息,并将声源及噪声方向信息用于麦克风阵列语音增强算法实现语音增强。本发明实现抑制移动噪声的麦克风阵列语音增强的具体思路为首先基于端点检测结果分别对语音段、噪声段信号进行波束扫描,获取噪声源、语音声源方向信息;在获得噪声源、语音声源方向信息后可换算出每个通道的时延补偿指并据此进行噪声方向、语音声源方向的时延补偿叠加形成分别对准噪声源、语音声源的波束;最后通过语音通路、噪声通路进行噪声自适应噪声消除处理,实现语音增强。与现有的传统麦克风阵列定位与语音增强方法相比,本发明的突出优点在于由于采用波束扫描方式在静音段(无语音信号的时间段)对背景噪声声源进行方向估计,可获取说话人发出语音过程中背景噪声源的方向变化信息,与传统GSC算法采用固定阻塞矩阵得到参考噪声相比,根据波束扫描获取的噪声源方向信息进行噪声源波束形成可提供移动条件下的参考噪声信息,从而可在抑制移动噪声的同时实现麦克风阵列语音增强。


图I为本发明实施例的结构组成示意图。图2为本发明实施例的5元麦克风阵列及其与微处理器连接电路原理图。图3为本发明实施例的波束扫描原理图。
具体实施例方式为了使本发明的技术内容、特征、优点更加明显易懂,下文以本发明可抑制移动噪声的麦克风阵列语音增强装置实施例并结合附图具体说明如下。参见图1,本发明实施例设有5元麦克风组成的等间距线阵I、端点检测模块2、语音波束形成器模块3、固定系数滤波器模块4、噪声波束形成器模块5、语音信号段波束扫描模块61、噪声信号段波束扫描模块62和自适应噪声对消器模块7。所述5兀麦克风M组成的等间距线阵I的模数转换器D输出端分别与端点检测模块2、语音波束形成器模块3和噪声波束形成器模块5的输入端连接,端点检测模块2的语音信号段输出端接语音信号段波束扫描模块61的输入端,端点检测模块2的噪声信号段输出端接噪声信号段波束扫描模块62的输入端,语音信号段波束扫描模块61的语音声源方位信息31输出端接语音波束形成器模块3的输入端,噪声信号段波束扫描模块62的噪声源方位信息51输出端接噪声波束形成器模块5的输入端;语音波束形成器模块3的增强后语音信号输出端接固定系数滤波器模块4的输入端,固定系数滤波器模块4的语音信号输出端和噪声波束形成器模块5的噪声信号输出端分别接自适应噪声对消器模块7的输入端,经过自适应噪声对消器模块7的噪声对消处理后的增强语音信号由自适应噪声对消器模块7的输出端输出。本发明实施例中麦克风阵列由5个等间距排列的麦克风(m0,ml,…m4)组成线阵,通过阵列波束扫描获取噪声源、语音声源方向猴,阵列中各麦克风采集的语音信号进时延补偿后加权叠加可分别形成对准噪声源和语音声源方向的信号波束,并用于作为自适应噪声消除器的输入进行语音增强处理。具体地,5元麦克风线阵由体积小、结构简单、电声性能好的压强式驻极体麦克风micO,…,mic4,NJM2100运算放大器芯片构成的前置放大电路及MAX118模数转换芯片构成,在本实施例中麦克风间距d = 0. lm。本实施例中端点检测、语音波束形成器模块、固定系数滤波器模块、噪声波束形成器模块、波束扫描模块、自适应噪声对消器模块均属于数字信号处理模块,在本实施例中采用ARM9S3C2440微处理器进行软件编程实现。
该麦克风阵列语音增强装置中5元麦克风线阵与微处理器的连接方式为5元麦克风线阵中5个麦克风输出信号经过图2所示运算放大器构成的2级前置放大电路放大后输入多通道模数转换芯片MAXl 18,S3C2440微处理器通过IO 口 GPB2,3,4控制MAXl 18的输入通道端Al、A2、A3,通过定时器输出脚TOUTO、TOUTl控制MAXl 18的读出/写入端口 WR、RD进行采样频率16ksps的模数转换,通过数据线DATAO至DATA7进行8bit模数转换结果到S3C2440微处理器的传送。该麦克风阵列语音增强装置中多通道语音信号模数转换进入微处理器后,以软件形式运行的各数字信号处理模块间的数据、控制流连接方式如图3所示,具体说明如下本发明实施例的端点检测模块采用本领域公知的信号能量、过零率参数检测算法对输入信号中语音信号的起始点和结束点,并根据语音信号的起始点和结束点将输入信号分为语音端和背景噪声段。波束扫描模块通过对麦克风阵列各通道信号时延进行逐次时延调整后叠加以获得不同的波束对应的波束成形信号。波束扫描原理结合图3具体说明如下在本发明实施例中,以5元麦克风线阵所在水平线为X轴,以5元麦克风线阵中间的麦克风m2位置为坐标原点建立定位坐标系,线阵各阵元间距为d。考虑实施例中声源处于远场范围,其发出的语音信号到达麦克风线阵时可以认为是平面入射波。以本实施例线阵的中心阵元麦克风m2作为基准进行波束扫描即,m2接收的语音信号不作时延补偿,线阵中其余通道麦克风接收的语音信号Xi进行如下时延补偿计算后得到x’ i (如图3所示)X,J (k) = Xi (k,)k' = k + roiiiuf[j —~—]. / = 0,1,2.3.4
2
r(^) /I 「 1
f }/c./6, - arccos Js A , - arc cos -:~
/2dId ■ fs其中i为线阵中各通道的编号,j=0, ±1,±2,±3,…代表波束扫描序号,0 j为每次时延调整后形成的扫描波束,C为空气中的声速(本实施例中取340m/s),fs为麦克风阵列语音信号的采样频率(单位为Hz,在本实施例中取16000Hz),round()代表取整运算。则逐次时延补偿后对各通道语音信号x’ i进行叠加即可实现正、负90度范围(本实施例中对麦克风线阵前方180度范围进行波束扫描)的波束扫描,从扫描中各角度波束得到的波束形成信号中求出具有最大能量的信号对应波束即可获得语音声源、噪声源的方位角。本实施例中,考虑到多数使用场合中说话人有较好的合作度而背景噪声则无(SP背景噪声较有可能发生移动),为了降低算法的运算量,在端点检测模块进行端点检测完成语音段、噪声段分割后,对语音信号只进行一次波束扫描以确定语音声源的方位角,对噪声段信号则在每段噪声均进行波束扫描以获取由于噪声源移动发生变化的噪声源方位角。通过波束扫描模块获取语音声源、噪声源方位信息后,噪声波束形成模块、语音波束形成模块分别根据获得的语音声源、噪声源方位角度对麦克风阵列各通道信号进行时延补偿,时延补偿原理同波束扫描原理,即直接利用形成该扫描波束时用到的各通道时延补偿值。其中噪声波束形成模块由于采用每个噪声段进行波束扫描获取的噪声源方位角,当噪声源移动导致噪声方位角变化时,噪声波束形成模块可保证以对准噪声源的波束输出参考噪声。 在本实施例中,语音波束形成模块输出的语音信号输入固定系数FIR滤波器模块用于形成理想的频率响应,固定系数滤波器模块可根据预期的理想频率响应采用本领域公知的滤波器系数计算方法产生FIR滤波器的固定系数。自适应噪声消除器模块有参考噪声、含噪信号两个输入端,以噪声波束形成模块的输出信号作为参考噪声输入信号,固定系数FIR滤波器的输出信号作为含噪输入信号,本实施例中采用本领域公知的LMS (最小均方误差算法)自适应算法调整自适应噪声消除器的权系数进行自适应噪声消除处理。则经过自适应噪声消除处理后,系统语音增强输出为固定系数FIR滤波器输出与自适应噪声消除器的输出之差。本发明最大的特点在于借助波束扫描获取噪声源方位,以替代传统GSC算法中的阻塞矩阵产生噪声参考信号,从而改善语音信号的泄漏、增强对移动噪声源的抑制效果,改善移动背景噪声条件下的麦克风阵列语音增强性能。
权利要求
1.一种可抑制移动噪声的麦克风阵列语音增强装置,其特征在于设有5元麦克风组成的等间距线阵、端点检测模块、语音波束形成器模块、固定系数滤波器模块、噪声波束形成器模块、语音信号段波束扫描模块、噪声信号段波束扫描模块和自适应噪声对消器模块;所述5元麦克风组成的等间距线阵的输出端分别与端点检测模块、语音波束形成器模块和噪声波束形成器模块的输入端连接,端点检测模块的语音信号段输出端接语音信号段波束扫描模块的输入端,端点检测模块的噪声信号段输出端接噪声信号段波束扫描模块的输入端,语音信号段波束扫描模块的语音声源方位信息输出端接语音波束形成器模块的输入端,噪声信号段波束扫描模块的噪声源方位信息输出端接噪声波束形成器模块的输入端;语音波束形成器模块的增强后语音信号输出端接固定系数滤波器模块的输入端,固定系数滤波器模块的语音信号输出端和噪声波束形成器模块的噪声信号输出端分别接自适应噪声对消器模块的输入端,经过自适应噪声对消器模块的噪声对消处理后的增强语音信号由自适应噪声对消器模块的输出端输出。
全文摘要
一种可抑制移动噪声的麦克风阵列语音增强装置,涉及一种麦克风语音增强装置。设有5元麦克风组成的等间距线阵、端点检测模块、语音波束形成器模块、固定系数滤波器模块、噪声波束形成器模块、语音信号段波束扫描模块、噪声信号段波束扫描模块和自适应噪声对消器模块。等间距线阵输出端分别与端点检测模块、语音波束形成器模块和噪声波束形成器模块输入端连接,端点检测模块输出端一路经语音信号段波束扫描模块、语音波束形成器模块和固定系数滤波器模块接自适应噪声对消器模块;端点检测模块输出端另一路经噪声信号段波束扫描模块、噪声波束形成器模块接自适应噪声对消器模块。
文档编号G10L21/0332GK102969002SQ20121049701
公开日2013年3月13日 申请日期2012年11月28日 优先权日2012年11月28日
发明者童峰, 洪青阳, 周跃海, 李芳兰 申请人:厦门大学

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:一种灯笼的制作方法技术领域:本实用新型涉及一种照明工具,特别涉及一种灯笼。背景技术:目前现有的灯笼提手和灯罩之间为固定连接,灯罩使用时间短,在损坏时提手与灯罩一同丢弃,造成浪费。实用新型内容本实用新型是为了克服上述现有技术中缺陷,

    专利发布时间:2025-05-15阅读:(89)

    专利名称:信号编码的制作方法技术领域:本发明涉及对信号进行编码,尤其是对音频信号进行编码。已知的音频编码方案使用了帧,这些帧包含了一组表示该帧涉及的时间间隔的音频信号(分量)的值。至少某些帧涉及的是时间上具有重叠的时间间隔。为了实现低比特率

    专利发布时间:2025-05-15阅读:(90)

    专利名称:平版印刷版原版的制作方法技术领域:本发明涉及平版印刷版原版。技术背景对铝合金板的表面进行包括表面粗糙化处理和阳极氧化处理的表面处理工艺以获得载体,之后将光敏材料涂布至载体并干燥以获得通常所说的PS版,之后对PS版进行包括图像曝光、

    专利发布时间:2025-05-15阅读:(77)

    专利名称:一种led射灯的制作方法技术领域:本实用新型涉及LED灯具照明技术领域,具体地说是指ー种LED射灯。背景技术:随着人们生活水平的提高,LED射灯越来越普遍地运用到人们的日常生活中。目前,由于灯具体积的限制,小功率LED射灯难于达到

    专利发布时间:2025-05-15阅读:(72)

    专利名称:胡琴的制作方法技术领域:本实用新型属于一种乐器,特别涉及一种用于弦乐曲演奏的杆筒外连接的胡琴。目前,在胡琴类的民族乐器中,还没有见到定弦和音域类似小提琴而演奏方式又与二胡相似的胡琴。参见91年10月知识出版社出版的《中国民族民间乐

    专利发布时间:2025-05-15阅读:(75)

    专利名称:图像形成装置的制作方法技术领域:本发明涉及采用电子照相方式或静电记录方式的图像形成装置,尤其涉及复印机、打印机、传真机等的图像形成装置。作为解决该问题的对策,过去已有多种提案。例如,在日本特开平2-215891中公开了一种电子照相

    专利发布时间:2025-05-15阅读:(70)