当前位置:网站首页>专利 >正文

基于分数傅里叶变换的二维维纳滤波的取证语音增强方法


专利名称::基于分数傅里叶变换的二维维纳滤波的取证语音增强方法
技术领域
:本发明涉及一种语音增强方法,特别涉及一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法。音频取证是指对录音信号进行获取、分析和评价以作为法庭或其他行政部门认可的证据。音频证据可作为民事或刑事强制调查、行政调查或其他民事事件的一部分。音频取证技术融合了音频数字信号处理领域内的诸多技术如语音识别、说话人识别和语音增强等技术。从上个世纪六十年代开始,特别是1974年的水门事件以后,音频取证技术开始在法庭取证中得到了应用,但是由于当初语音信号处理理论和技术还处于起步发展阶段,音频取证技术的研究一度处于停顿状态,近年来随着语音信号处理技术的日益发展成熟和犯罪手段的不断高技术化,最近几年对音频取证技术的研究得到了语音信号处理人员的广泛关注。由于取证所用的音频信号经常受到来自噪声、其他声音、紊乱和其他妨碍正常音频取证分析的信号处理手段的影响。而且绝大部分音频信号都来自于采用隐藏的麦克风进行的私下录音,因此信号通常也受到风和其他环境声音的干扰。因此,在分析之前应当采用语音增强技术以提高感知信噪比。通常的语音增强算法大多基于平稳随机噪声理论,不能有效地降低非平稳噪声的影响,分数阶傅里叶变换的旋转特性显示,通过选择合适的分数阶因子a,可以在分数傅里叶变换域上实现语音与噪声的最大分离,也可以通过多次旋转以进一步分离消除噪声。
发明内容本发明目的是针对现有技术存在的缺陷提供一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法。本发明为实现上述目的,采用如下技术方案本发明基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,其特征在于包括以下步骤(1)分数傅里叶变换域输入语音序列s(η)的阶分数傅里叶变换算法如下Sa/(u)=Fa'(s(n))
背景技术
:-jCOtai2πexpjs{n)Cti=2mnat=(2m土l);r式中,〒,0<IPI<2,i=1,2,...,16,m为整数,j为虚数单位;⑵取模Re⑷)为\⑷的实部,⑷)为\(M)的虚部,那么Sa,⑷的模如下Sai(")|=7(Re(5aj(W)))2+(Im(5fl((M)))2;(3)二维汉明窗二维汉明窗h(l,k)权利要求一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,其特征在于包括以下步骤(1)分数傅里叶变换域输入语音序列s(n)的ai阶分数傅里叶变换算法如下<mrow><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>F</mi><msub><mi>a</mi><mi>i</mi></msub></msup><mrow><mo>(</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><mo>=</mo><mfencedopen='{'close=''><mtable><mtr><mtd><msqrt><mfrac><mrow><mn>1</mn><mo>-</mo><mi>j</mi><mi>cot</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>&pi;</mi></mrow></mfrac></msqrt><munderover><mo>&Integral;</mo><mrow><mo>-</mo><mo>&infin;</mo></mrow><mrow><mo>+</mo><mo>&infin;</mo></mrow></munderover><mi>exp</mi><mrow><mo>(</mo><mi>j</mi><mfrac><mrow><msup><mi>u</mi><mn>2</mn></msup><mo>+</mo><msup><mi>n</mi><mn>2</mn></msup></mrow><mn>2</mn></mfrac><mi>cot</mi><mi>a</mi><mo>-</mo><mfrac><mi>jun</mi><mrow><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><mi>s</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>dt</mi></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>&NotEqual;</mo><mi>m&pi;</mi></mtd></mtr><mtr><mtd><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mn>2</mn><mi>m&pi;</mi></mtd></mtr><mtr><mtd><mi>s</mi><mrow><mo>(</mo><mo>-</mo><mi>n</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mrow><mo>(</mo><mn>2</mn><mi>m</mi><mo>&PlusMinus;</mo><mn>1</mn><mo>)</mo></mrow><mi>&pi;</mi></mtd></mtr></mtable></mfenced></mrow>式中,O<|p|<2,i=l,2,...,16,m为整数,j为虚数单位;(2)取模为的实部,为的虚部,的模如下<mrow><mo>|</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><msqrt><msup><mrow><mo>(</mo><mi>Re</mi><mrow><mo>(</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><mi>Im</mi><mrow><mo>(</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>;</mo></mrow>(3)二维汉明窗二维汉明窗h(l,k)<mrow><mi>h</mi><mrow><mo>(</mo><mi>l</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mn>0.54</mn><mo>-</mo><mn>0.46</mn><mi>cos</mi><mrow><mo>(</mo><mfrac><mrow><mn>2</mn><mi>&pi;l</mi></mrow><mn>255</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mo>(</mo><mn>0.54</mn><mo>-</mo><mn>0.46</mn><mi>cos</mi><mrow><mo>(</mo><mfrac><mrow><mn>2</mn><mi>&pi;k</mi></mrow><mn>15</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow>上式中l∈,k∈;(4)二维维纳滤波<mrow><msup><mrow><mo>|</mo><mover><mi>S</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>-</mo><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mfrac><mo>)</mo></mrow><mo>,</mo></mrow>其中为目标信号谱的估计幅度,|X(i,j)|为滤波前的目标信号谱的幅度,噪声信号谱的估计幅度;则可得二维维纳滤波如下<mrow><mover><mi>S</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mi>H</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>,</mo></mrow><mrow><mo>=</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><msqrt><mi>max</mi><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><mn>1</mn><mrow><mi>SNR</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mi>&beta;</mi><mo>)</mo></mrow></msqrt><mo>,</mo></mrow>上式中β≥0,以保证传输函数H(u,v)>0,<mrow><mi>SNR</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mfrac><msup><mrow><mo>|</mo><mover><mi>X</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mfrac><mo>,</mo></mrow>上式中<mrow><mo>|</mo><mover><mi>X</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mi>v</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>v</mi><mo>+</mo><mn>1</mn></mrow></munderover><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>+</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo><mo>,</mo></mrow><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mi>v</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>v</mi><mo>+</mo><mn>1</mn></mrow></munderover><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>+</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>N</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo><mo>;</mo></mrow>(5)分数傅里叶逆变换为ai阶分数傅里叶变换域上的估计语音=Si(u)exp(jΔθi(u)),上式中分别为ai阶分数傅里叶变换域上含噪语音、纯净语音的相位谱,Δθi(u)为相位误差;Δθi(u)=εiu/sinai,εi为均值较小的随机变量,则有<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>F</mi><mrow><mo>-</mo><msub><mi>a</mi><mi>i</mi></msub></mrow></msup><mo>[</mo><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><msub><mi>&epsiv;</mi><mi>i</mi></msub><mi>u</mi><mo>)</mo></mrow><mo>]</mo></mrow><mrow><mo>=</mo><msqrt><mfrac><mrow><mn>1</mn><mo>+</mo><mi>j</mi><mi>cot</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>&pi;</mi></mrow></mfrac></msqrt><munderover><mo>&Integral;</mo><mrow><mo>-</mo><mo>&infin;</mo></mrow><mrow><mo>+</mo><mo>&infin;</mo></mrow></munderover><mi>exp</mi><mrow><mo>(</mo><mi>j</mi><mfrac><mrow><mrow><mo>(</mo><msup><mi>u</mi><mn>2</mn></msup><mo>+</mo><msup><mi>n</mi><mn>2</mn></msup><mo>)</mo></mrow><mi>cos</mi><msub><mi>a</mi><mi>i</mi></msub><mo>-</mo><mn>2</mn><mi>u</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><mo>-</mo><mn>2</mn><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>du</mi><mo>,</mo></mrow>为的时域形式;(6)线性合并令n′=nεi,代入上式并化简整理可得<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>RES</mi><mrow><mo>(</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><mfrac><mrow><msup><msub><mi>&epsiv;</mi><mi>i</mi></msub><mn>2</mn></msup><msup><mi>cos</mi><mn>2</mn></msup><msub><mi>a</mi><mi>i</mi></msub><mo>+</mo><mn>2</mn><msub><mi>&epsiv;</mi><mi>i</mi></msub><mi>t</mi><mi>cos</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow>由于εi为均值较小的随机变量,则有<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>&ap;</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow>那么线性合并后可得<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mo>[</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow>当信号路数M→∞时,则有<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>E</mi><mo>[</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow>由于语音信号为短时平稳随机过程,则有<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&tau;</mi><mn>0</mn></msub><mo>)</mo></mrow><mo>,</mo></mrow>式中τ0为时延常数。FSA00000239174200013.tif,FSA00000239174200014.tif,FSA00000239174200015.tif,FSA00000239174200016.tif,FSA00000239174200017.tif,FSA00000239174200018.tif,FSA000002391742000112.tif,FSA000002391742000113.tif,FSA00000239174200025.tif,FSA00000239174200026.tif,FSA00000239174200027.tif,FSA00000239174200028.tif,FSA00000239174200029.tif,FSA000002391742000212.tif,FSA000002391742000213.tif全文摘要本发明公布了一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,包括以下步骤(1)分数傅里叶变换域;(2)取模;(3)加二维汉明窗;(4)二维维纳滤波;(5)分数傅里叶逆变换;(6)线性合并。本发明在取证语音增强领域具有较高的应用价值和广阔的应用前景。文档编号G10L21/02GK101950563SQ201010259828公开日2011年1月19日申请日期2010年8月20日优先权日2010年8月20日发明者包永强,唐加能,奚吉,王开,赵力,邹采荣,魏昕申请人:东南大学

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:带有音准律标记的提琴的制作方法技术领域:本实用新型涉及一种带有音准律标记的提琴。技术背景目前随着音乐知识的普及,学习提琴的人越来越多,在学习过程中往往请专业老师在提琴指板上做记号,这样存在很大的弊端,首先是标记的设置比较麻烦,设置

    专利发布时间:2025-07-01阅读:(129)

    专利名称:军鼓的翻盖式纱带调节座的制作方法技术领域:本实用新型涉及一种军鼓,特别是涉及一种军鼓的翻盖式纱带调节座。 背景技术:军鼓是西洋乐器演奏中经常使用到的重要乐器之一,由于其具有较强的音乐表现力和震撼力,并能与周围的欣赏者产生共鸣,因此

    专利发布时间:2025-07-01阅读:(87)

    自动翻页的电子乐谱器的制造方法【专利摘要】自动翻页的电子乐谱器,涉及一种电子乐谱器。解决了现有自动翻页的乐谱器无法自动翻页的问题,本实用新型所述乐谱器本体的上端设有圆轮,圆轮的外边设有静电导体条,一号电机固定在乐谱器本体下表面的中心,一号电

    专利发布时间:2025-07-01阅读:(106)

    专利名称:Led工矿灯的制作方法技术领域:本实用新型涉及到LED工矿灯结构,特别涉及到一种有优良散热效果的LED灯结构用其采用的散热方法。背景技术:现时工厂,仓库及超市等一般采用传统的钠灯为主,或采用一般节能灯,但是灯泡的缺点就是耗电量大和

    专利发布时间:2025-07-01阅读:(99)

    专利名称:用于激光打印机的碳粉盒的制作方法技术领域:本实用新型涉及一种电子照相图像生成设备,具体涉及一种用于激光打印机的碳粉盒。背景技术:碳粉盒随着激光打印机、激光一体机、激光复印机等设备的市场需求量的快速增长而逐年急剧增长。废粉仓通常都采

    专利发布时间:2025-07-01阅读:(106)

    专利名称:键盘装置的制作方法技术领域:本发明涉及一种用于电子风琴、电子钢琴、电子合成器等电子键盘乐器或者电键盘乐器的键盘装置。背景技术: 一直以来,用于电子风琴或电子钢琴等电子键盘乐器的键盘装置中,有像在例如JPH06-342281A所公开

    专利发布时间:2025-07-01阅读:(102)