基于分数傅里叶变换的二维维纳滤波的取证语音增强方法-品牌商务网

专利名称：：基于分数傅里叶变换的二维维纳滤波的取证语音增强方法
技术领域：
：本发明涉及一种语音增强方法，特别涉及一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法。音频取证是指对录音信号进行获取、分析和评价以作为法庭或其他行政部门认可的证据。音频证据可作为民事或刑事强制调查、行政调查或其他民事事件的一部分。音频取证技术融合了音频数字信号处理领域内的诸多技术如语音识别、说话人识别和语音增强等技术。从上个世纪六十年代开始，特别是1974年的水门事件以后，音频取证技术开始在法庭取证中得到了应用，但是由于当初语音信号处理理论和技术还处于起步发展阶段，音频取证技术的研究一度处于停顿状态，近年来随着语音信号处理技术的日益发展成熟和犯罪手段的不断高技术化，最近几年对音频取证技术的研究得到了语音信号处理人员的广泛关注。由于取证所用的音频信号经常受到来自噪声、其他声音、紊乱和其他妨碍正常音频取证分析的信号处理手段的影响。而且绝大部分音频信号都来自于采用隐藏的麦克风进行的私下录音，因此信号通常也受到风和其他环境声音的干扰。因此，在分析之前应当采用语音增强技术以提高感知信噪比。通常的语音增强算法大多基于平稳随机噪声理论，不能有效地降低非平稳噪声的影响，分数阶傅里叶变换的旋转特性显示，通过选择合适的分数阶因子a，可以在分数傅里叶变换域上实现语音与噪声的最大分离，也可以通过多次旋转以进一步分离消除噪声。
发明内容本发明目的是针对现有技术存在的缺陷提供一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法。本发明为实现上述目的，采用如下技术方案本发明基于分数傅里叶变换的二维维纳滤波的取证语音增强方法，其特征在于包括以下步骤(1)分数傅里叶变换域输入语音序列s(η)的阶分数傅里叶变换算法如下Sa/(u)=Fa'(s(n))
背景技术：
：-jCOtai2πexpjs{n)Cti=2mnat=(2m土l);r式中，〒，0<IPI<2，i=1，2，...，16，m为整数，j为虚数单位；⑵取模Re⑷)为\⑷的实部，⑷)为\(M)的虚部，那么Sa,⑷的模如下Sai(")|=7(Re(5aj(W)))2+(Im(5fl((M)))2；(3)二维汉明窗二维汉明窗h(l，k)权利要求一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法，其特征在于包括以下步骤(1)分数傅里叶变换域输入语音序列s(n)的ai阶分数傅里叶变换算法如下<mrow><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>F</mi><msub><mi>a</mi><mi>i</mi></msub></msup><mrow><mo>(</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><mo>=</mo><mfencedopen='{'close=''><mtable><mtr><mtd><msqrt><mfrac><mrow><mn>1</mn><mo>-</mo><mi>j</mi><mi>cot</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>π</mi></mrow></mfrac></msqrt><munderover><mo>&Integral;</mo><mrow><mo>-</mo><mo>∞</mo></mrow><mrow><mo>+</mo><mo>∞</mo></mrow></munderover><mi>exp</mi><mrow><mo>(</mo><mi>j</mi><mfrac><mrow><msup><mi>u</mi><mn>2</mn></msup><mo>+</mo><msup><mi>n</mi><mn>2</mn></msup></mrow><mn>2</mn></mfrac><mi>cot</mi><mi>a</mi><mo>-</mo><mfrac><mi>jun</mi><mrow><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><mi>s</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>dt</mi></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>&NotEqual;</mo><mi>mπ</mi></mtd></mtr><mtr><mtd><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mn>2</mn><mi>mπ</mi></mtd></mtr><mtr><mtd><mi>s</mi><mrow><mo>(</mo><mo>-</mo><mi>n</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mrow><mo>(</mo><mn>2</mn><mi>m</mi><mo>&PlusMinus;</mo><mn>1</mn><mo>)</mo></mrow><mi>π</mi></mtd></mtr></mtable></mfenced></mrow>式中，O＜|p|＜2，i＝l，2，...，16，m为整数，j为虚数单位；(2)取模为的实部，为的虚部，的模如下<mrow><mo>|</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><msqrt><msup><mrow><mo>(</mo><mi>Re</mi><mrow><mo>(</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><mi>Im</mi><mrow><mo>(</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>;</mo></mrow>(3)二维汉明窗二维汉明窗h(l，k)<mrow><mi>h</mi><mrow><mo>(</mo><mi>l</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mn>0.54</mn><mo>-</mo><mn>0.46</mn><mi>cos</mi><mrow><mo>(</mo><mfrac><mrow><mn>2</mn><mi>πl</mi></mrow><mn>255</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mo>(</mo><mn>0.54</mn><mo>-</mo><mn>0.46</mn><mi>cos</mi><mrow><mo>(</mo><mfrac><mrow><mn>2</mn><mi>πk</mi></mrow><mn>15</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow>上式中l∈，k∈；(4)二维维纳滤波<mrow><msup><mrow><mo>|</mo><mover><mi>S</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>-</mo><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mfrac><mo>)</mo></mrow><mo>,</mo></mrow>其中为目标信号谱的估计幅度，|X(i，j)|为滤波前的目标信号谱的幅度，噪声信号谱的估计幅度；则可得二维维纳滤波如下<mrow><mover><mi>S</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mi>H</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>,</mo></mrow><mrow><mo>=</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><msqrt><mi>max</mi><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><mn>1</mn><mrow><mi>SNR</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mi>β</mi><mo>)</mo></mrow></msqrt><mo>,</mo></mrow>上式中β≥0，以保证传输函数H(u，v)＞0，<mrow><mi>SNR</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mfrac><msup><mrow><mo>|</mo><mover><mi>X</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mfrac><mo>,</mo></mrow>上式中<mrow><mo>|</mo><mover><mi>X</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mi>v</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>v</mi><mo>+</mo><mn>1</mn></mrow></munderover><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>+</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo><mo>,</mo></mrow><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mi>v</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>v</mi><mo>+</mo><mn>1</mn></mrow></munderover><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>+</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>N</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo><mo>;</mo></mrow>(5)分数傅里叶逆变换为ai阶分数傅里叶变换域上的估计语音＝Si(u)exp(jΔθi(u))，上式中分别为ai阶分数傅里叶变换域上含噪语音、纯净语音的相位谱，Δθi(u)为相位误差；Δθi(u)＝εiu/sinai，εi为均值较小的随机变量，则有<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>F</mi><mrow><mo>-</mo><msub><mi>a</mi><mi>i</mi></msub></mrow></msup><mo>[</mo><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><msub><mi>ϵ</mi><mi>i</mi></msub><mi>u</mi><mo>)</mo></mrow><mo>]</mo></mrow><mrow><mo>=</mo><msqrt><mfrac><mrow><mn>1</mn><mo>+</mo><mi>j</mi><mi>cot</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>π</mi></mrow></mfrac></msqrt><munderover><mo>&Integral;</mo><mrow><mo>-</mo><mo>∞</mo></mrow><mrow><mo>+</mo><mo>∞</mo></mrow></munderover><mi>exp</mi><mrow><mo>(</mo><mi>j</mi><mfrac><mrow><mrow><mo>(</mo><msup><mi>u</mi><mn>2</mn></msup><mo>+</mo><msup><mi>n</mi><mn>2</mn></msup><mo>)</mo></mrow><mi>cos</mi><msub><mi>a</mi><mi>i</mi></msub><mo>-</mo><mn>2</mn><mi>u</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><mo>-</mo><mn>2</mn><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>du</mi><mo>,</mo></mrow>为的时域形式；(6)线性合并令n′＝nεi，代入上式并化简整理可得<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>RES</mi><mrow><mo>(</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><mfrac><mrow><msup><msub><mi>ϵ</mi><mi>i</mi></msub><mn>2</mn></msup><msup><mi>cos</mi><mn>2</mn></msup><msub><mi>a</mi><mi>i</mi></msub><mo>+</mo><mn>2</mn><msub><mi>ϵ</mi><mi>i</mi></msub><mi>t</mi><mi>cos</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow>由于εi为均值较小的随机变量，则有<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>≈</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow>那么线性合并后可得<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mo>[</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow>当信号路数M→∞时，则有<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>E</mi><mo>[</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow>由于语音信号为短时平稳随机过程，则有<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>τ</mi><mn>0</mn></msub><mo>)</mo></mrow><mo>,</mo></mrow>式中τ0为时延常数。FSA00000239174200013.tif,FSA00000239174200014.tif,FSA00000239174200015.tif,FSA00000239174200016.tif,FSA00000239174200017.tif,FSA00000239174200018.tif,FSA000002391742000112.tif,FSA000002391742000113.tif,FSA00000239174200025.tif,FSA00000239174200026.tif,FSA00000239174200027.tif,FSA00000239174200028.tif,FSA00000239174200029.tif,FSA000002391742000212.tif,FSA000002391742000213.tif全文摘要本发明公布了一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法，包括以下步骤(1)分数傅里叶变换域；(2)取模；(3)加二维汉明窗；(4)二维维纳滤波；(5)分数傅里叶逆变换；(6)线性合并。本发明在取证语音增强领域具有较高的应用价值和广阔的应用前景。文档编号G10L21/02GK101950563SQ201010259828公开日2011年1月19日申请日期2010年8月20日优先权日2010年8月20日发明者包永强,唐加能,奚吉,王开,赵力,邹采荣,魏昕申请人:东南大学

本文推荐基于分数傅里叶变换的二维维纳滤波的取证语音增强方法仅代表作者观点，不代表本网站立场。本站对作者上传的所有内容将尽可能审核来源及出处，但对内容不作任何保证或承诺。请读者仅作参考并自行核实其真实性及合法性。如您发现图文视频内容来源标注有误或侵犯了您的权益请告知，本站将及时予以修改或删除。未经允许不得转载：http://www.pinpai35.com/1656292504.html

当前位置：网站首页>专利 >正文

基于分数傅里叶变换的二维维纳滤波的取证语音增强方法

相关推荐