专利名称::基于分数傅里叶变换的二维维纳滤波的取证语音增强方法
技术领域:
:本发明涉及一种语音增强方法,特别涉及一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法。音频取证是指对录音信号进行获取、分析和评价以作为法庭或其他行政部门认可的证据。音频证据可作为民事或刑事强制调查、行政调查或其他民事事件的一部分。音频取证技术融合了音频数字信号处理领域内的诸多技术如语音识别、说话人识别和语音增强等技术。从上个世纪六十年代开始,特别是1974年的水门事件以后,音频取证技术开始在法庭取证中得到了应用,但是由于当初语音信号处理理论和技术还处于起步发展阶段,音频取证技术的研究一度处于停顿状态,近年来随着语音信号处理技术的日益发展成熟和犯罪手段的不断高技术化,最近几年对音频取证技术的研究得到了语音信号处理人员的广泛关注。由于取证所用的音频信号经常受到来自噪声、其他声音、紊乱和其他妨碍正常音频取证分析的信号处理手段的影响。而且绝大部分音频信号都来自于采用隐藏的麦克风进行的私下录音,因此信号通常也受到风和其他环境声音的干扰。因此,在分析之前应当采用语音增强技术以提高感知信噪比。通常的语音增强算法大多基于平稳随机噪声理论,不能有效地降低非平稳噪声的影响,分数阶傅里叶变换的旋转特性显示,通过选择合适的分数阶因子a,可以在分数傅里叶变换域上实现语音与噪声的最大分离,也可以通过多次旋转以进一步分离消除噪声。
发明内容本发明目的是针对现有技术存在的缺陷提供一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法。本发明为实现上述目的,采用如下技术方案本发明基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,其特征在于包括以下步骤(1)分数傅里叶变换域输入语音序列s(η)的阶分数傅里叶变换算法如下Sa/(u)=Fa'(s(n))
背景技术:
:-jCOtai2πexpjs{n)Cti=2mnat=(2m土l);r式中,〒,0<IPI<2,i=1,2,...,16,m为整数,j为虚数单位;⑵取模Re⑷)为\⑷的实部,⑷)为\(M)的虚部,那么Sa,⑷的模如下Sai(")|=7(Re(5aj(W)))2+(Im(5fl((M)))2;(3)二维汉明窗二维汉明窗h(l,k)权利要求一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,其特征在于包括以下步骤(1)分数傅里叶变换域输入语音序列s(n)的ai阶分数傅里叶变换算法如下<mrow><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>F</mi><msub><mi>a</mi><mi>i</mi></msub></msup><mrow><mo>(</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><mo>=</mo><mfencedopen='{'close=''><mtable><mtr><mtd><msqrt><mfrac><mrow><mn>1</mn><mo>-</mo><mi>j</mi><mi>cot</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>π</mi></mrow></mfrac></msqrt><munderover><mo>∫</mo><mrow><mo>-</mo><mo>∞</mo></mrow><mrow><mo>+</mo><mo>∞</mo></mrow></munderover><mi>exp</mi><mrow><mo>(</mo><mi>j</mi><mfrac><mrow><msup><mi>u</mi><mn>2</mn></msup><mo>+</mo><msup><mi>n</mi><mn>2</mn></msup></mrow><mn>2</mn></mfrac><mi>cot</mi><mi>a</mi><mo>-</mo><mfrac><mi>jun</mi><mrow><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><mi>s</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>dt</mi></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>≠</mo><mi>mπ</mi></mtd></mtr><mtr><mtd><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mn>2</mn><mi>mπ</mi></mtd></mtr><mtr><mtd><mi>s</mi><mrow><mo>(</mo><mo>-</mo><mi>n</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mrow><mo>(</mo><mn>2</mn><mi>m</mi><mo>±</mo><mn>1</mn><mo>)</mo></mrow><mi>π</mi></mtd></mtr></mtable></mfenced></mrow>式中,O<|p|<2,i=l,2,...,16,m为整数,j为虚数单位;(2)取模为的实部,为的虚部,的模如下<mrow><mo>|</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><msqrt><msup><mrow><mo>(</mo><mi>Re</mi><mrow><mo>(</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><mi>Im</mi><mrow><mo>(</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>;</mo></mrow>(3)二维汉明窗二维汉明窗h(l,k)<mrow><mi>h</mi><mrow><mo>(</mo><mi>l</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mn>0.54</mn><mo>-</mo><mn>0.46</mn><mi>cos</mi><mrow><mo>(</mo><mfrac><mrow><mn>2</mn><mi>πl</mi></mrow><mn>255</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mo>(</mo><mn>0.54</mn><mo>-</mo><mn>0.46</mn><mi>cos</mi><mrow><mo>(</mo><mfrac><mrow><mn>2</mn><mi>πk</mi></mrow><mn>15</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow>上式中l∈,k∈;(4)二维维纳滤波<mrow><msup><mrow><mo>|</mo><mover><mi>S</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>-</mo><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mfrac><mo>)</mo></mrow><mo>,</mo></mrow>其中为目标信号谱的估计幅度,|X(i,j)|为滤波前的目标信号谱的幅度,噪声信号谱的估计幅度;则可得二维维纳滤波如下<mrow><mover><mi>S</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mi>H</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>,</mo></mrow><mrow><mo>=</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><msqrt><mi>max</mi><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><mn>1</mn><mrow><mi>SNR</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mi>β</mi><mo>)</mo></mrow></msqrt><mo>,</mo></mrow>上式中β≥0,以保证传输函数H(u,v)>0,<mrow><mi>SNR</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mfrac><msup><mrow><mo>|</mo><mover><mi>X</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mfrac><mo>,</mo></mrow>上式中<mrow><mo>|</mo><mover><mi>X</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mi>v</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>v</mi><mo>+</mo><mn>1</mn></mrow></munderover><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>+</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo><mo>,</mo></mrow><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mi>v</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>v</mi><mo>+</mo><mn>1</mn></mrow></munderover><munderover><mi>Σ</mi><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>+</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>N</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo><mo>;</mo></mrow>(5)分数傅里叶逆变换为ai阶分数傅里叶变换域上的估计语音=Si(u)exp(jΔθi(u)),上式中分别为ai阶分数傅里叶变换域上含噪语音、纯净语音的相位谱,Δθi(u)为相位误差;Δθi(u)=εiu/sinai,εi为均值较小的随机变量,则有<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>F</mi><mrow><mo>-</mo><msub><mi>a</mi><mi>i</mi></msub></mrow></msup><mo>[</mo><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><msub><mi>ϵ</mi><mi>i</mi></msub><mi>u</mi><mo>)</mo></mrow><mo>]</mo></mrow><mrow><mo>=</mo><msqrt><mfrac><mrow><mn>1</mn><mo>+</mo><mi>j</mi><mi>cot</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>π</mi></mrow></mfrac></msqrt><munderover><mo>∫</mo><mrow><mo>-</mo><mo>∞</mo></mrow><mrow><mo>+</mo><mo>∞</mo></mrow></munderover><mi>exp</mi><mrow><mo>(</mo><mi>j</mi><mfrac><mrow><mrow><mo>(</mo><msup><mi>u</mi><mn>2</mn></msup><mo>+</mo><msup><mi>n</mi><mn>2</mn></msup><mo>)</mo></mrow><mi>cos</mi><msub><mi>a</mi><mi>i</mi></msub><mo>-</mo><mn>2</mn><mi>u</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><mo>-</mo><mn>2</mn><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>du</mi><mo>,</mo></mrow>为的时域形式;(6)线性合并令n′=nεi,代入上式并化简整理可得<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>RES</mi><mrow><mo>(</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><mfrac><mrow><msup><msub><mi>ϵ</mi><mi>i</mi></msub><mn>2</mn></msup><msup><mi>cos</mi><mn>2</mn></msup><msub><mi>a</mi><mi>i</mi></msub><mo>+</mo><mn>2</mn><msub><mi>ϵ</mi><mi>i</mi></msub><mi>t</mi><mi>cos</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow>由于εi为均值较小的随机变量,则有<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>≈</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow>那么线性合并后可得<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><munderover><mi>Σ</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mo>[</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow>当信号路数M→∞时,则有<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>E</mi><mo>[</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>ϵ</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow>由于语音信号为短时平稳随机过程,则有<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>τ</mi><mn>0</mn></msub><mo>)</mo></mrow><mo>,</mo></mrow>式中τ0为时延常数。FSA00000239174200013.tif,FSA00000239174200014.tif,FSA00000239174200015.tif,FSA00000239174200016.tif,FSA00000239174200017.tif,FSA00000239174200018.tif,FSA000002391742000112.tif,FSA000002391742000113.tif,FSA00000239174200025.tif,FSA00000239174200026.tif,FSA00000239174200027.tif,FSA00000239174200028.tif,FSA00000239174200029.tif,FSA000002391742000212.tif,FSA000002391742000213.tif全文摘要本发明公布了一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,包括以下步骤(1)分数傅里叶变换域;(2)取模;(3)加二维汉明窗;(4)二维维纳滤波;(5)分数傅里叶逆变换;(6)线性合并。本发明在取证语音增强领域具有较高的应用价值和广阔的应用前景。文档编号G10L21/02GK101950563SQ201010259828公开日2011年1月19日申请日期2010年8月20日优先权日2010年8月20日发明者包永强,唐加能,奚吉,王开,赵力,邹采荣,魏昕申请人:东南大学
基于分数傅里叶变换的二维维纳滤波的取证语音增强方法
相关推荐
专利名称:在卡拉ok传输装置中管理信息资料的方法及卡拉ok传输装置的制作方法技术领域:本发明涉及一种在卡拉OK传输装置中管理信息资料的方法。用此方法,可使不必要的信息资料,如在卡拉OK传输装置中显示期满的信息资料从卡拉OK曲目间歇地显示的、
专利名称:新式灯具的制作方法技术领域:本实用新型涉及灯具。背景技术:卧室的床头灯往往为普通较暗的灯或小夜灯的方式,功能单一且使用方式缺乏新意发明内容本实用新型的目的是提供一种可以作为小夜灯,且使用方式独特的新式灯具。本实用新型采用以下技术方
专利名称:话音分组识别的制作方法技术领域:本发明一般涉及话音信号产生和处理。背景技术: 通常,在话音信号产生和处理中,话音信号不仅传达讲话内容,而且还透露有关讲话人身份的一些信息。在这方面,通过分析话音信号波形,人们可以将话音信号归类为各种
专利名称:电箱两用吉他的制作方法技术领域:本实用新型涉及一种吉他,特别是一种同时具有电吉他和普通木吉他功能的电箱两用吉他。中国实用新型专利CN 2042995U公告了一种一体化电声普通两用吉它,其琴体的面板上设置有一个喇叭、低音调节旋钮、高
专利名称:用于曝光机的平台装置的制作方法技术领域:本实用新型涉及一种曝光机装置,具体涉及一种用于曝光机的平台装置。背景技术:一般曝光机的对位速度及曝光精度影响了 PCB制程的质量及产出量,所以如何提升曝光机的对位速度以及精度为一个目前需要被
专利名称:旋转拍摄式数码照相机的制作方法技术领域:本实用新型涉及一种数码摄影装置。数码摄影装置一般由CCD、镜头、暗箱、图像信息处理电路、控制电路等组成。在成像过程中摄影装置成相对静止状态,一般只能用于固定拍摄,不能拍摄全景照片。本实用新型