当前位置:网站首页>专利 >正文

基于分数傅里叶变换的二维维纳滤波的取证语音增强方法


专利名称::基于分数傅里叶变换的二维维纳滤波的取证语音增强方法
技术领域
:本发明涉及一种语音增强方法,特别涉及一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法。音频取证是指对录音信号进行获取、分析和评价以作为法庭或其他行政部门认可的证据。音频证据可作为民事或刑事强制调查、行政调查或其他民事事件的一部分。音频取证技术融合了音频数字信号处理领域内的诸多技术如语音识别、说话人识别和语音增强等技术。从上个世纪六十年代开始,特别是1974年的水门事件以后,音频取证技术开始在法庭取证中得到了应用,但是由于当初语音信号处理理论和技术还处于起步发展阶段,音频取证技术的研究一度处于停顿状态,近年来随着语音信号处理技术的日益发展成熟和犯罪手段的不断高技术化,最近几年对音频取证技术的研究得到了语音信号处理人员的广泛关注。由于取证所用的音频信号经常受到来自噪声、其他声音、紊乱和其他妨碍正常音频取证分析的信号处理手段的影响。而且绝大部分音频信号都来自于采用隐藏的麦克风进行的私下录音,因此信号通常也受到风和其他环境声音的干扰。因此,在分析之前应当采用语音增强技术以提高感知信噪比。通常的语音增强算法大多基于平稳随机噪声理论,不能有效地降低非平稳噪声的影响,分数阶傅里叶变换的旋转特性显示,通过选择合适的分数阶因子a,可以在分数傅里叶变换域上实现语音与噪声的最大分离,也可以通过多次旋转以进一步分离消除噪声。
发明内容本发明目的是针对现有技术存在的缺陷提供一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法。本发明为实现上述目的,采用如下技术方案本发明基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,其特征在于包括以下步骤(1)分数傅里叶变换域输入语音序列s(η)的阶分数傅里叶变换算法如下Sa/(u)=Fa'(s(n))
背景技术
:-jCOtai2πexpjs{n)Cti=2mnat=(2m土l);r式中,〒,0<IPI<2,i=1,2,...,16,m为整数,j为虚数单位;⑵取模Re⑷)为\⑷的实部,⑷)为\(M)的虚部,那么Sa,⑷的模如下Sai(")|=7(Re(5aj(W)))2+(Im(5fl((M)))2;(3)二维汉明窗二维汉明窗h(l,k)权利要求一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,其特征在于包括以下步骤(1)分数傅里叶变换域输入语音序列s(n)的ai阶分数傅里叶变换算法如下<mrow><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>F</mi><msub><mi>a</mi><mi>i</mi></msub></msup><mrow><mo>(</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>)</mo></mrow></mrow><mrow><mo>=</mo><mfencedopen='{'close=''><mtable><mtr><mtd><msqrt><mfrac><mrow><mn>1</mn><mo>-</mo><mi>j</mi><mi>cot</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>&pi;</mi></mrow></mfrac></msqrt><munderover><mo>&Integral;</mo><mrow><mo>-</mo><mo>&infin;</mo></mrow><mrow><mo>+</mo><mo>&infin;</mo></mrow></munderover><mi>exp</mi><mrow><mo>(</mo><mi>j</mi><mfrac><mrow><msup><mi>u</mi><mn>2</mn></msup><mo>+</mo><msup><mi>n</mi><mn>2</mn></msup></mrow><mn>2</mn></mfrac><mi>cot</mi><mi>a</mi><mo>-</mo><mfrac><mi>jun</mi><mrow><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><mi>s</mi><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mi>dt</mi></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>&NotEqual;</mo><mi>m&pi;</mi></mtd></mtr><mtr><mtd><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mn>2</mn><mi>m&pi;</mi></mtd></mtr><mtr><mtd><mi>s</mi><mrow><mo>(</mo><mo>-</mo><mi>n</mi><mo>)</mo></mrow></mtd><mtd><msub><mi>a</mi><mi>i</mi></msub><mo>=</mo><mrow><mo>(</mo><mn>2</mn><mi>m</mi><mo>&PlusMinus;</mo><mn>1</mn><mo>)</mo></mrow><mi>&pi;</mi></mtd></mtr></mtable></mfenced></mrow>式中,O<|p|<2,i=l,2,...,16,m为整数,j为虚数单位;(2)取模为的实部,为的虚部,的模如下<mrow><mo>|</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><msqrt><msup><mrow><mo>(</mo><mi>Re</mi><mrow><mo>(</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup><mo>+</mo><msup><mrow><mo>(</mo><mi>Im</mi><mrow><mo>(</mo><msub><mi>S</mi><msub><mi>a</mi><mi>i</mi></msub></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mo>)</mo></mrow><mo>)</mo></mrow><mn>2</mn></msup></msqrt><mo>;</mo></mrow>(3)二维汉明窗二维汉明窗h(l,k)<mrow><mi>h</mi><mrow><mo>(</mo><mi>l</mi><mo>,</mo><mi>k</mi><mo>)</mo></mrow><mo>=</mo><mrow><mo>(</mo><mn>0.54</mn><mo>-</mo><mn>0.46</mn><mi>cos</mi><mrow><mo>(</mo><mfrac><mrow><mn>2</mn><mi>&pi;l</mi></mrow><mn>255</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mrow><mo>(</mo><mn>0.54</mn><mo>-</mo><mn>0.46</mn><mi>cos</mi><mrow><mo>(</mo><mfrac><mrow><mn>2</mn><mi>&pi;k</mi></mrow><mn>15</mn></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mo>,</mo></mrow>上式中l∈,k∈;(4)二维维纳滤波<mrow><msup><mrow><mo>|</mo><mover><mi>S</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>-</mo><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mo>=</mo><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msup><mrow><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mfrac><mo>)</mo></mrow><mo>,</mo></mrow>其中为目标信号谱的估计幅度,|X(i,j)|为滤波前的目标信号谱的幅度,噪声信号谱的估计幅度;则可得二维维纳滤波如下<mrow><mover><mi>S</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>=</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mi>H</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>,</mo></mrow><mrow><mo>=</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><msqrt><mi>max</mi><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mfrac><mn>1</mn><mrow><mi>SNR</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow></mrow></mfrac><mo>,</mo><mi>&beta;</mi><mo>)</mo></mrow></msqrt><mo>,</mo></mrow>上式中β≥0,以保证传输函数H(u,v)>0,<mrow><mi>SNR</mi><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>=</mo><mfrac><msup><mrow><mo>|</mo><mover><mi>X</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup><msup><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo></mrow><mn>2</mn></msup></mfrac><mo>,</mo></mrow>上式中<mrow><mo>|</mo><mover><mi>X</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mi>v</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>v</mi><mo>+</mo><mn>1</mn></mrow></munderover><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>+</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>X</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo><mo>,</mo></mrow><mrow><mo>|</mo><mover><mi>N</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>u</mi><mo>,</mo><mi>v</mi><mo>)</mo></mrow><mo>|</mo><mo>=</mo><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mi>v</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>v</mi><mo>+</mo><mn>1</mn></mrow></munderover><munderover><mi>&Sigma;</mi><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>-</mo><mn>1</mn></mrow><mrow><mi>j</mi><mo>=</mo><mi>u</mi><mo>+</mo><mn>1</mn></mrow></munderover><mo>|</mo><mi>N</mi><mrow><mo>(</mo><mi>i</mi><mo>,</mo><mi>j</mi><mo>)</mo></mrow><mo>|</mo><mo>;</mo></mrow>(5)分数傅里叶逆变换为ai阶分数傅里叶变换域上的估计语音=Si(u)exp(jΔθi(u)),上式中分别为ai阶分数傅里叶变换域上含噪语音、纯净语音的相位谱,Δθi(u)为相位误差;Δθi(u)=εiu/sinai,εi为均值较小的随机变量,则有<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>t</mi><mo>)</mo></mrow><mo>=</mo><msup><mi>F</mi><mrow><mo>-</mo><msub><mi>a</mi><mi>i</mi></msub></mrow></msup><mo>[</mo><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><msub><mi>&epsiv;</mi><mi>i</mi></msub><mi>u</mi><mo>)</mo></mrow><mo>]</mo></mrow><mrow><mo>=</mo><msqrt><mfrac><mrow><mn>1</mn><mo>+</mo><mi>j</mi><mi>cot</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>&pi;</mi></mrow></mfrac></msqrt><munderover><mo>&Integral;</mo><mrow><mo>-</mo><mo>&infin;</mo></mrow><mrow><mo>+</mo><mo>&infin;</mo></mrow></munderover><mi>exp</mi><mrow><mo>(</mo><mi>j</mi><mfrac><mrow><mrow><mo>(</mo><msup><mi>u</mi><mn>2</mn></msup><mo>+</mo><msup><mi>n</mi><mn>2</mn></msup><mo>)</mo></mrow><mi>cos</mi><msub><mi>a</mi><mi>i</mi></msub><mo>-</mo><mn>2</mn><mi>u</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow></mrow><mrow><mo>-</mo><mn>2</mn><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><msub><mi>S</mi><mi>i</mi></msub><mrow><mo>(</mo><mi>u</mi><mo>)</mo></mrow><mi>du</mi><mo>,</mo></mrow>为的时域形式;(6)线性合并令n′=nεi,代入上式并化简整理可得<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>RES</mi><mrow><mo>(</mo><mi>exp</mi><mrow><mo>(</mo><mo>-</mo><mi>j</mi><mfrac><mrow><msup><msub><mi>&epsiv;</mi><mi>i</mi></msub><mn>2</mn></msup><msup><mi>cos</mi><mn>2</mn></msup><msub><mi>a</mi><mi>i</mi></msub><mo>+</mo><mn>2</mn><msub><mi>&epsiv;</mi><mi>i</mi></msub><mi>t</mi><mi>cos</mi><msub><mi>a</mi><mi>i</mi></msub></mrow><mrow><mn>2</mn><mi>sin</mi><msub><mi>a</mi><mi>i</mi></msub></mrow></mfrac><mo>)</mo></mrow><mo>)</mo></mrow><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow>由于εi为均值较小的随机变量,则有<mrow><msub><mover><mi>S</mi><mo>^</mo></mover><mi>i</mi></msub><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>&ap;</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>,</mo></mrow>那么线性合并后可得<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mfrac><mn>1</mn><mi>M</mi></mfrac><munderover><mi>&Sigma;</mi><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mo>[</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow>当信号路数M→∞时,则有<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>E</mi><mo>[</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&epsiv;</mi><mi>i</mi></msub><mo>)</mo></mrow><mo>]</mo><mo>,</mo></mrow>由于语音信号为短时平稳随机过程,则有<mrow><mover><mi>s</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>n</mi><mo>)</mo></mrow><mo>=</mo><mi>s</mi><mrow><mo>(</mo><mi>n</mi><mo>-</mo><msub><mi>&tau;</mi><mn>0</mn></msub><mo>)</mo></mrow><mo>,</mo></mrow>式中τ0为时延常数。FSA00000239174200013.tif,FSA00000239174200014.tif,FSA00000239174200015.tif,FSA00000239174200016.tif,FSA00000239174200017.tif,FSA00000239174200018.tif,FSA000002391742000112.tif,FSA000002391742000113.tif,FSA00000239174200025.tif,FSA00000239174200026.tif,FSA00000239174200027.tif,FSA00000239174200028.tif,FSA00000239174200029.tif,FSA000002391742000212.tif,FSA000002391742000213.tif全文摘要本发明公布了一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,包括以下步骤(1)分数傅里叶变换域;(2)取模;(3)加二维汉明窗;(4)二维维纳滤波;(5)分数傅里叶逆变换;(6)线性合并。本发明在取证语音增强领域具有较高的应用价值和广阔的应用前景。文档编号G10L21/02GK101950563SQ201010259828公开日2011年1月19日申请日期2010年8月20日优先权日2010年8月20日发明者包永强,唐加能,奚吉,王开,赵力,邹采荣,魏昕申请人:东南大学

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:一种制作多位相衍射光学元件的工艺的制作方法技术领域:本发明属于领域信息科学与技术领域,具体涉及一种制作多位相衍射光学元件的工艺。由二元光学理论,通过位相台阶数的增加,可以获得更高衍射效率的衍射光学元件。例如当位相数为8时,衍射效率

    专利发布时间:2025-08-16阅读:(117)

    专利名称:在卡拉ok传输装置中管理信息资料的方法及卡拉ok传输装置的制作方法技术领域:本发明涉及一种在卡拉OK传输装置中管理信息资料的方法。用此方法,可使不必要的信息资料,如在卡拉OK传输装置中显示期满的信息资料从卡拉OK曲目间歇地显示的、

    专利发布时间:2025-08-16阅读:(128)

    专利名称:镜片加工治具的制作方法技术领域:本发明涉及一种镜片加工治具。 背景技术:随着光学产品的发展,光学镜片的应用范围越来越广。相应地,业界采用各种方法来制 造光学镜片以适应市场对不同规格光学镜片的需求(请参阅"Fabricat

    专利发布时间:2025-08-16阅读:(145)

    专利名称:轨道式可脱卸防擦伤卫生口琴套的制作方法技术领域:本发明涉及一种轨道式可脱卸防擦伤卫生口琴套,具体地说涉及一种在口琴外面 加一个柔软滑片套的轨道式可脱卸防擦伤卫生口琴套。背景技术:学习吹口琴,同学的兴趣都很浓,但同学们吹了 口琴之后

    专利发布时间:2025-08-16阅读:(126)

    专利名称:八音盒等发条为动力产品的离心摩擦式调速器的制作方法技术领域:本实用新型涉及一种用于八音盒或其他以发条为动力的产品的离心摩擦式调速器。目前公知的八音盒或其他以发条为动力的产品上用的调速器有风扇阻尼和离心摩擦式这两大类。风扇阻尼式的在

    专利发布时间:2025-08-16阅读:(115)

    提高口语评测性能的方法及系统的制作方法【专利摘要】本发明公开了一种提高口语评测性能的方法及系统,该方法包括:接收待评测的用户语音数据,所述语音数据包括:朗读题语音数据和半开放题型语音数据;根据所述朗读题语音数据对各朗读题进行评分;从评分结果

    专利发布时间:2025-08-16阅读:(120)