当前位置:网站首页>专利 >正文

提高语音辅元衔接部分周期成分提取质量的方法

提高语音辅元衔接部分周期成分提取质量的方法
【专利摘要】本发明在使用正弦模型对辅元衔接处的语音周期成分进行处理时,使用梯度下降算法对采用短时傅立叶变换等方式获取的正弦模型参数进行优化,从而使正弦模型对辅元衔接处的语音拟合更加精确,对于语音周期成分达到更高的提取质量,最终有效改进语音合成时铺元衔接部分合成的自然度。
【专利说明】提高语音辅元衔接部分周期成分提取质量的方法

【技术领域】
[0001]本发明之技术属于语音信号处理领域,特别是以正弦模型为技术基础的语音合成的【技术领域】。

【背景技术】
[0002]目前对语音进行建模的常用方法之一是正弦模型。正弦模型理论认为所有的波形都能以若干个正弦波的叠加表示,从而将所有的波形表达为统一的函数式。在实际使用中通常使用余弦函数表示:

【权利要求】
1.一种基于正弦模型,提高语音辅元衔接部分周期成分提取质量的方法,其特征在于包括以下步骤: 步骤一、输入语音信号,分析出发声起始点和基频曲线; 步骤二、对输入的语音信号进行谐波加噪声分析:对整段信号进行短时傅立叶变换(STFT),参考基频对短时频幅谱进行峰值检测,从而初步估计该分析帧上各个谐波的频率和幅度,并从相位谱中获得各个谐波的相位; 步骤三、从发声起始点到语音信号的开始处,进行逐帧的逆向分析:通过梯度下降算法精确计算各分析帧上的谐波幅度和相位; 步骤四、根据步骤三中精确计算获得的幅度和相位,对各谐波的频率进行调整。
2.根据权利要求1所述的一种提高语音辅元衔接部分周期成分提取质量的方法,步骤二的特征在于:从发声起始点开始,反向从频谱中获取谐波频率、幅度时,将相邻两帧内频率不稳定的谐波的幅度设定为O: 若满足 Jf功)-乙小费广',或则设定 r;(h)-ftr;(n I,,p,{h)= P,(i; r:-取值范围在30到50赫兹; 其中,icffll为第i中贞的基频,?⑷是第i中贞的第h个谐波的频率,为第I帧的第h个谐波的幅度,p:(ft)丨是第i帧的第h个谐波的相位,PAk) I为第i帧的相位谱。
3.根据权利要求1所述的一种提高语音辅元衔接部分周期成分提取质量的方法,步骤三的特征在于:使用梯度下降算法精确计算各帧的谐波幅度相位时,使用如下公式更新每个谐波的幅度相位:
其中,-Y-为谐波个数,为步骤二中分析窗长,片|为采样频率,.ν;--)为第i帧加窗前的语音信号片段,为重生成出的语音信号片段; 2I取值范围为0.2到0.5。
4.根据权利要求1一种提高语音辅元衔接部分周期成分提取质量的方法,基于权利要求3,步骤三的特征还在于:根据步骤三中优化后的ρβ】)I对进行矫正,公式和计算顺序如下:
其中,&为步骤二中窗移动间距采样数。
【文档编号】G10L13/02GK104183233SQ201410457379
【公开日】2014年12月3日 申请日期:2014年9月10日 优先权日:2014年9月10日
【发明者】华侃如 申请人:华侃如

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:物镜和光拾取头装置的制作方法技术领域:本发明涉及对于规格(记录密度)不同的3种光信息记录介质至少可以进行信息的记录以及再生的一方的光学拾取头装置,可以在该光学拾取头装置中使用的物镜、基片厚度差补正装置、色差补正装置、基片厚度误差补

    专利发布时间:2025-08-16阅读:(136)

    专利名称:一种匀胶铬板滤光片翻刻工艺的制作方法技术领域:本发明属于显示器件用滤光片制造领域,具体涉及一种用于对母板滤 光片进行翻印刻录制造的匀胶铬板滤光片翻刻工艺。 背景技术:彩色显像管制造过程中有一道曝光工序,该工序通过一系列曝光刻蚀 的

    专利发布时间:2025-08-16阅读:(101)

    专利名称:一种led生物灯的制作方法技术领域:本实用新型涉及一种LED生物灯,主要用于植物,动物的生长照明,促进生物缩短生广周期,提闻效率。背景技术:目前市场上有荧光灯,日光灯,LED植物灯,但是利用亚克力作为外壳和外形来生产制造的却没有,

    专利发布时间:2025-08-16阅读:(147)

    专利名称:能自动弹开的折叠眼镜的制作方法技术领域:本发明涉及一种折叠眼镜,尤其是一种只需一只手就可以打开的能自动弹 开的折叠眼镜。 背景技术:传统的折叠眼镜,在不需要使用时,其折叠后要用眼镜盒装好后,才可以 存放,这种折叠眼镜的使用和携带都

    专利发布时间:2025-08-16阅读:(136)

    专利名称:一种眼镜防护垫的制作方法技术领域:本发明涉及一种眼镜装置,具体涉及一种眼镜防护垫。 背景技术:随着中国物质生活的提高,现在中国的家长越来越重视教育,但是又不太注重保护孩子用眼的正确性,导致许多小孩从小就开始带眼镜,越来越多的人戴眼

    专利发布时间:2025-08-16阅读:(156)

    专利名称:多声道音频扩展支持的制作方法技术领域:本发明涉及多声道音频编码以及多声道音频编码中的多声道音频扩展。更具体地,本发明涉及一种用于支持多声道音频编码系统编码端的多声道音频扩展的方法,一种用于支持多声道音频编码系统解码端的多声道音频扩

    专利发布时间:2025-08-16阅读:(93)