一种适应于移动设备的英语语句发音质量检测方法
【专利摘要】本发明公开了一种适应于移动设备的英语语句发音质量检测方法,该方法包括以下步骤:对用户发出的语句进行采集;对采集的语音信号进行预处理;对经预处理的语音信号进行语音特征参数提取,得到采集的语音信号的语音特征参数;利用语音特征参数对采集的语音信号与标准语音信号进行比较,进行内容、情感、语速、重音、节奏和语调评分;根据内容分值、情感分值、语速分值、重音分值、节奏分值和语调分值中至少一项得到采集的语音信号的最终分值;根据最终分值评判采集的语音信号是否发音准确。本发明可以提高语句发音检测的准确性,解决用户只能在PC端使用语句发音检测系统的问题。
【专利说明】一种适应于移动设备的英语语句发音质量检测方法
【技术领域】
[0001]本发明涉及语音信号处理【技术领域】,尤其涉及一种适应于移动设备的英语语句发音质量检测方法。
【背景技术】
[0002]信号处理技术在语言学习中的应用是信息技术与语言学习整合的一个重要内容,其目标是将最新的语音技术与当前的教学和学习方法结合,建立计算机辅助语言学习系统。
[0003]语音客观评价方法最早可以追溯到二十世纪四十年代末,由N.R.French和J.C.Steinberg 于 1947 年提出的清晰度指数 Al (Articulationhidex)方法。T.P.Barnwell和S.R.Quackenbus对八十年代中期以前的语音质量客观评价研究工作作了系统总结,于1988年出版了介绍一本语音质量客观评价的著作。
[0004]进入九十年代后,语音质量客观评价方法研究取得了飞跃的发展,S.Wang于1992年提出的巴克谱失真BSD (Bark Spectral Distortion)方法对以后的影响较大,BSD方法是以人的听觉能力和听觉心理特点为基础构造出一种听觉转换模型。
[0005]我国语音识别研究工作起步于20世纪50年代,中科院声学所开始进行语音识别研究。中国语音识别的真正的开端应该是1978年,中科院声学所实现的采用带通滤波器组参数为特征的语音识别系统RTSRS(Ol)的产生。20世纪80年代,针对汉语单音节的特点,清华大学、中国科学院、北方交通大学、东南大学等开发了汉语特定人孤立字全音节语音识别系统。
[0006]当前语句发音准确度检测的相关技术,大多是考察语速和重音两个指标。在语速上,采用判断句子读取时间来衡量句子的语速,在重音上,采用语音的短时能量作为重音的判断标准。发音检测最后得分的计算方法则是将语速和重音两个指标的分值进行简单结合,准确度差。此外,现有检测方法大多局限于在PC机上使用,限定了用户只能在PC机旁进行语句发音检测,灵活性小,方便性差。
【发明内容】
[0007]本发明实施例所要解决的技术问题是,提出一种适应于移动设备的英语语句发音质量检测方法,提高语句发音检测的准确性,解决用户只能在PC端使用语句发音检测系统的问题。
[0008]为解决上述技术问题,本发明实施例提出一种适应于移动设备的英语语句发音质量检测方法,包括以下步骤:
[0009]S1.对用户发出的语句进行采集,获得语音信号;
[0010]S2.对所述采集的语音信号进行预处理,得到经预处理的语音信号;
[0011]S3.对所述经预处理的语音信号进行语音特征参数提取,得到所述采集的语音信号的语音特征参数,并将所述语音特征参数存储于数据存储器中;[0012]S4.利用所述语音特征参数对所述采集的语音信号与标准语音信号进行比较,进行内容、情感、语速、重音、节奏和语调评分,得到所述采集的语音信号的内容分值、情感分值、语速分值、重音分值、节奏分值和语调分值中的至少一项;
[0013]S5.根据所述内容分值、情感分值、语速分值、重音分值、节奏分值和语调分值中至少一项得到所述采集的语音信号的最终分值;根据所述最终分值判断所述采集的语音信号是否发音准确。
[0014]进一步的,所述步骤S2包括:
[0015]对所述采集的语音信号进行预加重处理、分帧处理、加窗函数和端点检测,得到经预处理的语音信号;
[0016]具体的,所述预加重处理为,用高频提升预加重数字滤波器处理所述采集的语音信号,按照6dB/oct的规格对所述采集的语音信号的高频部分进行提升;
[0017]所述分巾贞处理米用半巾贞交叠分巾贞的方式进行分巾贞处理;
[0018]所述加窗函数采用汉明窗;
[0019]所述端点检测采用双门限比较法,以短时能量E和短时平均过零率Z作为判断语音起始点的特征。
[0020]进一步的,所述步骤S3包括:
[0021]提取所述经预处理的语音信号的语音特征参数,得到所述采集的语音信号的语音时长参数、语音能量参数Tse和Mel倒谱系数,并将所述采集的语音信号的语音时长参数、语音能量参数Tse和Mel倒谱系数存储于数据存储器中。
[0022]进一步的,所述步骤S4包括:
[0023]调取所述采集的语音信号的Mel倒谱系数,并利用分段聚类算法进行处理,得到经分段聚类的内容特征参数;
[0024]调取与所述采集的语音信号相对应的标准语音信号的概率神经网络语音模型,并将所述经分段聚类的内容特征参数输入所述标准语音信号的概率神经网络语音模型中,得到所述采集的语音信号的内容分类结果;
[0025]计算所述采集的语音信号的Mel倒谱系数和与所述采集的语音信号相对应的标准语音信号的Mel倒谱系数之间的相关系数;
[0026]根据所述内容分类结果和所述相关系数,对所述采集的语音信号的内容进行评分,得到内容分值。
[0027]进一步的,所述步骤S4还包括:
[0028]调取所述采集的语音信号的Mel倒谱系数和语音能量参数,并利用分段聚类算法进行处理,得到经分段聚类的情感特征参数;
[0029]调取与所述采集的语音信号相对应的标准语音信号的概率神经网络语音模型,并将所述经分段聚类的情感特征参数输入所述标准语音信号的概率神经网络语音模型中,得到所述采集的语音信号的情感分类结果;
[0030]计算所述采集的语音信号的Mel倒谱系数和与所述采集的语音信号相对应的标准语音信号的Mel倒谱系数之间的相关系数;
[0031]根据所述情感分类结果和所述相关系数,对所述采集的语音信号的情感进行评分,得到情感分值。[0032]进一步的,所述步骤S4还包括:
[0033]调取与所述采集的语音信号相对应的标准语音信号的语音时长参数,将所述标准语音信号的语音时长参数和所述采集的语音信号的语音时长参数代入英语句子发音的相对语速计算公式,计算相对语速Vwtiss,所述计算公式如下:
[0034]
【权利要求】
1.一种适应于移动设备的英语语句发音质量检测方法,其特征在于,包括: 51.对用户发出的语句进行采集,获得语音信号; 52.对所述采集的语音信号进行预处理,得到经预处理的语音信号; 53.对所述经预处理的语音信号进行语音特征参数提取,得到所述采集的语音信号的语音特征参数,并将所述语音特征参数存储于数据存储器中; 54.利用所述语音特征参数对所述采集的语音信号与标准语音信号进行比较,进行内容、情感、语速、重音、节奏和语调评分,得到所述采集的语音信号的内容分值、情感分值、语速分值、重音分值、节奏分值和语调分值中的至少一项; 55.根据所述内容分值、情感分值、语速分值、重音分值、节奏分值和语调分值中至少一项得到所述采集的语音信号的最终分值;根据所述最终分值判断所述采集的语音信号是否发音准确。
2.如权利要求1所述的适应于移动设备的英语语句发音质量检测方法,其特征在于,所述步骤S2包括: 对所述采集的语音信号进行预加重处理、分帧处理、加窗函数和端点检测,得到经预处理的语音信号; 其中,所述预加重处理具体为,用高频提升预加重数字滤波器处理所述采集的语音信号,按照6dB/oct的规格对所述采集的语音信号的高频部分进行提升; 所述分帧处理采用半帧交叠分帧的方式进行分帧处理; 所述加窗函数采用汉明窗;` 所述端点检测采用双门限比较法,以短时能量E和短时平均过零率Z作为判断语音起始点的特征。
3.如权利要求2所述的适应于移动设备的英语语句发音质量检测方法,其特征在于,所述步骤S3包括: 提取所述经预处理的语音信号的语音特征参数,得到所述采集的语音信号的语音时长参数、语音能量参数Tse和Mel倒谱系数,并将所述采集的语音信号的语音时长参数、语音能量参数Tse和Mel倒谱系数存储于数据存储器中。
4.如权利要求3所述的适应于移动设备的英语语句发音质量检测方法,其特征在于,所述步骤S4包括: 调取所述采集的语音信号的Mel倒谱系数,并利用分段聚类算法进行处理,得到经分段聚类的内容特征参数; 调取与所述采集的语音信号相对应的标准语音信号的概率神经网络语音模型,并将所述经分段聚类的内容特征参数输入所述标准语音信号的概率神经网络语音模型中,得到所述采集的语音信号的内容分类结果; 计算所述采集的语音信号的Mel倒谱系数和与所述采集的语音信号相对应的标准语音信号的Mel倒谱系数之间的相关系数; 根据所述内容分类结果和所述相关系数,对所述采集的语音信号的内容进行评分,得到内容分值。
5.如权利要求4所述的适应于移动设备的英语语句发音质量检测方法,其特征在于,所述步骤S4还包括:调取所述采集的语音信号的Mel倒谱系数和语音能量参数,并利用分段聚类算法进行处理,得到经分段聚类的情感特征参数; 调取与所述采集的语音信号相对应的标准语音信号的概率神经网络语音模型,并将所述经分段聚类的情感特征参数输入所述标准语音信号的概率神经网络语音模型中,得到所述采集的语音信号的情感分类结果; 计算所述采集的语音信号的Mel倒谱系数和与所述采集的语音信号相对应的标准语音信号的Mel倒谱系数之间的相关系数; 根据所述情感分类结果和所述相关系数,对所述采集的语音信号的情感进行评分,得到情感分值。
6.如权利要求5所述的适应于移动设备的英语语句发音质量检测方法,其特征在于,所述步骤S4还包括: 调取与所述采集的语音信号相对应的标准语音信号的语音时长参数,将所述标准语音信号的语音时长参数和所述采集的语音信号的语音时长参数代入英语句子发音的相对语速计算公式,计算相对语速Vwtiss,所述计算公式如下:
7.如权利要求6所述的适应于移动设备的英语语句发音质量检测方法,其特征在于,所述步骤S4还包括: 调取与所述采集的语音信号相对应的标准语音信号的语音时长参数,将所述采集的语音信号的语音时长按比例调整为所述标准语音信号的语音时长参数; 调取所述采集的语音信号的语音能量参数Tse,根据所述采集的语音信号的语音能量参数Tse值,逐个搜索所述采集的语音信号中语音能量大于重音阀值Tu的最大语音信号值Sfflax;在小于所述最大语音信号值Smax的语音能量参数值范围内,由大到小逐个搜索等于非重音阀值1\的语音信号值S1 ;在大于所述最大语音信号值Smax的语音能量参数值范围内,由小到大逐个搜索等于非重音阀值T1的语音信号值& ;将S1与&设置为所述采集的语音信号的重音信号,并将S1与&之间的信号量值置0,计算S1与&之间的语音时长;若所述S1与&之间的语音时长大于重读元音时长,则S1与&之间的语音部分即为重音音节,其中,重读元音时长等于100ms,记录所述重音音节的长度; 统计所述采集的语音信号里的重音个数Tsmm,调取与所述采集的语音信号相对应的标准语音信号的重音个数Ssm和重音平均短时能量值Sse ; 将所述采集的语音信号里的重音个数Tsmm、标准语音信号的重音个数Ssnuffl、标准语音信号的重音平均短时能量值Sse和采集的语音信号的重音平均短时能量值Tse代入重音评分计算公式,得到重音分值Sstoss,所述重音评分计算公式如下:
^Stress- Q I X Sgtressl+ CO 2 X Sgtress2
8.如权利要求7所述的适应于移动设备的英语语句发音质量检测方法,其特征在于,所述步骤S4还包括: 利用节奏评分公式进行节奏评分,得到节奏分值Sffliythm,所述节奏评分公式如下:
9.如权利要求8所述的适应于移动设备的英语语句发音质量检测方法,其特征在于,所述步骤S4还包括: 利用自相关函数对所述经预处理的语音信号的语音数据帧S (i),i=0~n-1做自相关运算,得到所述经预处理的语音信号的每一语音数据帧的音高;所述经预处理的语音信号的每一语音数据帧的音高构成所述采集的语音信号的语调曲线; 调取与所述采集的语音信号相对应的标准语音信号的语调曲线,利用DTW算法计算所述采集的语音信号的语调曲线与所述标准语音信号的语调曲线的差异参数dist ; 将所述差异参数dist映射到[0,100]的分数范围内,得到语调指标的评分结果Slntonation,
映射公式如下:
10.如权利要求9所述的适应于移动设备的英语语句发音质量检测方法,其特征在于,所述步骤S5包括: 由所述内容分值、情感分值、语速分值、重音分值、节奏分值和语调分值得到所述采集的语音信号的最终分值ST()tal,所述最终分值ST()tal的计算公式为:
【文档编号】G10L25/03GK103617799SQ201310631850
【公开日】2014年3月5日 申请日期:2013年11月28日 优先权日:2013年11月28日
【发明者】李心广, 李苏梅, 沈东雄, 江立锐, 皮景曦, 林雅婷, 何智明, 陈泽群, 林帆, 张胜斌 申请人:广东外语外贸大学, 李心广
一种适应于移动设备的英语语句发音质量检测方法
相关推荐
声学处理单元的制作方法【专利摘要】本发明的具体实施例包括用于声学建模的设备、方法以及系统。本设备可包括聚类状态(senone)计分单元(SSu)控制模块、距离计算器以及加法模块。可将SSu控制模块配置成用来接收特征向量。可将距离计算器配置成
专利名称:摄像装置的制作方法技术领域:本发明涉及一种可转换高宽比(aspect ratio)的结构紧凑小巧的摄像装置(imaging apparatus)。背景技术: 在常规的摄像系统中,例如,在日本专利特开平No.6-82691中,一种用
专利名称:聚合物光波导路薄膜的制作方法技术领域:本发明是关于使用含氟的聚酰亚胺系树脂的聚合物光波导路薄膜及其制造方法。背景技术: 伴随近年来的计算机和互联网的普及,信息传输需要正在急剧增大。因此,希望将传输速度迅速的光传输普及至计算机等的末
专利名称:图像形成装置及图像形成方法、曝光头的制作方法技术领域:本发明涉及一种抑制了画质劣化的曝光头以及应用了该曝光头的图 像形成装置、图像形成方法。背景技术:作为图像形成装置的曝光光源,众所周知的是设置使用了 LED的行 头的结构。在专利
专利名称:一种鼓沙带调整装置的制作方法技术领域:本实用新型涉及乐器领域,具体是一种小鼓尤其是军鼓的沙带调整装置。背景技术:鼓沙带调整装置作为一种用来拉紧并微调小鼓尤其是军鼓沙带的调整装置,对鼓的音质起着很重要的作用。目前市场上有各种各样的鼓
专利名称:图像形成装置的制作方法技术领域:本发明涉及采用电子照相方式或静电记录方式的图像形成装置,尤其涉及复印机、打印机、传真机等的图像形成装置。作为解决该问题的对策,过去已有多种提案。例如,在日本特开平2-215891中公开了一种电子照相