一种适应于移动设备的英语语句发音质量检测方法-品牌商务网

一种适应于移动设备的英语语句发音质量检测方法
【专利摘要】本发明公开了一种适应于移动设备的英语语句发音质量检测方法，该方法包括以下步骤：对用户发出的语句进行采集；对采集的语音信号进行预处理；对经预处理的语音信号进行语音特征参数提取，得到采集的语音信号的语音特征参数；利用语音特征参数对采集的语音信号与标准语音信号进行比较，进行内容、情感、语速、重音、节奏和语调评分；根据内容分值、情感分值、语速分值、重音分值、节奏分值和语调分值中至少一项得到采集的语音信号的最终分值；根据最终分值评判采集的语音信号是否发音准确。本发明可以提高语句发音检测的准确性，解决用户只能在PC端使用语句发音检测系统的问题。
【专利说明】一种适应于移动设备的英语语句发音质量检测方法
【技术领域】
[0001]本发明涉及语音信号处理【技术领域】，尤其涉及一种适应于移动设备的英语语句发音质量检测方法。
【背景技术】
[0002]信号处理技术在语言学习中的应用是信息技术与语言学习整合的一个重要内容，其目标是将最新的语音技术与当前的教学和学习方法结合，建立计算机辅助语言学习系统。
[0003]语音客观评价方法最早可以追溯到二十世纪四十年代末，由N.R.French和J.C.Steinberg 于 1947 年提出的清晰度指数 Al (Articulationhidex)方法。T.P.Barnwell和S.R.Quackenbus对八十年代中期以前的语音质量客观评价研究工作作了系统总结，于1988年出版了介绍一本语音质量客观评价的著作。
[0004]进入九十年代后，语音质量客观评价方法研究取得了飞跃的发展，S.Wang于1992年提出的巴克谱失真BSD (Bark Spectral Distortion)方法对以后的影响较大，BSD方法是以人的听觉能力和听觉心理特点为基础构造出一种听觉转换模型。
[0005]我国语音识别研究工作起步于20世纪50年代，中科院声学所开始进行语音识别研究。中国语音识别的真正的开端应该是1978年，中科院声学所实现的采用带通滤波器组参数为特征的语音识别系统RTSRS(Ol)的产生。20世纪80年代，针对汉语单音节的特点，清华大学、中国科学院、北方交通大学、东南大学等开发了汉语特定人孤立字全音节语音识别系统。
[0006]当前语句发音准确度检测的相关技术，大多是考察语速和重音两个指标。在语速上，采用判断句子读取时间来衡量句子的语速，在重音上，采用语音的短时能量作为重音的判断标准。发音检测最后得分的计算方法则是将语速和重音两个指标的分值进行简单结合，准确度差。此外，现有检测方法大多局限于在PC机上使用，限定了用户只能在PC机旁进行语句发音检测，灵活性小，方便性差。

【发明内容】

[0007]本发明实施例所要解决的技术问题是，提出一种适应于移动设备的英语语句发音质量检测方法，提高语句发音检测的准确性，解决用户只能在PC端使用语句发音检测系统的问题。
[0008]为解决上述技术问题，本发明实施例提出一种适应于移动设备的英语语句发音质量检测方法，包括以下步骤:
[0009]S1.对用户发出的语句进行采集，获得语音信号；
[0010]S2.对所述采集的语音信号进行预处理，得到经预处理的语音信号；
[0011]S3.对所述经预处理的语音信号进行语音特征参数提取，得到所述采集的语音信号的语音特征参数，并将所述语音特征参数存储于数据存储器中；[0012]S4.利用所述语音特征参数对所述采集的语音信号与标准语音信号进行比较，进行内容、情感、语速、重音、节奏和语调评分，得到所述采集的语音信号的内容分值、情感分值、语速分值、重音分值、节奏分值和语调分值中的至少一项；
[0013]S5.根据所述内容分值、情感分值、语速分值、重音分值、节奏分值和语调分值中至少一项得到所述采集的语音信号的最终分值；根据所述最终分值判断所述采集的语音信号是否发音准确。
[0014]进一步的，所述步骤S2包括:
[0015]对所述采集的语音信号进行预加重处理、分帧处理、加窗函数和端点检测，得到经预处理的语音信号；
[0016]具体的，所述预加重处理为，用高频提升预加重数字滤波器处理所述采集的语音信号，按照6dB/oct的规格对所述采集的语音信号的高频部分进行提升；
[0017]所述分巾贞处理米用半巾贞交叠分巾贞的方式进行分巾贞处理；
[0018]所述加窗函数采用汉明窗；
[0019]所述端点检测采用双门限比较法，以短时能量E和短时平均过零率Z作为判断语音起始点的特征。
[0020]进一步的，所述步骤S3包括:
[0021]提取所述经预处理的语音信号的语音特征参数，得到所述采集的语音信号的语音时长参数、语音能量参数Tse和Mel倒谱系数，并将所述采集的语音信号的语音时长参数、语音能量参数Tse和Mel倒谱系数存储于数据存储器中。
[0022]进一步的，所述步骤S4包括:
[0023]调取所述采集的语音信号的Mel倒谱系数，并利用分段聚类算法进行处理，得到经分段聚类的内容特征参数；
[0024]调取与所述采集的语音信号相对应的标准语音信号的概率神经网络语音模型，并将所述经分段聚类的内容特征参数输入所述标准语音信号的概率神经网络语音模型中，得到所述采集的语音信号的内容分类结果；
[0025]计算所述采集的语音信号的Mel倒谱系数和与所述采集的语音信号相对应的标准语音信号的Mel倒谱系数之间的相关系数；
[0026]根据所述内容分类结果和所述相关系数，对所述采集的语音信号的内容进行评分，得到内容分值。
[0027]进一步的，所述步骤S4还包括:
[0028]调取所述采集的语音信号的Mel倒谱系数和语音能量参数，并利用分段聚类算法进行处理，得到经分段聚类的情感特征参数；
[0029]调取与所述采集的语音信号相对应的标准语音信号的概率神经网络语音模型，并将所述经分段聚类的情感特征参数输入所述标准语音信号的概率神经网络语音模型中，得到所述采集的语音信号的情感分类结果；
[0030]计算所述采集的语音信号的Mel倒谱系数和与所述采集的语音信号相对应的标准语音信号的Mel倒谱系数之间的相关系数；
[0031]根据所述情感分类结果和所述相关系数，对所述采集的语音信号的情感进行评分，得到情感分值。[0032]进一步的，所述步骤S4还包括:
[0033]调取与所述采集的语音信号相对应的标准语音信号的语音时长参数，将所述标准语音信号的语音时长参数和所述采集的语音信号的语音时长参数代入英语句子发音的相对语速计算公式，计算相对语速Vwtiss，所述计算公式如下:
[0034]
【权利要求】
1.一种适应于移动设备的英语语句发音质量检测方法，其特征在于，包括: 51.对用户发出的语句进行采集，获得语音信号； 52.对所述采集的语音信号进行预处理，得到经预处理的语音信号； 53.对所述经预处理的语音信号进行语音特征参数提取，得到所述采集的语音信号的语音特征参数，并将所述语音特征参数存储于数据存储器中； 54.利用所述语音特征参数对所述采集的语音信号与标准语音信号进行比较，进行内容、情感、语速、重音、节奏和语调评分，得到所述采集的语音信号的内容分值、情感分值、语速分值、重音分值、节奏分值和语调分值中的至少一项； 55.根据所述内容分值、情感分值、语速分值、重音分值、节奏分值和语调分值中至少一项得到所述采集的语音信号的最终分值；根据所述最终分值判断所述采集的语音信号是否发音准确。
2.如权利要求1所述的适应于移动设备的英语语句发音质量检测方法，其特征在于，所述步骤S2包括: 对所述采集的语音信号进行预加重处理、分帧处理、加窗函数和端点检测，得到经预处理的语音信号；其中，所述预加重处理具体为，用高频提升预加重数字滤波器处理所述采集的语音信号，按照6dB/oct的规格对所述采集的语音信号的高频部分进行提升；所述分帧处理采用半帧交叠分帧的方式进行分帧处理；所述加窗函数采用汉明窗；` 所述端点检测采用双门限比较法，以短时能量E和短时平均过零率Z作为判断语音起始点的特征。
3.如权利要求2所述的适应于移动设备的英语语句发音质量检测方法，其特征在于，所述步骤S3包括: 提取所述经预处理的语音信号的语音特征参数，得到所述采集的语音信号的语音时长参数、语音能量参数Tse和Mel倒谱系数，并将所述采集的语音信号的语音时长参数、语音能量参数Tse和Mel倒谱系数存储于数据存储器中。
4.如权利要求3所述的适应于移动设备的英语语句发音质量检测方法，其特征在于，所述步骤S4包括: 调取所述采集的语音信号的Mel倒谱系数，并利用分段聚类算法进行处理，得到经分段聚类的内容特征参数；调取与所述采集的语音信号相对应的标准语音信号的概率神经网络语音模型，并将所述经分段聚类的内容特征参数输入所述标准语音信号的概率神经网络语音模型中，得到所述采集的语音信号的内容分类结果；计算所述采集的语音信号的Mel倒谱系数和与所述采集的语音信号相对应的标准语音信号的Mel倒谱系数之间的相关系数；根据所述内容分类结果和所述相关系数，对所述采集的语音信号的内容进行评分，得到内容分值。
5.如权利要求4所述的适应于移动设备的英语语句发音质量检测方法，其特征在于，所述步骤S4还包括:调取所述采集的语音信号的Mel倒谱系数和语音能量参数，并利用分段聚类算法进行处理，得到经分段聚类的情感特征参数；调取与所述采集的语音信号相对应的标准语音信号的概率神经网络语音模型，并将所述经分段聚类的情感特征参数输入所述标准语音信号的概率神经网络语音模型中，得到所述采集的语音信号的情感分类结果；计算所述采集的语音信号的Mel倒谱系数和与所述采集的语音信号相对应的标准语音信号的Mel倒谱系数之间的相关系数；根据所述情感分类结果和所述相关系数，对所述采集的语音信号的情感进行评分，得到情感分值。
6.如权利要求5所述的适应于移动设备的英语语句发音质量检测方法，其特征在于，所述步骤S4还包括: 调取与所述采集的语音信号相对应的标准语音信号的语音时长参数，将所述标准语音信号的语音时长参数和所述采集的语音信号的语音时长参数代入英语句子发音的相对语速计算公式，计算相对语速Vwtiss,所述计算公式如下:
7.如权利要求6所述的适应于移动设备的英语语句发音质量检测方法，其特征在于，所述步骤S4还包括: 调取与所述采集的语音信号相对应的标准语音信号的语音时长参数，将所述采集的语音信号的语音时长按比例调整为所述标准语音信号的语音时长参数；调取所述采集的语音信号的语音能量参数Tse，根据所述采集的语音信号的语音能量参数Tse值，逐个搜索所述采集的语音信号中语音能量大于重音阀值Tu的最大语音信号值Sfflax;在小于所述最大语音信号值Smax的语音能量参数值范围内，由大到小逐个搜索等于非重音阀值1\的语音信号值S1 ;在大于所述最大语音信号值Smax的语音能量参数值范围内，由小到大逐个搜索等于非重音阀值T1的语音信号值& ;将S1与&设置为所述采集的语音信号的重音信号，并将S1与&之间的信号量值置0，计算S1与&之间的语音时长；若所述S1与&之间的语音时长大于重读元音时长，则S1与&之间的语音部分即为重音音节，其中，重读元音时长等于100ms,记录所述重音音节的长度；统计所述采集的语音信号里的重音个数Tsmm，调取与所述采集的语音信号相对应的标准语音信号的重音个数Ssm和重音平均短时能量值Sse ；将所述采集的语音信号里的重音个数Tsmm、标准语音信号的重音个数Ssnuffl、标准语音信号的重音平均短时能量值Sse和采集的语音信号的重音平均短时能量值Tse代入重音评分计算公式，得到重音分值Sstoss，所述重音评分计算公式如下:
^Stress- Q I X Sgtressl+ CO 2 X Sgtress2
8.如权利要求7所述的适应于移动设备的英语语句发音质量检测方法，其特征在于，所述步骤S4还包括: 利用节奏评分公式进行节奏评分，得到节奏分值Sffliythm，所述节奏评分公式如下:
9.如权利要求8所述的适应于移动设备的英语语句发音质量检测方法，其特征在于，所述步骤S4还包括: 利用自相关函数对所述经预处理的语音信号的语音数据帧S (i)，i=0~n-1做自相关运算，得到所述经预处理的语音信号的每一语音数据帧的音高；所述经预处理的语音信号的每一语音数据帧的音高构成所述采集的语音信号的语调曲线；调取与所述采集的语音信号相对应的标准语音信号的语调曲线，利用DTW算法计算所述采集的语音信号的语调曲线与所述标准语音信号的语调曲线的差异参数dist ；将所述差异参数dist映射到[0，100]的分数范围内，得到语调指标的评分结果Slntonation，
映射公式如下:
10.如权利要求9所述的适应于移动设备的英语语句发音质量检测方法，其特征在于，所述步骤S5包括: 由所述内容分值、情感分值、语速分值、重音分值、节奏分值和语调分值得到所述采集的语音信号的最终分值ST()tal，所述最终分值ST()tal的计算公式为:
【文档编号】G10L25/03GK103617799SQ201310631850
【公开日】2014年3月5日申请日期:2013年11月28日优先权日:2013年11月28日
【发明者】李心广, 李苏梅, 沈东雄, 江立锐, 皮景曦, 林雅婷, 何智明, 陈泽群, 林帆, 张胜斌申请人:广东外语外贸大学, 李心广

本文推荐一种适应于移动设备的英语语句发音质量检测方法仅代表作者观点，不代表本网站立场。本站对作者上传的所有内容将尽可能审核来源及出处，但对内容不作任何保证或承诺。请读者仅作参考并自行核实其真实性及合法性。如您发现图文视频内容来源标注有误或侵犯了您的权益请告知，本站将及时予以修改或删除。未经允许不得转载：http://www.pinpai35.com/1656307833.html

当前位置：网站首页>专利 >正文

一种适应于移动设备的英语语句发音质量检测方法

相关推荐