语音信号的处理方法和装置、以及语音信号的分析系统的制作方法
【专利摘要】本发明公开了一种语音信号的处理方法和装置、以及语音信号的分析系统,其中,该处理装置包括:第一确定模块,用于对预定基频范围内多个候选基频中的每个候选基频,确定语音信号中该候选基频的多次谐波和,其中,在确定每个候选基频的谐波和时,第一确定模块根据该候选基频的一次谐波之外的其他谐波计算该候选基频的谐波和;第二确定模块,用于根据多个候选基频的多次谐波和,从多个候选基频中确定语音信号的实际基频。本发明在针对候选基频的确定谐波和进而确定基频时,避免考虑基频的一次谐波,从而能够有效消除噪声对基频确定结果的不良影响,有效提高无噪声和各种有噪声的情况下基频确定的准确性。
【专利说明】语音信号的处理方法和装置、以及语音信号的分析系统
【技术领域】
[0001]本发明涉及语音信号的处理,并且特别地,涉及一种语音信号的处理方法和装置、以及语音信号的分析系统。
【背景技术】
[0002]基频是人声的固有特征。它是在发声时,肺部的气流通过喉中的声门,引起声带的周期性振动,形成周期性的脉冲串进入声道,这个周期性脉冲的周期称为基音周期。基音周期的倒数就是基频。主要使用以下两种方法在语音信号处理中进行基频提取:
[0003](方法一)时域估计法:直接由语音波形来估计基音周期。时域估计法可以包括例如时域自相关法、中央削波自相关法。以下详述时域自相关法:通过计算信号自身的相关函数来计算信号的基音周期,而基音周期的倒数就是基频。
[0004]参见式(I):
【权利要求】
1.一种语音信号的处理装置,其特征在于,包括: 第一确定模块,用于对预定基频范围内多个候选基频中的每个候选基频,确定语音信号中该候选基频的多次谐波和,其中,在确定每个候选基频的谐波和时,所述第一确定模块根据该候选基频的一次谐波之外的其他谐波计算该候选基频的谐波和; 第二确定模块,用于根据所述多个候选基频的多次谐波和,从所述多个候选基频中确定所述语音信号的实际基频。
2.根据权利要求1所述的处理装置,其特征在于,在确定每个候选基频的谐波和时,所述第一确定模块用于根据数量小于或等于预定值的谐波确定该候选基频的谐波和。
3.根据权利要求1所述的处理装置,其特征在于,在确定每个候选基频的谐波和时,用于确定谐波和的谐波的最大频率小于或等于预定的频率门限值。
4.根据权利要求3所述的处理装置,其特征在于,所述频率门限值大于或等于所述基频范围的上限值的3倍。
5.根据权利要求1所述的处理装置,其特征在于,进一步包括: 第三确定模块,用于预先确定用于提取候选基频的分辨率; 基频提取模块,用于根据确定的所述分辨率从所述预定基频范围内提取所述多个基频,其中,所述分辨率满足以下条件:差值为所述分辨率的两个基频的谐波和不相等。
6.根据权利要求5所述的处理装置,其特征在于,所述第三确定模块用于: 根据带宽和频率门限值确定所述分辨率,其中,所述频率门限值为确定谐波和时所使用的多个谐波的频率上限值,所述带宽为所述语音信号的采样频率与快速傅里叶变换点值的比值。
7.根据权利要求1所述的处理装置,其特征在于,所述第二确定模块用于将所述多个候选基频中,谐波和最大的候选基频确定为所述实际基频。
8.根据权利要求1-7中任一项所述的处理装置,其特征在于,所述预定基频范围的下限值为50Hz至68Hz。
9.根据权利要求1-7中任一项所述的处理装置,其特征在于,所述预定基频范围的上限值为500Hz至902Hz。
10.一种语音信号的分析系统,其特征在于,包括: 语音采集设备,用于采集外界输入的语音信号; 第一确定模块,用于对预定基频范围内多个候选基频中的每个候选基频,确定所述语音信号中该候选基频的多次谐波和,其中,在确定每个候选基频的谐波和时,所述第一确定模块根据该候选基频的一次谐波之外的其他谐波计算该候选基频的谐波和; 第二确定模块,用于根据所述多个候选基频的多次谐波和,从所述多个候选基频中确定所述语音信号的实际基频; 分析模块,用于根据确定的所述实际基频对所述语音信号进行分析。
11.根据权利要求10所述的分析系统,其特征在于,在确定每个候选基频的谐波和时,所述第一确定模块用于根据数量小于或等于预定值的谐波确定该候选基频的谐波和。
12.根据权利要求10所述的分析系统,其特征在于,在确定每个候选基频的谐波和时,用于确定谐波和的谐波的最大频率小于或等于预定的频率门限值。
13.根据权利要求12所述的分析系统,其特征在于,所述频率门限值大于或等于所述基频范围的上限值的3倍。
14.一种语音信号的处理方法,其特征在于,包括: 对于预定基频范围内多个候选基频中的每个候选基频,确定语音信号中该候选基频的多次谐波和,其中,在确定每个候选基频的谐波和时,根据该候选基频的一次谐波之外的其他谐波计算该候选基频的谐波和; 根据所述多个候选基频的多次谐波和,从所述多个候选基频中确定所述语音信号的实际基频。
15.根据权利要求14所述的处理方法,其特征在于,在确定每个候选基频的谐波和时,根据数量小于或等于预定值的谐波确定该候选基频的谐波和。
16.根据权利要求14所述的处理方法,其特征在于,在确定每个候选基频的谐波和时,用于确定谐波和的谐波的最大频率小于或等于预定的频率门限值。
17.根据权利要求16所述的处理方法,其特征在于,所述频率门限值大于或等于所述基频范围的上限值的3倍。
18.根据权利要求14所述的处理方法,其特征在于,进一步包括: 预先确定用于提取候选基频的分辨率; 根据确定的所述分 辨率从所述预定基频范围内提取所述多个基频,其中,所述分辨率满足以下条件:差值为所述分辨率的两个基频的谐波和不相等。
19.根据权利要求18所述的处理方法,其特征在于,预先确定用于提取候选基频的分辨率包括: 根据带宽和频率门限值确定所述分辨率,其中,所述频率门限值为确定谐波和时所使用的多个谐波的频率上限值,所述带宽为所述语音信号的采样频率与快速傅里叶变换点值的比值。
20.根据权利要求14所述的处理方法,其特征在于,从所述多个候选基频中确定所述语音信号的实际基频包括: 将所述多个候选基频中,谐波和最大的候选基频确定为所述实际基频。
【文档编号】G10L21/0232GK104036785SQ201310072649
【公开日】2014年9月10日 申请日期:2013年3月7日 优先权日:2013年3月7日
【发明者】刘昆 申请人:索尼公司
语音信号的处理方法和装置、以及语音信号的分析系统的制作方法
相关推荐
专利名称:一种便携式组合乐器的制作方法技术领域:本实用新型涉及一种组合乐器,特别是便携式组合乐器。技术背景现有的组合乐器,大多是将几种常用乐器装入箱内,使用时将其摆放在箱 的面板上使用。这种方式使乐器位置不易固定,需要几个人共同操作,造成使
专利名称:收折式内置灯光的摄影棚的制作方法技术领域:本实用新型涉及摄影器材领域,具体指的是一种拆装携带方便的收折式摄 影棚。背景技术:内置灯光摄影棚因其内部安装有光源,能很好的解决摄影环节中的光源问题,是一种光源利用率很高的辅助摄影装置。本
声学处理单元的制作方法【专利摘要】本发明的具体实施例包括用于声学建模的设备、方法以及系统。本设备可包括聚类状态(senone)计分单元(SSu)控制模块、距离计算器以及加法模块。可将SSu控制模块配置成用来接收特征向量。可将距离计算器配置成
专利名称:带清洁功能的眼镜的制作方法技术领域:本发明涉及新型功能实现的眼镜,尤其是能够完成实现镜脚附带眼镜液及眼镜布的新型功能。背景技术:目前,当代人的眼镜主要由镜架、镜框和眼镜片三部分组成,但是这些种类的眼镜只有一种单一的功能,帮助学生矫
专利名称:一种采用led光源的带滚花散热器的g4灯的制作方法技术领域:本实用新型涉及一种LED灯。背景技术:目前,低压光源产品G4灯主要以卤素灯为主。卤素灯是采用灯丝通电发光,灯丝在长时间高温下易发生熔断,故障率偏高,光效低,能耗大。由LE
专利名称:使用自适应混合变换的多声道音频编码比特流的解码的制作方法技术领域:本发明通常涉及音频编码系统,且更具体来说涉及对已编码的数字音频信号进行解码的方法和装置。背景技术:由团体合作联合委员会(JCIC)的成员组织成立的美国先进电视系统委