语音信号的处理方法和装置、以及语音信号的分析系统的制作方法
【专利摘要】本发明公开了一种语音信号的处理方法和装置、以及语音信号的分析系统,其中,该处理装置包括:第一确定模块,用于对预定基频范围内多个候选基频中的每个候选基频,确定语音信号中该候选基频的多次谐波和,其中,在确定每个候选基频的谐波和时,第一确定模块根据该候选基频的一次谐波之外的其他谐波计算该候选基频的谐波和;第二确定模块,用于根据多个候选基频的多次谐波和,从多个候选基频中确定语音信号的实际基频。本发明在针对候选基频的确定谐波和进而确定基频时,避免考虑基频的一次谐波,从而能够有效消除噪声对基频确定结果的不良影响,有效提高无噪声和各种有噪声的情况下基频确定的准确性。
【专利说明】语音信号的处理方法和装置、以及语音信号的分析系统
【技术领域】
[0001]本发明涉及语音信号的处理,并且特别地,涉及一种语音信号的处理方法和装置、以及语音信号的分析系统。
【背景技术】
[0002]基频是人声的固有特征。它是在发声时,肺部的气流通过喉中的声门,引起声带的周期性振动,形成周期性的脉冲串进入声道,这个周期性脉冲的周期称为基音周期。基音周期的倒数就是基频。主要使用以下两种方法在语音信号处理中进行基频提取:
[0003](方法一)时域估计法:直接由语音波形来估计基音周期。时域估计法可以包括例如时域自相关法、中央削波自相关法。以下详述时域自相关法:通过计算信号自身的相关函数来计算信号的基音周期,而基音周期的倒数就是基频。
[0004]参见式(I):
【权利要求】
1.一种语音信号的处理装置,其特征在于,包括: 第一确定模块,用于对预定基频范围内多个候选基频中的每个候选基频,确定语音信号中该候选基频的多次谐波和,其中,在确定每个候选基频的谐波和时,所述第一确定模块根据该候选基频的一次谐波之外的其他谐波计算该候选基频的谐波和; 第二确定模块,用于根据所述多个候选基频的多次谐波和,从所述多个候选基频中确定所述语音信号的实际基频。
2.根据权利要求1所述的处理装置,其特征在于,在确定每个候选基频的谐波和时,所述第一确定模块用于根据数量小于或等于预定值的谐波确定该候选基频的谐波和。
3.根据权利要求1所述的处理装置,其特征在于,在确定每个候选基频的谐波和时,用于确定谐波和的谐波的最大频率小于或等于预定的频率门限值。
4.根据权利要求3所述的处理装置,其特征在于,所述频率门限值大于或等于所述基频范围的上限值的3倍。
5.根据权利要求1所述的处理装置,其特征在于,进一步包括: 第三确定模块,用于预先确定用于提取候选基频的分辨率; 基频提取模块,用于根据确定的所述分辨率从所述预定基频范围内提取所述多个基频,其中,所述分辨率满足以下条件:差值为所述分辨率的两个基频的谐波和不相等。
6.根据权利要求5所述的处理装置,其特征在于,所述第三确定模块用于: 根据带宽和频率门限值确定所述分辨率,其中,所述频率门限值为确定谐波和时所使用的多个谐波的频率上限值,所述带宽为所述语音信号的采样频率与快速傅里叶变换点值的比值。
7.根据权利要求1所述的处理装置,其特征在于,所述第二确定模块用于将所述多个候选基频中,谐波和最大的候选基频确定为所述实际基频。
8.根据权利要求1-7中任一项所述的处理装置,其特征在于,所述预定基频范围的下限值为50Hz至68Hz。
9.根据权利要求1-7中任一项所述的处理装置,其特征在于,所述预定基频范围的上限值为500Hz至902Hz。
10.一种语音信号的分析系统,其特征在于,包括: 语音采集设备,用于采集外界输入的语音信号; 第一确定模块,用于对预定基频范围内多个候选基频中的每个候选基频,确定所述语音信号中该候选基频的多次谐波和,其中,在确定每个候选基频的谐波和时,所述第一确定模块根据该候选基频的一次谐波之外的其他谐波计算该候选基频的谐波和; 第二确定模块,用于根据所述多个候选基频的多次谐波和,从所述多个候选基频中确定所述语音信号的实际基频; 分析模块,用于根据确定的所述实际基频对所述语音信号进行分析。
11.根据权利要求10所述的分析系统,其特征在于,在确定每个候选基频的谐波和时,所述第一确定模块用于根据数量小于或等于预定值的谐波确定该候选基频的谐波和。
12.根据权利要求10所述的分析系统,其特征在于,在确定每个候选基频的谐波和时,用于确定谐波和的谐波的最大频率小于或等于预定的频率门限值。
13.根据权利要求12所述的分析系统,其特征在于,所述频率门限值大于或等于所述基频范围的上限值的3倍。
14.一种语音信号的处理方法,其特征在于,包括: 对于预定基频范围内多个候选基频中的每个候选基频,确定语音信号中该候选基频的多次谐波和,其中,在确定每个候选基频的谐波和时,根据该候选基频的一次谐波之外的其他谐波计算该候选基频的谐波和; 根据所述多个候选基频的多次谐波和,从所述多个候选基频中确定所述语音信号的实际基频。
15.根据权利要求14所述的处理方法,其特征在于,在确定每个候选基频的谐波和时,根据数量小于或等于预定值的谐波确定该候选基频的谐波和。
16.根据权利要求14所述的处理方法,其特征在于,在确定每个候选基频的谐波和时,用于确定谐波和的谐波的最大频率小于或等于预定的频率门限值。
17.根据权利要求16所述的处理方法,其特征在于,所述频率门限值大于或等于所述基频范围的上限值的3倍。
18.根据权利要求14所述的处理方法,其特征在于,进一步包括: 预先确定用于提取候选基频的分辨率; 根据确定的所述分 辨率从所述预定基频范围内提取所述多个基频,其中,所述分辨率满足以下条件:差值为所述分辨率的两个基频的谐波和不相等。
19.根据权利要求18所述的处理方法,其特征在于,预先确定用于提取候选基频的分辨率包括: 根据带宽和频率门限值确定所述分辨率,其中,所述频率门限值为确定谐波和时所使用的多个谐波的频率上限值,所述带宽为所述语音信号的采样频率与快速傅里叶变换点值的比值。
20.根据权利要求14所述的处理方法,其特征在于,从所述多个候选基频中确定所述语音信号的实际基频包括: 将所述多个候选基频中,谐波和最大的候选基频确定为所述实际基频。
【文档编号】G10L21/0232GK104036785SQ201310072649
【公开日】2014年9月10日 申请日期:2013年3月7日 优先权日:2013年3月7日
【发明者】刘昆 申请人:索尼公司
语音信号的处理方法和装置、以及语音信号的分析系统的制作方法
相关推荐
专利名称:有色散的光纤和光纤装置的制作方法技术领域:本发明涉及光纤装置,其中该装置的总色散大于材料色散。 背景技木光纤可以引导有多个空间困形的光,每个空间困形被唯一地命名 为光纤的横模(以下为了简化,称它为模).光纤中光信号的色散特 性取决
专利名称:于薄膜晶体管液晶显示器制造过程中的蚀刻方法技术领域:本发明涉及一种薄膜晶体管液晶显示器制造过程,特别有涉及一种在薄膜晶体管液晶显示器制造过程中的蚀刻方法。背景技术: 液晶显示器(liquid crystal display,以下简
专利名称:固体摄像装置、其滤色器配置方法及图像记录装置的制作方法技术领域:本实施方式通常涉及固体摄像装置、其滤色器配置方法、以及图像记录装置。 背景技术:固体摄像装置作为进行图像输入处理的基本元件而在各种领域中被广泛使用。目前通常使用的固体
专利名称:液晶显示器的制作方法技术领域:本发明涉及液晶显示器,具体地说,涉及通过包含白色子像素而能 够在宽视角和窄视角之间进行切换的液晶显示器。背景技术:本申请要求2007年12月26日提交的韩国专利申请10-2007-0138031 的优
专利名称:一种t9led管灯架的制作方法技术领域:本实用新型涉及一种T9LED管灯架。背景技术:LED日光灯型材广泛应用于LED管灯照明领域,现有的LED日光灯架用型材在技术上存在以下缺陷:1、配光性:T8LED日光灯型材光源面与出光表面距
专利名称:一种熔接单元的制作方法技术领域:本实用新型涉及光纤通信领域,尤其涉及具有光纤熔接、光纤管理的ODN通信设备。背景技术:随着光纤接入业务的快速发展,光纤入户的需求也与日俱增,在此过程中对设备中光纤熔接单元的密度和熔接的可操作性也提出