专利名称:一种由时频原子聚合生成时频分子的方法
技术领域:
本发明涉及自适应信号的时频表示,尤其是一种由时频原子聚合生成时频分子的
方法。
背景技术:
信号的稀疏分解是用尽可能少的几个基本信号来逼近该信号,且这些基本信号能 够刻画该信号的结构化特征。相对于传统的正交基信号分解,使用与待分析信号局部时频 结构相关的时频原子来表示信号的过程,称为信号的时频原子分解方法,并用这些时频原 子的时频分布来逼近原始信号的时频能量分布,而时频原子的集合称为时频原子字典。
时频原子是将各种算子作用于基本函数得到,这些算子用来匹配非平稳信号的局 部时频特性,如时移算子和频移算子确定时间和频率的局部区域;比例算子使基函数与信 号的时间支撑区和频率支撑区匹配;频率切变算子分析信号中频率随时间变化特性;时间 切变算子则是对不同频率的信号成分产生不同的时间延迟。作用于基本函数的算子越多, 时频原子能够匹配或逼近的信号局部时频结构的能力越强,但同时也使时频原子的参数增 多,从而使寻找最佳时频原子就越困难。目前主要有Gabor时频原子和Chirp时频原子。 Gabor时频原子是对单位高斯函数进行比例、时移、频移得到的,因其频率不变,使用多个 Gabor原子才能逼近一个频率变化成分,因而这种分解结果不是稀疏的,更无法反映信号固 有的真实结构。对单位高斯函数进行比例、旋转、时移和频移得到四参数表示的Chirp时频 原子,它在时频平面是不同斜率的直线,用Chirp原子分解信号相当于对时频平面任意能 量曲线用线段逼近,提高了逼近的稀疏性。 相对于正交基而言,时频原子的数量比基函数数量多得多,即时频原子相互间是 极其冗余的,时频原子字典是过完备的。在数学上,用过完备集合表示一个函数的最优逼近 被定义是一个无解的难题,理论上只能得到一个次优化的逼近解。匹配追踪算法通过寻找 信号局部与时频原子的最大内积来选择N个最优时频原子来逼近信号,它是一种局部优化 的贪婪迭代算法。由于时频原子的冗余性和时频原子参数的高维性,匹配追踪算法采用遍 历式耗尽搜索最佳时频原子,计算量大导致速度慢,且搜索过程的局部贪婪性还易引起过 匹配现象,即当信号中几种时频成分混在一起时,由于匹配追踪算法不是从总体上求解优 化问题,而是通过迭代逐次提炼出信号的近似部分,使贪婪算法在每一步分解中都必须选 择出与信号局部最相关的时频原子,造成虚假的或贪婪的时频原子被选出来,这样抽取的 时频原子特征并不与信号的固有结构相对应;用这些时频原子来表示信号既不是稀疏的, 也失去了表征和解释信号物理意义的能力,这样的信号时频原子分解显然不适合信号特征 提取和信号稀疏逼近等后续分析与处理目的。 信号的特征存在于不同粒度的描述,从信号稀疏逼近、特征提取、压縮编码等角度 看,粒度大小应与信号固有的最大结构一致为宜。现在的时频原子分解方法造成以上弊端 的根本原因在于,其一,使用过小的粒度描述而没有考虑和有效利用时频原子之间的内在 联系;其二,耗尽式搜索过程没有利用预先得知的信号固有的结构化信息。
发明内容
本发明的目的是克服现有技术中存在的不足,提供一种由时频原子聚合生成时频 分子的方法,提出在自适应信号时频表示过程中,使用时频分子作为最小分析单元代替现 在普遍使用的时频原子。
按照本发明提供的技术方案,所述由时频原子聚合生成时频分子的方法包括 (1)将语音波形分成浊音帧和清音帧; (2)提取浊音帧和清音帧固有的结构化时频信息; (3)使用预估计的匹配追踪算法对清音帧进行三参数Chirp时频原子分解;
(4)利用Hilbert-Huang变换对浊音帧进行固有模态分解,以基因频率为已知参 数对浊音帧进行正弦原子分解; (5)计算时频原子的相似度,分别由正弦时频原子、Chirp时频原子聚合生成正弦 时频分子、Chirp时频分子,得到清音帧和浊音帧的结构化时频特征。 所述三参数Chirp时频原子分解用三个参数表示Chirp时频原子,方法是利用分 数阶傅立叶变换定义一个旋转算子,使信号旋转到分数阶域;令旋转后的信号沿旋转的方 向径向移动,得到旋转_径向移位复合算子;将比例算子、旋转_径向移位复合算子作用于 单位高斯函数,得到用比例参数、旋转参数、径向移位参数三个参数表示的Chrip原子。
所述三参数Chirp时频原子分解搜索最佳三参数Chirp时频原子的方法是先估 计最佳时频原子的旋转方位,并假定在大比例参数下,三参数最佳Chirp原子的搜索就变 成了径向移位一个参数的搜索,将多维搜索逐步分解成一维参数的搜索。
所述对浊音帧进行正弦原子分解的方法是首先,利用经验模态分解方法对浊音
段语音信号进行经验模态分解,得到一簇固有模态函数;然后,求取各个固有模态函数的瞬 时频率和瞬时幅度和瞬时频率加权能量函数并对其求导数,由于在声门脉冲发生时刻,瞬
时能量一定增加而其瞬时能量的导数大于某个正数,对瞬时能量函数的导数已经过阈值处 理后,其局部极大值发生的时刻即被认为是声门脉冲发生的时刻;最后,计算局部极大值的 时间间隔得到基音周期和基音频率。 所述由正弦时频原子、Chirp时频原子聚合生成正弦时频分子、Chirp时频分子, 即由一簇时频原子聚合生成时频分子采用聚类算法。 本发明的优点是在自适应信号时频表示过程中,使用时频分子作为最小分析单 元,通过时频分子分解信号可获得信号的稀疏表示和结构化特征信息,而这些结构化信息 对于信号特征抽取、信号压縮、模式识别等后续分析处理是重要的。
图1是将语音信号进行时频原子分解并由时频原子聚合生成时频分子方法的流 程图。
具体实施例方式
语音信号由谐波成分和瞬变成分构成已成共识。语音信号在时频平面的分布泄漏 出语音信号固有的时频结构信息,即语音中的谐波成分在时频平面呈现一簇水平平行的线
4段,而瞬变成分则体现一簇倾斜平行的线段。现有的基于时频原子分析方法,必须使用一组 相互关联的时频原子才能表示一个完整的谐波成分或者瞬变成分。借用"物质组成中分子 由原子组成、而分子是保持物质性质不变的最小单位"这一概念,我将这一簇时频原子称为 时频分子。本发明使用时频分子作为最小的分析单元来表示信号固有的时频结构化信息, 即对语音信号中的谐波成分使用正弦时频分子、对瞬变成分使用Chirp时频分子分别作为 基本构建块进行分析,以得到信号的稀疏表示和提取信号的结构化特征。
为了同时扑捉语音信号中的宏结构成分和微结构成分,首先使用正弦时频原子分 解语音中的谐波成分;使用Chirp时频原子逼近语音中瞬变成分。然后研究得到的正弦时 频原子、Chirp时频原子的参数分布特点,通过定义原子之间的相似度距离函数,采用聚类 算法将一系列相关的时频原子聚合生成一个的时频分子。对于参数相同或相近的时频原子 进行聚类分析,聚合过程的依据是不同语音段在时频平面呈现的固有时频结构,即对于谐 波成分使用一个正弦时频分子代替一簇正弦时频原子,对于瞬变成分使用一个Chirp时频 分子代替一簇Chirp时频原子。把在时频平面上性质相同参数相近的一簇时频原子用一个 时频分子来描述,用不同的粒度分析信号,既能扑捉信号中的微结构又能刻画信号中的宏 成分;由一簇时频原子聚合生成一个时频分子,不仅可以减少时频原子的数量,而时频分子 的结构化参数反映了信号产生的机理,它与信号的物理意义解释相对应。
本发明在使用Chirp时频原子分解语音中的瞬变成分过程中,使用尽可能少的 参数表示的Chirp时频原子,并通过预先估计Chirp时频原子参数来代替对每个参数的 耗尽式搜索,以降低搜索最佳Chirp原子的计算复杂性,縮短搜索时间。用三个参数表示 Chirp时频原子的方法是利用分数阶傅立叶变换定义一个旋转算子,使信号旋转到分数 阶域;令旋转后的信号沿旋转的方向径向移动,得到旋转-径向移位复合算子;将比例算 子、旋转_径向移位复合算子作用于单位高斯函数,得到用比例参数、旋转参数、径向移位 参数三个参数表示的Chrip原子。搜索最佳三参数Chirp时频原子的方法是先估计最佳 时频原子的旋转方位,并假定在大比例参数下,三参数最佳Chirp原子的搜索就变成了径 向移位一个参数的搜索,将多维搜索逐步分解成一维参数的搜索。具体实现方法是首先, 利用Chirp信号的分数阶傅立叶变换在其调频斜率处呈现冲激函数这一特征,先估计最佳 Chirp原子的线性调频斜率,即它在时频平面最可能的旋转方位;因为高斯函数形状由比 例参数控制,比例参数越大,高斯函数在时频平面就越细越长,高斯函数也就越逼近Chirp 函数。然后,取一个大比例参数,使Chirp原子只沿着最佳旋转方位径向移动来调整其时频 中心,使其与被分析信号达到最大程度地相关。最后,在最佳旋转角度和径向移位参数不变 的情况下,进一步优化比例参数,即局部调整最佳Chirp原子的时频宽度,来得到最佳三参 数Chirp原子。 本发明在在使用正弦时频原子分解语音中的谐波成分过程中,使用 Hilbert-Huang变换预先得到基因频率后,再搜索正弦时频原子的其他参数。语音中的谐波 成分是当发浊音时形成的,气流通过声门使声带振动而产生准周期激励脉冲串,这些脉冲 串的周期就是基音周期,其倒数就是基音频率。Hilbert-Huang变换的经验模态分解具有 自适应带通滤波特性,由它分解出来的固有模态函数是均值为零的窄带调频-调幅信号, 这与语音信号的调幅调频模型相吻合,当语音信号经过经验模态分解后,它的基因和共振 峰分布在某些固有模态函数里。具体实现方法是首先,利用经验模态分解方法对浊音段语音信号进行经验模态分解,得到一簇固有模态函数;然后,求取各个固有模态函数的瞬时 频率和瞬时幅度和瞬时频率加权能量函数并对其求导数,由于在声门脉冲发生时刻,瞬时
能量一定增加而其瞬时能量的导数大于某个正数,对瞬时能量函数的导数以经过阈值处理 后,其局部极大值发生的时刻就被认为是声门脉冲发生的时刻。最后,计算局部极大值的时 间间隔就可得到基音周期和基音频率。 由于聚类的目的是发现样本点之间最本质的抱团性质的一种客观反映,本发明由 一簇时频原子聚合生成时频分子就是采用聚类算法。聚类算法由特征选择、相似性度量、聚 类算法、结果验证和判断组成。聚类分析以相似性为基础,同一聚类中的对象相似度较高, 而不同聚类中的对象相似度较小在一个聚类中的模式之间比不在同一聚类中的模式之间 具有更多的相似性。通过定义原子与原子之间的一致性度量函数,将性质相同参数相近的 一簇原子聚合成为分子。本发明采用K-means聚类算法,具体实现方法和过程是先指定 聚合生成的时频分子数目,即聚类数目K作为迭代次数或收敛条件,并指定K个初始聚类中 心,根据一定的相似性度量准则,将每一个时频原子分配到最近或"相似"的聚类中心形成 类,然后以每一类的平均矢量作为这一类的聚类中心,重新分配,反复迭代直到类收敛或达 到最大的迭代次数,即生成一个时频分子。K-means聚类算法对初始聚类中心依赖性比较 大,随机选取初始聚类中心可能使得初始聚类中心得到的分类严重偏离全局最优分类,这 样使算法陷入局部最优值,这时要经过多次聚类才有可能达到较满意的结果。本发明使用 预先估计得到的正弦时频原子的频率、Chirp时频原子的旋转参数作为初始化K-means聚 类中心,此方法有效地排除了随机初始化过程中引入的随机性因素,而且,这种初始化方式 也能够利用数据中的类结构信息,使得聚类质量相对于随机初始化时的平均质量有显著的 提高。 如图1所示,下面给出生成时频分子的具体方法
步骤一 将语音波形分成浊音帧和清音帧。 因为清音和浊音的发声机理不同,其呈现的信号形式不同,浊音由于音源的准周 期性和声道的共振而明显呈现准周期性,并且携带声调信息,而清音呈现类似噪声特性的 瞬态特点,对这两类特征不同的信号使用不同的时频原子和进行分解。
步骤二 提取浊音帧和清音帧固有的结构化时频信息。 利用现有魏格纳-威利分布、长窗谱图、短窗谱图等时频分布对浊音帧和清音帧 进行时频分析,观察浊音帧和清音帧在时频平面上呈现的结构时频特征。从直观上来验证 清音帧在时频平面上呈现一簇倾斜平行、而浊音帧在时频平面上呈现一簇水平平行的固有 时频结构。 步骤三使用预估计的匹配追踪算法对清音帧进行三参数Chirp时频原子分解。 具体步骤 步骤l :预先估计三参数Chirp原子的最佳旋转参数以适当的步长对信号作连续 分数阶傅立叶变换,在适当的阈值下搜索局部最大值,若最大值存在,则将对应的分数阶傅 立叶变换的阶数转换成相对应的角度,送入最佳Chirp原子的旋转参数集合中,直至分数 阶傅立叶变换的角度的变化范围为, n],得到最佳旋转参数集合为{^,i = 1,2,… M}。
步骤2 :搜索三参数Chirp原子的最佳径向移位参数对于由步骤l得到的每一个
6小i,先选择一个较大的固定的比例值a ,以便得到较细长的Chirp原子,搜索最佳径向移位 参数。在搜索过程中,采用模拟变焦距过程,径向移动参数P的步长可从大到小改变,使原
子与信号的相关函数最大,直到g。"^argm^及"雄),g,)不再增大为止,从而确定最佳
径向移位参数,即确定最佳Chirp原子的时频中心,同时得到最佳时移和频移参数。
步骤3 :局部优化三参数Chirp原子的最佳比例参数对由步骤1、2确定的每一组
旋转参数和径向位移参数,局部地改变比例参数a的值,使g^^argi^xl〈i ";c(0,gp(0〉l不
再增大为止。过程类似于小波变换,比例参数可以采用a' =2—ka,k=l,2,…,进行局部 优化。 步骤四利用Hilbert-Huang变换对浊音帧进行固有模态分解,以基因频率为已 知参数对浊音帧进行正弦原子分解。具体步骤 步骤l :对浊音帧进行固有模态分解,得到一系列固有模态函数Ci(t)。 步骤2 :对固有模态函数Ci (t)进行Hilbert变换,并求得每个固有模态分量的瞬
时幅度ai(t)、瞬时相位函数小i(t)、瞬时频率函数"i(t)。 对每个固有模态函数Ci (t)进行Hilbert变换,得到 &(0 =丄「逃7 ;r山00 / — r
构造解析信号 瞬时幅值函数
瞬时相位函数
"々>
<formula>formula see original document page 7</formula>进一步可以求出瞬时频率函数 会,
(2)<formula>formula see original document page 7</formula>(3)<formula>formula see original document page 7</formula>(4)<formula>formula see original document page 7</formula>(5) 步骤3 :按照公式(6)计算称为Hilbert谱,这里RP表示取实部,并用公式(7)求 Hilbert谱H(" , t)的瞬时频率加权能量FIE (t)函数
观(f) = 。x 4))2 cto
(6)<formula>formula see original document page 7</formula>(7) 步骤4 :求瞬时频率加权能量FIE(t)的导数DFIE(t),并对DFIE(t)进行阈值判 断。在声门脉冲发生时刻,瞬时能量一定增加,使其一阶导数一定大于某个正数,通过对瞬 时能量一阶导数值进行阈值判断处理,求经过阈值判断后的DFIE(t)的局部极大值,计算 各个局部极大值的时间间隔就可求得基音频率。 步骤五计算时频原子的相似度,分别由正弦时频原子、Chirp时频原子聚合生成 正弦时频分子、Chirp时频分子,得到清音帧和浊音帧的结构化时频特征。
步骤1 :使用预先估计得到的正弦时频原子的频率、Chirp时频原子的旋转参数作 为初始化K-means聚类中心。 步骤2 :使用欧氏距离度量两个时频原子之间的非相似性。 步骤3 :使用K-means聚类算法揭示时频原子集中的聚类结构,即由时频原子聚合 成时频分子。 步骤4 :采用误差平方和准则函数判断聚类是否合理,不合理则修改分类。循环进 行判断、修改直至达到算法终止条件。 步骤5 :根据步骤二得到的浊音帧和清音帧固有的结构化时频信息,判断聚类是
否合理。
权利要求
一种由时频原子聚合生成时频分子的方法,其特征是包括如下步骤(1)将语音波形分成浊音帧和清音帧;(2)提取浊音帧和清音帧固有的结构化时频信息;(3)使用预估计的匹配追踪算法对清音帧进行三参数Chirp时频原子分解;(4)利用Hilbert-Huang变换对浊音帧进行固有模态分解,以基因频率为已知参数对浊音帧进行正弦原子分解;(5)计算时频原子的相似度,分别由正弦时频原子、Chirp时频原子聚合生成正弦时频分子、Chirp时频分子,得到清音帧和浊音帧的结构化时频特征。
2. 如权利要求1所述的由时频原子聚合生成时频分子的方法,其特征是所述三参数 Chirp时频原子分解用三个参数表示Chirp时频原子,方法是利用分数阶傅立叶变换定 义一个旋转算子,使信号旋转到分数阶域;令旋转后的信号沿旋转的方向径向移动,得到旋 转-径向移位复合算子;将比例算子、旋转-径向移位复合算子作用于单位高斯函数,得到 用比例参数、旋转参数、径向移位参数三个参数表示的Chrip原子。
3. 如权利要求1所述的由时频原子聚合生成时频分子的方法,其特征是所述三参数 Chirp时频原子分解搜索最佳三参数Chirp时频原子的方法是先估计最佳时频原子的旋 转方位,并假定在大比例参数下,三参数最佳Chirp原子的搜索就变成了径向移位一个参 数的搜索,将多维搜索逐步分解成一维参数的搜索。
4 如权利要求1所述的由时频原子聚合生成时频分子的方法,其特征是所述对浊音帧 进行正弦原子分解的方法是首先,利用经验模态分解方法对浊音段语音信号进行经验模 态分解,得到一簇固有模态函数;然后,求取各个固有模态函数的瞬时频率和瞬时幅度和瞬 时频率加权能量函数并对其求导数,由于在声门脉冲发生时刻,瞬时能量一定增加而其瞬 时能量的导数大于某个正数,对瞬时能量函数的导数已经过阈值处理后,其局部极大值发 生的时刻即被认为是声门脉冲发生的时刻;最后,计算局部极大值的时间间隔得到基音周 期和基音频率。
5. 如权利要求1所述的由时频原子聚合生成时频分子的方法,其特征是所述由正弦时 频原子、Chirp时频原子聚合生成正弦时频分子、Chirp时频分子,即由一簇时频原子聚合 生成时频分子采用聚类算法。
全文摘要
本发明提出在自适应信号时频表示过程中,使用时频分子作为最小分析单元代替现在普遍使用的时频原子,并给出一种由时频原子聚合生成时频分子的方法。通过时频分子分解信号可获得信号的稀疏表示和结构化特征信息,而这些结构化信息对于信号特征抽取、信号压缩、模式识别等后续分析处理是重要的。
文档编号G10L25/93GK101714354SQ20091023204
公开日2010年5月26日 申请日期2009年11月27日 优先权日2009年11月27日
发明者于凤芹 申请人:江南大学
一种由时频原子聚合生成时频分子的方法
相关推荐
专利名称:一种球型投影灯的制作方法技术领域:本实用新型涉及一种照明装置,特别涉及一种球型投影灯。背景技术:生活中,人们经常会用到投影灯来照明,投影灯不仅可以照明,还可以调节光束的照明方向,现有的投影灯,照明亮度分布不均匀,使用不方便,另外,
专利名称:用于语音解码器的高分辨率后处理方法技术领域:本发明涉及语音编码器中用来获得高频率分辨率的后处理方法。该语音编码器最好用于移动无线电系统的无线电接收机中。以前技术的描述在语音和音频编码中,普遍的是在解码器中采用后处理技术来增强解码语
专利名称:蝶形光缆熔接保护盒的制作方法技术领域:本实用新型涉及一种光缆辅助设备,尤其涉及一种蝶形光缆熔接保护盒。背景技术:随着网络技术发展的日新月异,网络的应用也不断升级,从而对对布线系统的带宽不断提出更高的要求。系统供应商和最终用户在规划
专利名称:多畴垂直取向模式的液晶显示装置的制作方法技术领域:本实用新型涉及一种液晶显示装置,特别是涉及一种多畴垂直取向模式 (Multi-domain Vertical Alignment, MVAPVA)的液晶显示装置。背景技术:随着信息
专利名称:液晶取向处理剂、液晶取向膜及液晶显示元件的制作方法技术领域:本发明涉及制作液晶取向膜时使用的液晶取向处理剂以及利用该处理剂的液晶显示元件。背景技术:目前,作为液晶显示元件的液晶取向膜,主要使用所谓的聚酰亚胺系液晶取向膜,该液晶取向
专利名称:语音编码装置和语音编码方法技术领域:本发明涉及语音编码装置和语音编码方法,特别涉及能够删除冗余的声道间参数的语音编码装置和语音编码方法。背景技术:在立 体声语音编码方法或多声道语音编码方法中,一般存在两种方法。一种方法是,对不同声