当前位置:网站首页>专利 >正文

从help编码到melp编码的语音编码数据转换系统及方法

专利名称:从help编码到melp编码的语音编码数据转换系统及方法
技术领域
本发明涉及语音编码转换技术领域,具体涉及一种从HELP编码到MELP编码的语 音编码数据转换系统及方法。
背景技术
语音编码技术指把语音信号进行压缩和解压缩的过程。利用数字技术对语音进行 存储和传输已被广泛应用于各种通信系统中。语音信号的数字化传输存在于各种各样的语 音编码技术中,每一种语音编码技术的目的都是为了提供更加便捷的存储、传输或者对于 特定的应用尽可能地降低传输速率,并保证一定的话音质量。目前流行的语音编码器都采 用自己特定的语音编码算法标准,其中两种语音编码器算法如下UHELP (Harnonic Excited Linear Prediction)编码速率为 2. 4k/s。HELP语音编码算法的基本原理如图1所示,s (n)是原始语音,HELP算法主要经三 步进行首先对输入语音进行线性预测滤波,得到残差信号e(n);再将残差信号按正弦模
型的思想进行分析、合成,得到合成残差信号kn);最后对&进行线性预测逆滤波就可得 到重建的语音
o如上所述,HELP算法通过预测滤波器将信号转换到残差域,然后以正弦模型对残 差信号进行分析,即HELP声码器的编码分析过程主要由两部分一是计算线性预测滤波器 系数,HELP声码器采用10阶预测滤波器,系数的计算采用莱文逊-杜宾(Levinson-Dubin) 算法;二是提取正弦模型参数,主要参数包括基音周期,表征正弦波分量的Ak和Bk以及相 位。HELP需要提取的主要参数有4个线性预测系数(LPC),基音周期,谱幅度矢量,浊音 度。2, MELP (Mixed Excitation Linear Prediction)美国联邦标准,编码速率为 2. 4k/s。MELP语音编码算法的基本原理如下输入的语音信号通过一个四阶II型切比雪 夫(Chebyshev)高通滤波器,滤除50Hz的直流工频干扰,然后采用多带混合激励进行清、浊 音判决,以提取准确的基音信号;为了改善合成语音的音质,MELP把语音分成清音、浊音和 抖动浊音3种状态;线性预测主要包括输入语音信号的分析和残差信号的分析;当浊音段 的信号周期不是很好时,通过非周期标志在译码端采用与之相适应的激励源激励不稳定的 声带脉冲;经过纠错编码后以不同的比特分配方式将各参数分别编码后组帧,形成当前语 音帧的压缩比特流。MELP需要提取的主要参数有6个线性预测系数(LPC),基音周期,傅 里叶级数幅度值,增益(每帧两个),子带声强度,非周期标志。在许多情况下,各种声码器之间所采用的语音编码算法是不相互兼容的。当两种 不同的通信系统使用不同的语音编码算法标准进行编码时,要想实现它们之间的相互通 信,在两种通信系统中进行码流转换就变得非常有必要。目前使用最普遍的是采用Tandem 方案进行转换,即对目标数据实行先解码再编码的方式。这种传统的码流转换方案存在运算量大及经二次压缩、解压缩造成语音失真度加大等缺点。这样就需要寻求一种简单有效 的方案,以实现在两种不同的语音编码算法之间进行编码数据转换,达到不同的通信系统 间直接相互通信的目标。

发明内容
有鉴于此,为了解决上述问题,本发明的目的在于提供一种降低运算量和失真度 的从HELP编码到MELP编码的语音编码数据转换系统。本发明的目的是这样实现的从HELP编码到MELP编码的语音编码数据转换系统, 包括 纠错模块,接收HELP编码的语音数据流,对其进行检错和纠错处理;编码分量分离模块,从纠错后的HELP编码的语音数据流中分离出重构语音所需 要的编码分量;编码逆量化模块,对编码分量分离模块分离出的重构语音所需要的编码分量进行 逆量化,输出逆量化的编码分量;编码转换模块,将编码逆量化模块输出的逆量化的编码分量分别转换为符合MELP 语音编码方案的编码分量;量化编码模块,对编码转换模块输出的编码分量MELP语音编码分量进行量化;编码多路复用模块,将量化编码模块输出的编码分量按合MELP语音编码算法标 准进行组帧,形成MELP编码的语音数据流。进一步,所述重构语音所需要的编码分量包括LSF参数、基音周期、浊音度、功率 和谱形;进一步,所述编码转换模块包括LSF参数转换子模块、基音周期转换子模块、浊音 度转换子模块、功率转换子模块和谱形转换子模块,分别对逆量化LSF参数编码分量、基音 周期编码分量、浊音度编码分量、功率编码分量和谱形编码分量进行转换,其中浊音度转换 子模块将浊音度编码分量转换为子带声强度和非周期标志两个编码分量,功率转换子模块 将功率编码分量转换为增益编码分量,谱形转换子模块将谱形编码分量转换为傅里叶幅度 值编码分量;本发明的目的还在于提供一种降低运算量和失真度的从HELP编码到MELP编码的 语音编码数据转换方法。从HELP编码到MELP编码的语音编码数据转换方法,包括如下步骤1)对HELP编码的语音数据流进行检错和纠错处理;2)从纠错后的HELP编码的语音数据流中分离出重构语音所需要的编码分量;3)对步骤2)分离出的重构语音所需要的编码分量进行逆量化,输出逆量化的编 码分量;4)将步骤3)逆量化的编码分量分别转换为符合MELP语音编码方案的编码分量;5)对步骤4)获得的MELP语音编码分量进行量化;6)将步骤5)获得的编码分量按合MELP语音编码算法标准进行组帧,形成MELP编 码的语音数据流。进一步,步骤2)中分离出的编码分量包括LSF参数、基音周期、浊音度、功率和谱形;进一步,步骤4)包括如下步骤41)对LSF参数编码分量进行转换;42)对基音周期编码分量进行转换;43)对浊音度编码分量进行分析;44)对功率编码分量进行分析;45)对谱形编码分量进行分析;46)将浊音度编码分量转换为子带声强度编码分量和非周期标志编码分量;47)根据功率编码分量和转换后的基音周期编码分量,获得增益编码分量;48)将谱形编码分量转换为傅里叶幅度值编码分量;进一步,步骤41)中,将逆量化后的10个LSF参数按照升序排列,并且使其间隔至 少为50Hz,排序后得到一个LSF矢量,然后对该LSF矢量进行自适应平滑;在步骤5)中对 LSF参数进行多级矢量量化;进一步,步骤42)中,将前基音周期乘以一个比例因子后取整,获得转换后的基音 周期编码分量,所述比例因子为delta = 2-(p-20)/150(P为基音周期值);在步骤5)中对 转换后的基音周期编码分量进行99阶均勻量化;进一步,步骤43)中判断当前数据帧是清音帧还是浊音帧;步骤46)具体包括如下步骤461)如果当前数据帧是清音帧,则将5个子带声强度vbpl至vbp5均置0 ;462)如果当前数据帧为浊音帧,则第一子带声强度Vbpl = 1,设i = pv/0. 125 (Pv 为浊音度),判断i是否为整数;463)当 i 为整数时,Vbp2 = 0,设 k = (p-0. 125) /0. 25 当k = 0 时,Vbp3 至 Vbp5 均置 0 ;当k = 1时,表示有二个子带声强度为0,通过统计方法对Vbp3至Vbp5置0或置1 ;当k = 2时,表示有一个子带声强度为0,通过统计方法对Vbp3至Vbp5置0或置1 ;当k = 3 时,Vbp3 至 Vbp5 均置 1 ;464)当 i 不为整数时,Vbp2 = 1,设 k = (p-0. 125)/O. 25 当k = 0 时,Vbp3 至 Vbp5 均置 0 ;当k = 1时,表示有二个子带声强度为0,通过统计方法对Vbp3至Vbp5置0或置1 ;当k = 2时,表示有一个子带声强度为0,通过统计方法对Vbp3至Vbp5置0或置1 ;当k = 3 时,Vbp3 至 Vbp5 均置 1 ;465)当前数据帧为清音帧时,对包络周期度进行检测,如结果小于阀值,则把非周 期标志置为1 ;否则把非周期标志置为0 ;进一步,步骤47)中,通过下式将功率编码分量转换为增益编码分量
W2G, 二 101g(0.01 +丁),i = l,2

其中,Gi为两个增益编码分量,W为功率编码分量,L为分析窗长,当前帧为清音帧 时,L为120个样点;当前帧为浊音帧时,L为基音周期的整数倍且大于120个样点中的最 小值,如果这个长度超过320个样点,则将它除以2 ;
步骤5)中,对G1的量化方式为3b的均勻量化,对G2的量化方式为从10dB到77dB 用5b进行均勻量化;步骤48)中,将谱形参数转换成当前帧残差信号的DFT幅度谱中的前10个谐波幅 度矢量,这10个谐波幅度矢量进行归一化后即为MELP傅里叶幅度值中的前10个基音谐波 值;步骤5)中,对傅里叶幅度值进行8b均勻量化。本发明的有益效果是本发明省去了对输入语音信号进行基音周期的分析,包括 整数基音和分数基音搜索、计算LSF参数以及残差信号分析等在编码程序中耗时很重的分 析步骤,同时省去了 HELP解码所需要的运算量,取而代之的是把HELP参数通过简单转换的 方式转化成MELP所需要的参数,转换运算量极小。本发明提出的转换方案,比先通过HELP 译码然后再通过MELP编码,在总体上能节省50%左右的运行时间。而且本发明由于避免了 经过二次编解码所造成的语音信号参数的多次转接失真,在语音质量方面,不会比Tandem 方式得到的合成语音质量差。


为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进 一步的详细描述图1示出了 HELP语音编码算法基本原理图;图2示出了从HELP编码到MELP编码的语音编码数据转换系统结构示意图。
具体实施例方式以下将对本发明的优选实施例进行详细的描述。本发明通过把HELP语音编码方案的LSF参数,基音周期,浊音度,功率,谱形的逆 量化值转换成MELP语音编码方案的LSF参数,基音周期,子带声强度,非周期标志和傅里叶 级数幅度值,根据再现的语音和基音周期合成信号创建目标信号,并且获得目标信号的代 数编码。参见图2,从HELP编码到MELP编码的语音编码数据转换系统,包括纠错模块,接收HELP编码的语音数据流,对其进行检错和纠错处理;编码分量分离模块,从纠错后的HELP编码的语音数据流中分离出重构语音所需 要的编码分量,包括LSF参数、基音周期、浊音度、功率和谱形;编码逆量化模块,对编码分量分离模块分离出的重构语音所需要的编码分量进行 逆量化,输出逆量化的编码分量;编码转换模块,将编码逆量化模块输出的逆量化的编码分量分别转换为符合MELP 语音编码方案的编码分量;所述编码转换模块包括LSF参数转换子模块、基音周期转换子 模块、浊音度转换子模块、功率转换子模块和谱形转换子模块,分别对逆量化LSF参数编码 分量、基音周期编码分量、浊音度编码分量、功率编码分量和谱形编码分量进行转换,其中 浊音度转换子模块将浊音度编码分量转换为子带声强度和非周期标志两个编码分量,功率 转换子模块将功率编码分量转换为增益编码分量,谱形转换子模块将谱形编码分量转换为 傅里叶幅度值编码分量;
量化编码模块,对编码转换模块输出的编码分量MELP语音编码分量进行量化;编码多路复用模块,将量化编码模块输出的编码分量按合MELP语音编码算法标 准进行组帧,形成MELP编码的语音数据流。从HELP编码到MELP编码的语音编码数据转换方法,包括如下步骤1)对HELP编码的语音数据流进行检错和纠错处理;2)从纠错后的HELP编码的语音数据流中分离出重构语音所需要的编码分量,包 括LSF参数、基音周期、浊音度、功率和谱形;3)对步骤2)分离出的重构语音所需要的编码分量进行逆量化,输出逆量化的编 码分量;4)将步骤3)逆量化的编码分量分别转换为符合MELP语音编码方案的编码分量; 具体包括如下步骤41)对LSF参数编码分量进行转换将逆量化后的10个LSF参数按照升序排列, 并且使其间隔至少为50Hz,排序后得到一个LSF矢量,然后对该LSF矢量进行自适应平滑;42)对基音周期编码分量进行转换;将前基音周期乘以一个比例因子后取整,获 得转换后的基音周期编码分量,所述比例因子为delta = 2-(p_20)/150(P为基音周期 值);43)对浊音度编码分量进行分析,判断当前数据帧为清音帧还是浊音帧;44)对功率编码分量进行分析;45)对谱形编码分量进行分析;46)将浊音度编码分量转换为子带声强度编码分量和非周期标志编码分量;具体 包括如下步骤461)如果当前数据帧是清音帧,则将5个子带声强度vbpl至vbp5均置0 ;462)如果当前数据帧为浊音帧,则第一子带声强度Vbpl = 1,设i = pv/0. 125 (Pv 为浊音度),判断i是否为整数;463)当 i 为整数时,Vbp2 = 0,设 k = (p-0. 125) /0. 25 当k = 0时,乂_至乂如5均置0 ;当k = 1时,表示有二个子带声强度为0,通过统计方法对Vbp3至Vbp5置0或置1 ;当k = 2时,表示有一个子带声强度为0,通过统计方法对Vbp3至Vbp5置0或置1 ;当k = 3 时,Vbp3 至 Vbp5 均置 1 ;464)当 i 不为整数时,Vbp2 = 1,设 k = (p-0. 125)/O. 25 当k = 0 时,Vbp3 至 Vbp5 均置 0 ;当k = 1时,表示有二个子带声强度为0,通过统计方法对Vbp3至Vbp5置0或置1 ;当k = 2时,表示有一个子带声强度为0,通过统计方法对Vbp3至Vbp5置0或置1 ;当k = 3 时,Vbp3 至 Vbp5 均置 1 ;465)当前数据帧为清音帧时,对包络周期度进行检测,如结果小于阀值,则把非周 期标志置为1 ;否则把非周期标志置为0 ;47)根据功率编码分量和转换后的基音周期编码分量,获得增益编码分量,通过下 式将功率编码分量转换为增益编码分量
G,=101g(0.01+ —),/ = 1,2其中,Gi为两个增益编码分,W为功率编码分量,L为分析窗长,当前帧为清音帧 时,L为120个样点;当前帧为浊音帧时,L为基音周期的整数倍且大于120个样点中的最 小值,如果这个长度超过320个样点,则将它除以2 ;48)将谱形编码分量转换为傅里叶幅度值编码分量将谱形参数转换成当前帧残 差信号的DFT幅度谱中的前10个谐波幅度矢量,这10个谐波幅度矢量进行归一化后即为 MELP傅里叶幅度值中的前10个基音谐波值;5)对步骤4)获得的MELP语音编码分量进行量化;其中,对LSF参数进行多级矢 量量化;对转换后的基音周期编码分量进行99阶均勻量化;对增益G1的量化方式为3b的 均勻量化,对增益G2的量化方式为从10dB到77dB用5b进行均勻量化;对傅里叶幅度值进 行8b均勻量化。6)将步骤5)获得的编码分量进行前向纠错后,按MELP语音编码算法标准进行组 帧,形成MELP编码的语音数据流。以上所述仅为本发明的优选并不用于限制本发明,显然,本领域的技术人员可以 对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修 改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和 变型在内。
10
权利要求
从HELP编码到MELP编码的语音编码数据转换系统,其特征在于包括纠错模块,接收HELP编码的语音数据流,对其进行检错和纠错处理;编码分量分离模块,从纠错后的HELP编码的语音数据流中分离出重构语音所需要的编码分量;编码逆量化模块,对编码分量分离模块分离出的重构语音所需要的编码分量进行逆量化,输出逆量化的编码分量;编码转换模块,将编码逆量化模块输出的逆量化的编码分量分别转换为符合MELP语音编码方案的编码分量;量化编码模块,对编码转换模块输出的编码分量MELP语音编码分量进行量化;编码多路复用模块,将量化编码模块输出的编码分量按合MELP语音编码算法标准进行组帧,形成MELP编码的语音数据流。
2.如权利要求1所述的从HELP编码到MELP编码的语音编码数据转换系统,其特征在 于所述重构语音所需要的编码分量包括LSF参数、基音周期、浊音度、功率和谱形。
3.如权利要求2所述的从HELP编码到MELP编码的语音编码数据转换系统,其特征 在于所述编码转换模块包括LSF参数转换子模块、基音周期转换子模块、浊音度转换子 模块、功率转换子模块和谱形转换子模块,分别对逆量化LSF参数编码分量、基音周期编码 分量、浊音度编码分量、功率编码分量和谱形编码分量进行转换,其中浊音度转换子模块将 浊音度编码分量转换为子带声强度和非周期标志两个编码分量,功率转换子模块将功率编 码分量转换为增益编码分量,谱形转换子模块将谱形编码分量转换为傅里叶幅度值编码分 量。
4.从HELP编码到MELP编码的语音编码数据转换方法,其特征在于包括如下步骤1)对HELP编码的语音数据流进行检错和纠错处理;2)从纠错后的HELP编码的语音数据流中分离出重构语音所需要的编码分量;3)对步骤2)分离出的重构语音所需要的编码分量进行逆量化,输出逆量化的编码分量;4)将步骤3)逆量化的编码分量分别转换为符合MELP语音编码方案的编码分量;5)对步骤4)获得的MELP语音编码分量进行量化;6)将步骤5)获得的编码分量按合MELP语音编码算法标准进行组帧,形成MELP编码的 语音数据流。
5.如权利要求4所述的从HELP编码到MELP编码的语音编码数据转换方法,其特征在 于步骤2)中分离出的编码分量包括LSF参数、基音周期、浊音度、功率和谱形。
6.如权利要求5所述的从HELP编码到MELP编码的语音编码数据转换方法,其特征在 于步骤4)包括如下步骤41)对LSF参数编码分量进行转换;42)对基音周期编码分量进行转换;43)对浊音度编码分量进行分析;44)对功率编码分量进行分析;45)对谱形编码分量进行分析;46)将浊音度编码分量转换为子带声强度编码分量和非周期标志编码分量;47)根据功率编码分量和转换后的基音周期编码分量,获得增益编码分量;48)将谱形编码分量转换为傅里叶幅度值编码分量。
7.如权利要求6所述的从HELP编码到MELP编码的语音编码数据转换方法,其特征在 于步骤41)中,将逆量化后的10个LSF参数按照升序排列,并且使其间隔至少为50Hz,排 序后得到一个LSF矢量,然后对该LSF矢量进行自适应平滑;在步骤5)中对LSF参数进行多级矢量量化。
8.如权利要求6所述的从HELP编码到MELP编码的语音编码数据转换方法,其特征 在于步骤42)中,将前基音周期乘以一个比例因子后取整,获得转换后的基音周期编码分 量,所述比例因子为delta = 2-(p-20)/150(P为基音周期值);在步骤5)中对转换后的基 音周期编码分量进行99阶均勻量化。
9.如权利要求6所述的从HELP编码到MELP编码的语音编码数据转换方法,其特征在 于步骤43)中判断当前数据帧是清音帧还是浊音帧;步骤46)具体包括如下步骤461)如果当前数据帧是清音帧,则将5个子带声强度Vbpl至Vbp5均置0;462)如果当前数据帧为浊音帧,则第一子带声强度Vbpl= 1,设i = pv/0. 125 (Pv为浊 音度),判断i是否为整数;463)当i 为整数时,Vbp2 = 0,设 k = (p-0. 125) /0. 25 当k = 0时,Vbp3至Vbp5均置0;当k = 1时,表示有二个子带声强度为0,通过统计方法对Vbp3至Vbp5置0或置1 ;当k = 2时,表示有一个子带声强度为0,通过统计方法对Vbp3至Vbp5置0或置1 ;当k = 3时,Vbp3至Vbp5均置1;464)当i 不为整数时,Vbp2 = 1,设 k = (p-0. 125)/0.25 当k = 0时,Vbp3至Vbp5均置0;当k = 1时,表示有二个子带声强度为0,通过统计方法对Vbp3至Vbp5置0或置1 ;当k = 2时,表示有一个子带声强度为0,通过统计方法对Vbp3至Vbp5置0或置1 ;当k = 3时,Vbp3至Vbp5均置1;465)当前数据帧为清音帧时,对包络周期度进行检测,如结果小于阀值,则把非周期标 志置为1 ;否则把非周期标志置为0。
10.如权利要求6所述的从HELP编码到MELP编码的语音编码数据转换方法,其特征在 于步骤47)中,通过下式将功率编码分量转换为增益编码分量G1 =101g(0.01 + W2/L),i = 1,2 其中,Gi为两个增益编码分,W为功率编码分量,L为分析窗长,当前帧为清音帧时,L 为120个样点;当前帧为浊音帧时,L为基音周期的整数倍且大于120个样点中的最小值, 如果这个长度超过320个样点,则将它除以2 ;步骤5)中,对Gl的量化方式为3b的均勻量化,对G2的量化方式为从IOdB到77dB用 5b进行均勻量化;步骤48)中,将谱形参数转换成当前帧残差信号的DFT幅度谱中的前10个谐波幅度矢量,这10个谐波幅度矢量进行归一化后即为MELP傅里叶幅度值中的前10个基音谐波值;步骤5)中,对傅里叶幅度值进行8b均勻量化。
全文摘要
本发明涉及语音编码转换技术领域,具体涉及一种从HELP编码到MELP编码的语音编码数据转换系统及方法;所述从HELP编码到MELP编码的语音编码数据转换系统,包括纠错模块、编码分量分离模块、编码逆量化模块、编码转换模块、量化编码模块和编码多路复用模块,对HELP编码的语音数据流进行检错和纠错处理后,分离出重构语音所需要的编码分量并进行逆量化,然后对各编码分量分别进行转换、量化,最后按MELP语音编码算法标准进行组帧,形成MELP编码的语音数据流,本发明与现有技术相比,具有运算量小和失真度低的优点。
文档编号G10L19/14GK101887727SQ20101016284
公开日2010年11月17日 申请日期2010年4月30日 优先权日2010年4月30日
发明者吴玉成, 陈 峰 申请人:重庆大学

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:单反相机用机顶闪光灯柔光罩的制作方法技术领域: 本发明涉及一种柔光罩,特别涉及一种单反相机用机顶闪光灯柔光罩。背景技术: 柔光罩是安装在闪光灯上的一种对强烈光线起到柔化作用的装置。它能够将闪光灯发出的光线,如直射光线、折射光线、反

    专利发布时间:2025-05-15阅读:(114)

    专利名称:图像显示设备的制作方法技术领域:本发明涉及用于使观测者能够观测由图像形成装置等形成的 二维图像的图像显示设备。背景技术:存在一些虚像显示设备(图像显示设备),每种都以由虚拟光 学系统放大的虚像的形式使观测者能够观测由图像形成装置形

    专利发布时间:2025-05-15阅读:(73)

    个人音频设备中耳朵耦合检测以及噪声消除中的自适应响应的调节的制作方法【专利摘要】一种个人音频设备例如无线电话,包括自适应噪声消除(ANC)电路,该电路自适应地从参考麦克风信号产生抗噪信号并且输入抗噪信号到扬声器或者其它换能器输出以导致消除周

    专利发布时间:2025-05-15阅读:(82)

    专利名称:对多声道信号进行编码和解码的方法和设备的制作方法技术领域:本发明涉及一种对多声道信号进行编码和或解码的方法以及一种执行该方法的设备,更具体地说,涉及一种根据多声道信号之间的相似性对多声道信号进行编码的方法和一种执行该方法的设备,以

    专利发布时间:2025-05-15阅读:(93)

    专利名称:语音辨识系统的词汇数据库建置方法及其搜寻比对方法技术领域:本发明涉及一种语音辨识系统的词汇数据库建置方法及其搜寻比对方 法,特别是一种可支持多音字处理的词汇数据库建置方法及其更具效率的搜 寻比对方法。技术背景习知语音辨识系统,并没

    专利发布时间:2025-05-15阅读:(70)

    一种夹持型扇形吊灯的制作方法【专利摘要】本发明提出了一种夹持型扇形吊灯,该发明包括:安装底座、与安装底座连接的灯杆、设置在灯杆上的灯罩以及灯头,灯杆与灯罩之间设置有夹持部件,夹持部件内部有金属触点,灯头与金属触点连接,灯头是扇形的灯盘结构,

    专利发布时间:2025-05-15阅读:(89)