专利名称:在用于宽带信号编码的代数码本中索引脉冲位置和符号的制作方法
技术领域:
本发明涉及对信号进行数字编码的技术,特别是但不仅是就其传输和合成涉及语音信号。更为具体来说,本发明涉及用于索引非零振幅脉冲的脉冲位置和振幅的方法,特别是但不仅是在基于代数码受激线性预测(ACELP)技术地宽带信号的高质量编码所需的非常大的代数码本中。
背景技术:
针对许多的应用,诸如音频/视频电话会议,多媒体,无线应用,及因特网和分组网络应用,对于有良好主观质量/位速率均衡的有效的数字宽带语音/音频编码技术的需求正不断增长。直到最近,在语音编码应用中还主要使用范围在200-3400Hz内滤波的电话带宽。然而,为了增加语音信号的可理解性和自然性,对宽带语音应用的需求正在增加。已发现范围50-7000Hz的带宽对于传送面对面语音质量是足够的。对于音频信号,这一范围给出可接受的音频质量,但是仍然低于工作在20-20000Hz范围的CD(小型盘)质量。
语音编码器把语音信号转换为通过通信信道传输(或存储在存储介质中)的数字比特流。语音信号被数字化(被采样并以通常的每样本16比特量化),且语音编码器的作用是在保持良好的主观语音质量的同时,以较少的比特数表示这些数字样本。语音解码器或合成器对传输的或存储的比特流进行运算,并将其转换为声音信号。
能够达到良好质量/位速率均衡的最好的先有技术之一是所谓CELP(代码受激线性预测)技术。根据这种技术,被采样的语音信号以通常称为帧L个样本的相继块被处理,这里L是某个预定的数(对应于语音的10-30ms)。在CELP中,每帧计算LP(线性预测)合成滤波器并被传输。L-样本帧被划分为称为子帧的大小为N个样本的较小的块,这里L=kN,k是一个帧中子帧的数目(N通常对应于语音的4-10ms)。在每一子帧中确定一激发信号,该信号通常由两部分组成一个来自过去的激励(也称为音调(pitch)成份或自适应码本),另一个来自创新码本(也称为固定码本)。激发信号被传输并在解码器用作为LP合成滤波器的输入,以便获得合成的语音。
为了按CELP技术合成语音,使来自创新码本的适当的码向量通过对语音信号的频谱特征建模的时变滤波器进行滤波,合成每一N样本块。这些滤波器由音调合成滤波器(通常作为包含过去激发信号的自适应码本实现)和LP合成滤波器组成。在编码器端,对来自码本的所有码向量或其子集计算合成输出(码本搜索)。根据感知性加权失真测量,留下的码向量是产生最接近原来语音信号的合成输出的码向量。这种感知性加权是使用所谓感知性加权滤波器进行的,该滤波器通常从LP合成滤波器推导。
CELP上下文中的创新码本是被称为N-维码向量的N-样本长序列的一个索引集合。通过范围从1到M的一个整数k对每一码本序列进行索引,其中M表示码本的大小,常常表示为b位的一个数,这里M=2b。
码本可以存储在物理存储器中,例如查表(随机码本),或可以指一种用于使索引与对应的码向量相关的机制,例如公式(代数码本)。
第一类型码本即统计码本的缺陷在于,它们常常涉及实际的物理存储器。它们是随机的,即在从索引到相关码向量的路径涉及查表的意义上的随机性,它们是随机产生的数或用于大的语音训练集合的统计技术的结果。随机码本的大小倾斜于受到存储和/或搜索复杂性的限制。
第二类码本是代数码本。与随机码本对比,代数码本不是随机性的且不需要实际的存储器。代数码本是被索引的码向量的一个集合,其通过一种不需要物理存储器或需要很小物理存储器的规则,能够从对应的索引k推导出广码向量脉冲的振幅和位置。因而,代数码本的大小不受存储需求的限制。还可以针对有效搜索对代数码本进行设计。
在对电话频带声音信号进行编码中CELP模型已经很成功,且在范围广泛的应用中,特别是在数字蜂窝应用中,业已存在几种基于CELP的标准。在电话频带中,声音信号带宽限制为200-3400Hz,并以8000样本/秒被采样。在宽带语音/音频应用中,声音信号带宽限制为50-7000Hz,并以16000样本/秒采样。
当把电话频带优化的CELP模型应用到宽带信号时引起了某些困难,为了获得高质量宽带信号需要向模型添加附加的特性。这些特性包括有效的感知加权滤波,变化的带宽音调滤波,及有效的增益平滑和音调增强技术。在对宽带信号编码中另一重要问题是需要使用很大的激发码本。因而,需要最小存储并能够被迅速搜索的有效的码本结构变得很重要。代数码本以其效率著称,且现在广泛用于各种语音编码标准。代数码本和相关的快速搜索过程在以下文献中有述US专利No5,444,816(Adoul等人),1995年8月22日颁发;1997年12月17日授予Adoul等人的5,699,482;1998年5月19日授予Adoul等人的5,754,976;以及5,701,392(Adoul等人),日期为1997年12月23日。本发明的目的
本发明的目的是要提供一种用于在代数码本中索引脉冲位置和振幅的新的过程方法,以便特别是但不仅是对宽带信号有效地进行编码。本发明的概述
根据本发明,提供了在代数码本中索引脉冲位置和振幅的方法,用于对声音信号有效地编码和解码。代数码本包括脉冲振幅/位置组合的一个集合,每一组合定义了数个不同的位置,并包含对该组合各位置指定的零振幅脉冲和非零振幅脉冲两者。每一非零振幅脉冲取多个可能的振幅之一,且该索引方法包括
形成这些脉冲位置的至少一个踪迹的一集合;
根据脉冲位置的至少一个踪迹的集合,限制码本的组合的非零振幅脉冲的位置;
建立过程1,用于只有当一个非零振幅脉冲的位置位于该集合的一个踪迹中时,索引该非零振幅脉冲的位置和振幅;
建立过程2,用于只有当两个非零振幅脉冲的位置位于该集合的一个踪迹中时,索引这两个非零振幅脉冲的位置和振幅;以及
当数目X个非零振幅脉冲的位置位于该集合的一个踪迹时,X≥3
把该踪迹的位置划分为两部分;
使用过程X索引X个非零振幅脉冲的位置和振幅,这一X过程包括
标识每一非零振幅脉冲位于两个踪迹部分的哪一个之中;
使用建立的过程1和2在踪迹部分和整个踪迹至少之一中计算X个非零振幅脉冲的子索引;以及
通过组合子索引计算X个非零振幅脉冲的位置和振幅索引。
计算X个非零振幅脉冲的位置和振幅索引最好包括
通过组合至少两个子索引计算至少一个中间索引;以及
通过组合其余子索引和至少一个中间索引计算X个非零振幅脉冲的位置和振幅索引。
本发明还涉及用于在代数码本中索引脉冲位置和振幅的装置,以便对声音信号有效地编码和解码。该码本包括脉冲振幅/位置组合的一个集合,每一脉冲振幅/位置组合定义了数个不同的位置,并包含指定给该组合各位置的零振幅脉冲和非零振幅脉冲两者,每一非零振幅脉冲取多个可能的振幅之一。该索引装置包括
用于形成这些脉冲位置的至少一个踪迹的集合的装置;
根据脉冲位置的至少一个踪迹的集合,限制码本的组合的非零振幅脉冲位置的装置;
用于建立过程1的装置,该过程用于只有当一个非零振幅脉冲的位置位于该集合的一个踪迹中时,索引这个非零振幅脉冲的位置和振幅;
用于建立过程2的装置,该过程用于只有当两个非零振幅脉冲的位置位于该集合的一个踪迹中时,索引这两个非零振幅脉冲的位置和振幅;以及
当数目X个非零振幅脉冲的位置位于该集合的一个踪迹时,X≥3
用于把该踪迹的位置划分为两部分的装置;
用于执行过程X的装置,过程X索引X个非零振幅脉冲的位置和振幅,这一X过程执行装置包括
用于标识每一非零振幅脉冲位于两个踪迹部分的哪一个之中的装置;以及
使用建立的过程1和2,用于在踪迹部分和整个踪迹至少之一中计算X个非零振幅脉冲的子索引的装置;以及
用于计算X个非零振幅脉冲的位置和振幅索引的装置,所述索引计算装置包括用于组合子索引的装置。
用于计算X个非零振幅脉冲的位置和振幅索引的装置最好包括
用于通过组合至少两个子索引计算至少一个中间索引的装置;以及
通过组合其余子索引和这至少一个中间索引,计算X个非零振幅脉冲的位置和振幅索引。
本发明还涉及
-用于对声音信号进行编码的编码器,包括响应声音信号产生语音信号编码参数的声音信号处理装置,其中声音信号处理装置包括
用于为产生至少一个语音信号编码参数搜索代数码本的装置;以及
如上所述用于在所述代数码本中索引脉冲位置和振幅的装置;
-用于响应声音信号编码参数合成声音信号的解码器,包括
响应声音信号编码参数而产生激发信号的编码参数处理装置,其中编码参数处理装置包括
响应至少一个声音信号编码参数产生激发信号部分的代数码本;以及
如上所述用于在代数码本中索引脉冲位置和振幅的装置;以及
合成滤波器装置,用于响应激发信号合成声音信号;
-服务于划分为多个小区的广大地理区域的蜂窝通信系统,包括
移动发射机/接收机单元;
分别位于小区中的蜂窝基地台;
用于控制蜂窝基地台之间通信的装置;
处于一个小区的每一移动单元与所述一个小区的蜂窝基地台之间的双向无线通信子系统,该双向无线通信子系统在移动单元和蜂窝基地台中都包括(a)发射机,包含用于对语音信号编码的装置及用于发送已编码语音信号的装置,以及(b)接收机,包含用于接收发送的编码语音信号的装置及对接收的编码语音信号解码的装置;
-其中语音信号编码装置包括响应语音信号用于产生语音信号编码参数的装置,且其中语音信号编码参数产生装置包括为产生至少一个语音信号编码参数搜索代数码本的装置,以及如上所述用于索引代数码本中的脉冲位置和振幅的装置,语音信号构成声音信号;
-一种蜂窝式网络单元包括(a)发射机,包含用于对语音信号编码的装置及用于发送已编码语音信号的装置,以及(b)接收机,包含用于接收发送的编码语音信号的装置及对接收的被编码的语音信号解码的装置;
-其中语音信号编码装置包括用于响应语音信号产生语音信号编码参数的装置,且其中语音信号编码参数产生装置包括为产生至少一个语音信号编码参数搜索代数码本的装置,以及如上所述用于索引所述代数码本中的脉冲位置和振幅的装置;
-一种蜂窝式移动发射机/接收机单元,包括(a)发射机,包含用于对语音信号编码的装置及用于发送已编码语音信号的装置,以及(b)接收机,包含用于接收发送的编码语音信号的装置及对接收的被编码的语音信号解码的装置;
-其中语音信号编码装置包括响应语音信号产生语音信号编码参数的装置,且其中语音信号编码参数产生装置包括为产生至少一个语音信号编码参数搜索代数码本的装置,以及如上所述用于索引所述代数码本中的脉冲位置和振幅的装置;以及
-服务于被划分为多个小区的广大地理区域的蜂窝通信系统,包括移动发射机/接收机单元;分别位于小区中的蜂窝基地台;以及用于控制蜂窝基地台之间通信的装置;
处于一个小区的每一移动单元与所述一个小区的蜂窝基地台之间的双向无线通信子系统,该双向无线通信子系统在移动单元和蜂窝基地台中都包括(a)发射机,包含用于对语音信号编码的装置及用于发送已编码语音信号的装置,以及(b)接收机,包含用于接收发送的编码语音信号的装置及对接收的编码语音信号解码的装置;
-其中语音信号编码装置包括响应语音信号产生语音信号编码参数的装置,且其中语音信号编码参数产生装置包括为产生至少一个语音信号编码参数搜索代数码本的装置,以及如上所述用于索引所述代数码本中的脉冲位置和振幅的装置。
在参照附图阅读以下通过例子方式给出的本发明非限制性优选实施例的说明时,本发明的以上和其它目的,优点及特征将更为明显。附图的简要说明
在附图中
图1是宽带编码装置一个优选实施例的示意框图2是宽带解码装置一个优选实施例的示意框图3是音调分析装置一个优选实施例的示意框图4是一蜂窝式通信系统的简化的示意框图,其中能够实现图1的宽带编码装置和图2的宽带解码装置;以及
图5用于对长度为k=2M的两个符号脉冲编码,包括索引脉冲位置和符号的过程的优选实施例的流程图。优选实施例的详细说明
业内一般专业人员都知道,诸如401(图4)的蜂窝式通信系统通过把一个大的地理区域划分为数目C个较小的小区,在这很大的地理区域上提供了通信服务。通过各蜂窝式基地台4021,4022,...402C对C个较小的小区提供服务,以便对每一小区提供无线电信令,音频和数据信道。
无线信令信道用来向蜂窝式基地台402覆盖区(小区)限内诸如403的无线电话(移动发射机/接收机)发出呼叫,并向位于基地台小区以内或以外的其它无线电话403,或向另一网络,诸如公共交换电话网(PSTN)404,发出呼叫。
一旦无线电话403已经成功地呼叫或收到呼叫,在这一无线电话403和对应于无线电话403位于的小区的蜂窝式基地台402之间就建立起一个音频或数据信道,并通过该音频或数据信道进行基地台402与无线电话403之间的通信。当呼叫进行时,无线电话403还可以通过信令信道接收控制或定时信息。
如果无线电话403在通话进行时离开一个小区并进入另一相邻的小区,无线电话403把呼叫移交给新的小区基地台402的可用音频或数据信道。如果无线电话403离开一个小区并进入另一相邻的小区而没有进行通话,则无线电话403通过信令信道发送控制消息,以便登录到新的小区的基地台402。这样就能够在广泛的地理区域进行移动通信。
蜂窝式通信系统401还包括控制终端405,以便例如在无线电话403与PSTN 404之间,或在位于第一小区的无线电话403与处于第二小区中的无线电话403之间通信期间,控制蜂窝式基地台402与PSTN 404之间的通信。
当然,需要双向无线射频通信子系统建立一个小区的基地台402与位于该小区中的无线电话403之间音频或数据信道。如图4中非常简化的形式所示,这种双向无线射频通信子系统一般在无线电话中403包括
-发射机406,包括
-编码器407,用于对要被发送的语音信号或其它信号编码;以及
-发送电路408,用于通过诸如409天线发送来自编码器的已编码的信号;以及
-接收机410,包括
-接收电路411,用于通常通过相同的天线409接收发送的编码语音信号或其它信号;以及
-解码器412,用于对接收电路411接收的编码信号进行解码。
无线电话403还包括其它传统的无线电话电路413,以便向编码器407提供语音信号或其它信号,并处理来自解码器412的语音信号或其它信号。这些无线电话电路413是业内一般专业人员熟知的,本说明书中不再进行说明。
而且,这种双向无线射频通信子系统在基地台402中一般包括
-发射机414,包括
-编码器415,用于对要被发送的语音信号或其它信号编码;以及
-发送电路416,用于通过诸如417天线发送来自编码器415的已编码的信号;以及
-接收机418,包括
-接收电路419,用于通过同一个天线417或通过另一不同的天线(未示出)接收发送的编码语音信号或其它信号;以及
-解码器420,用于对接收电路419接收的编码信号进行解码。
基地台402一般与其相关的数据库422一同还包括基地台控制器421,用于对控制终端405与发射机414及接收机418之间的通信进行控制。在位于与基地台402同一小区的诸如403的两个无线电话之间通信的情形下,基地台控制器421还将控制接收机418与发射机414之间的通信。
如业内专业人员所熟知,为了降低通过双向无线射频通信子系统,即在无线电话403与基地台402之间,发送例如话音等语音信号所需的带宽,需要进行编码。
LP语音编码器(诸如415和407)一般工作在13kbits/秒及以下,诸如码激励线性预测(CELP)编码器一般使用LP合成滤波器对语音信号的短期频谱包络建模。LP信息一般以每10或20ms向解码器(诸如420和412)发送,并在解码器端被提取。
本说明书中所公开的新技术能够用于包含语音的电话频带信号,用于非语音的声音信号,以及其它类型的宽带信号。
图1示出被修改而更适用于宽带信号的CELP型语音编码装置100的总体框图。宽带信号可以包括音乐信号、视频信号等其他信号。
被采样的输入语音信号114被划分为称为“帧”的相继的L-样本块。在每一帧中,表示帧中语音信号的不同的参数被计算,编码并发送。通常每帧计算一次表示LP合成滤波器的LP参数。进而帧被划分为N个样本更小的块(长度为N的块),其中确定激发参数(音调和创新)。在CELP文献中,长度为N的这些块被称为“子帧”,且子帧中的N-样本信号称为N维向量。本优选实施例中,长度N对应于5ms,而长度L对应于20ms,这意思是说一个帧包含4个子帧(在下降采样到12.8kHz之后,在采样率16kHz和64时N=80)。在编码过程中会出现各种N-维向量。这里给出在图1和2中的向量的列表以及发送的参数列表如下
N-维向量列表
S宽带信号输入语音向量(下降采样之后,预处理和预加重);
Sw加权语音向量;
S0加权合成滤波器的零-输入响应;
Sp下降采样预处理信号;
过采样合成语音信号;
S’去加重前合成信号;
Sd去加重合成信号;
Sh去加重与后处理之后的合成信号;
X用于音调搜索的目标向量;
X2用于创新搜索的目标向量;
h加权合成滤波器脉冲响应;
VT滞后T的自适应(音调)码本向量;
YT已滤波的音调码本向量(以h卷积处理的VT);
Ck在索引k处的创新码向量(创新码本的第k记录项)
Cf增强标度创新码向量;
U激发信号(标度创新和音调码向量);
U’增强激发;
Z带通噪声序列;
W’白噪声序列;及
W标度噪声序列。
发送的参数列表
STP短期预测参数(定义A(z))
T音调滞后(或音调码本索引);
b音调增益(音调码本增益)
j对音调码向量使用的低通滤波器索引;
k码向量索引(创新码本输入项);以及
g创新码本增益。
本优选实施例中,每帧发送STP参数,且每子帧发送其余的参数(每帧四次)。
编码器侧
被采样的语音信号由图1的编码装置100逐块地被编码,编码装置100划分为十一个从101到111标号的模块。
在上述称为帧的L-样本块中处理输入语音信号。
参见图1,采样的输入语音信号114在下降采样模块101中被下降采样。例如,使用业内专业人员所熟知的技术,对信号进行下降采样,从16kHz被降低到12.8kHz。当然可以设想下降采样可以降低到其他频率。由于对较小的频率带宽进行编码,故下降采样增加了编码效率。由于降低了一帧中的样本数目,这还降低了算法复杂性。当位速率降低到16kbit/s以下时,下降采样的使用就成为重要的了;在16kbit/s以上下降采样是不重要的。
在下降采样之后,20ms的320-样本帧降低到256-样本帧(下降采样率4/5)。
然后输入帧提供给可选的预处理块102。预处理块102可由50Hz截止频率的高通滤波器组成。高通滤波器102除去50Hz以下的不希望的声音成分。
下降采样的预处理信号由Sp(n)表示,n=0,1,2,...L-1,其中L是帧长度(256,在采样频率为12.8kHz时)。在一优选实施例中,使用具有以下传递函数的的预加重滤波器103预加重信号Sp(n)
P(z)=1-μz-1
其中μ是预加重因子,其值位于0到1之间(典型值为μ=0.7),而z表示多项式P(z)的变量。也可用使用较高阶的滤波器。应当指出,高通滤波器102和预加重滤波器103能够互相交换以获得更有效的定点实现。
预加重滤波器103的功能是加强输入信号的高频成分。它还降低输入语音信号的动态范围,这使其更适合于定点实现。如果没有预加重,难以实现使用单精度算法的定点LP分析。
预加重在实现有利于改进声音质量的适当的量化误差整体感知加权中也起到重要作用。这将在以下更为详细地说明。
预加重滤波器103的输出标记为s(n)。该信号在计算器模块104中用于进行LP分析。LP分析是业内专业人员所熟知的技术。本优选实施例中,使用自相关方法。在自相关方法中,首先使用汉明窗口(通常具有30-40ms的长度)对信号s(n)开窗口。从开窗口的信号计算自相关,并使用Levinson-Durbin递归计算LP滤波器系数ai,其中i=1,...,p,p是LP的阶,在宽带编码中它一般是16。参数ai是LP滤波器的传递函数的系数,由以下关系给出
在计算器模块104中进行LP分析,该模块还进行LP滤波器系数的量化和内插。LP滤波器系数首先被转换成另一更适合于量化和内插的等价域中。线频谱对(LSP)和导抗对(ISP)域是在其中能够有效进行量化和内插的两个域。使用分解或多级量化或它们的组合能够按30到50比特量化16LP滤波器系数ai。内插的目的是在每帧发送LP滤波器系数时能够每子帧更新这些系数,这可改进编码器的性能而不增加位速率。另外可认为LP滤波器系数的量化和内插是一般业内专业人员所熟知的,因而本说明书中不再详述。
以下各节将说明基于子帧所进行的其余的编码操作。在以下的说明中,滤波器A(z)表示子帧的非量化内插LP滤波器,而滤波器
(z)表示子帧的量化内插的LP滤波器。
感知加权
在合成分析编码器中,通过在感知加权域中求输入语音和合成语音之间的最小均方差搜索最佳音调和创新参数。这等价于求加权输入语音和加权合成语音之间的最小误差。
在感知加权滤波器105中计算加权信号sW(n)。传统上,通过具有以下形式的传递函W(z)的加权滤波器计算加权信号sW(n)
W(z)=A(z/γ1)/A(z/γ2) 其中0<γ2<γ1≤1
如业内一般专业人员所熟知,在上述合成分析(AbS)编码器中,分析表明量化误差通过传递函数W-1(z)被加权,该函数是感知加权滤波器105的传递函数的逆。这一结果由B.S.Atal与M.R.Schroedor在“语音的预测编码与主观误差准则”,IEEE Transaction ASSP,vol.27,no.3,pp.247-254,June 1979中描述。传递函数W-1(z)表现出输入语音信号的某种共振峰结构。这样,通过量化误差的成形发挥了人耳的掩饰性质,使得由在出现在共振峰区域强信号能量掩饰的这些区域中有更多的能量。加权量由因子γ1和γ2控制。
以上传统的感知加权滤波器105与电话频带工作良好。然而发现,这种传统的感知加权滤波器105不适于宽带信号的有效的感知加权。还发现,传统的感知加权滤波器105在同时对共振峰结构和所需的频谱倾斜建模中存在固有的限制。频谱倾斜在宽带信号中由于低和高频之间宽的动态范围而更为明显。为了解决这一问题,已经建议向W(z)添加倾斜滤波器,以便分开控制宽带输入信号的倾斜和共振峰加权。
对此问题的最好解决办法是在输入引入预加重滤波器103,基于预加重语音s(n)计算LP滤波器A(z),并通过固定其分母使用修改的滤波器W(z)。
在模块104中就预加重信号s(n)进行LP分析,以获得LP滤波器A(z)。而且,使用新的分母固定的感知加权滤波器105。用于这一感知加权滤波器104的传递函数的一个例子由以下关系给出
W(z)=A(z/γ1)/(1-γ2z-1) 其中0<γ2<γ1≤1
在分母中可用使用更高阶。这一结构基本上使共振峰加权与倾斜去耦合。
注意,因为A(z)是基于预加重语音信号s(n)计算的,与A(z)基于原始语音计算时的情形比较,滤波器1/A(z/γ1)的倾斜表现较少。由于在解码器端使用具有以下传递函数的滤波器进行去加重
P-1(z)=1/(1-μz-1),
量化误差频谱由具有传递函数W-1(z)P-1(z)的滤波器成形。当一般情形下设置γ1等于μ时,量化误差的频谱由其传递函数为1/A(z/γ1)的滤波器成形,A(z)是基于预加重语音信号计算的。除了易于实现定点算法的优点之外,主观收听表明,对于通过预加重和修改的加权滤波组合而实现误差成形的这一结构,对于进行宽带信号编码是很有效的。
音调分析
为了简化音调分析,首先使用加权的语音信号Sw(n)在开环音调搜索模块106中估计开环音调滞后TOL。然后把在闭环音调搜索模块107中基于子帧进行的闭环音调分析,限制在开环音调滞后TOL周围,这显著降低了LTP参数T和b(音调滞后和音调增益)的搜索复杂性。开环音调分析通常使用业内专业人员所熟知的技术,在模块106中每10ms(两个子帧)进行一次。
首先计算用于LTP(长期预测)分析的目标向量x。这通常通过从加权的语音信号Sw(n)中加权的合成滤波器W(z)/
(z)的零输入响应s0进行。这一零输入响应s0是通过零输入响应计算器108计算的。更具体来说,目标向量x使用以下关系计算
x=sW-s0
其中x是N-维目标向量,sW是子帧中的加权语音向量,而s0是滤波器W(z)/
(z)的零输入响应,这是组合的滤波器W(z)/
(z)在其初始状态的输出。零输入响应计算器108响应来自LP分析、量化和内插计算器104的量化内插LP滤波器
(z),并响应存储在存储器模块111的加权合成滤波器W(z)/
(z)的初始状态,计算W(z)/
(z)的零输入响应s0(即对通过设置输入等于零所确定的初始状态的响应部分)。这一运算对于一般业内专业人员是熟知的,因而不再说明。
当然,可用使用其他的在数学上是等价的方法来计算目标向量x。
在脉冲响应发生器109中使用来自模块104的LP滤波器系数A(z)和
(z),计算加权合成滤波器W(z)/
(z)的N-维脉冲响应向量h。这一运算也是业内一般专业人员所熟知的,因而本说明书中不作进一步的说明。
在闭环音调搜索模块107中计算闭环音调(或音调码本)参数b,T和j,这使用目标向量x,脉冲响应向量h和开环音调滞后TOL作为输入。传统上,音调预测已由具有以下传递函数的音调滤波器表示
1/(1-bz-T)
其中b是音调增益,T是音调延迟或滞后。这种情形下,对激发信号u(n)的音调贡献由bu(n-T)给出,其中整个的激发由以下给出
u(n)=bu(n-T)+gck(n)
g是创新码本增益而ck(n)是在索引k处的创新码向量。
如果音调滞后T比子帧长度N短,则这表示式有限制。在另一表示式中,音调贡献能够被看作是包含过去激发信号的音调码本。一般来说,音调码本中的每一向量是前一向量移动一的版本(抛弃一个样本并添加一新的样本)。对于音调滞后T>N,音调码本等价于滤波器结构(1/(1-bz-1)),且在音调滞后T的音调码本向量vT(n)由以下给出
vT(n)=u(n-T)n=0,...,N-1.
对于比N短的音调滞后T,通过重复从过去激发到该向量完成的可用样本建立向量vT(n)(这不等价于滤波器结构)。
在最近的编码器中,使用较高的音调分辨率,这可以显著改进话音段的质量。这是通过使用多相位内插滤波器对过去的激发信号过采样实现的。这种情形下,向量vT(n)通常对应于过去激发的内插版本,音调滞后T是非整数延迟(例如,50.25)。
音调搜索在于寻求使目标向量x与标度的被滤波的过去激发之间均方加权误差最小化的最佳音调滞后T与增益b。误差E表示如下
E=‖x-byT‖2其中yT是在音调滞后T的被滤波音调码本向量能够看到,误差E通过使以下搜索准则最小化而被最小化
其中t表示向量转置。
在一优选实施例中,使用1/3子样本音调分辨率,且音调(音调码本)搜索由三阶段组成。
在第一阶段,在开环音调搜索模块106响应加权的语音信号sW(n)估计开环音调滞后TOL。如以上说明中所指出,使用业内专业人员所熟知的技术,这一开环音调分析通常每10ms(两个子帧)进行一次。
在第二阶段,在闭环音调进行搜索模块107中对于围绕估计的开环音调滞后TOL(通常为±5)的整数音调滞后进行搜索准则C的搜索,这将显著简化搜索过程。以下的说明提出用于更新被滤波的码向量yT无需对每一音调滞后计算卷积的一简单的过程。
一旦在第二阶段找到最优整数音调滞后,搜索的第三阶段(模块107)测试在该最优整数音调滞后周围的分数。
当音调预测器由对于音调滞后T>N是有效的假设的形式为1/(1-bz-T)的滤波器表示时,音调滤波器的频谱在整个频率范围表现为具有与1/T相关的谐波频率的谐波结构。在宽带信号的情形下,这一结构不是很有效的,因为宽带信号中的谐波结构不覆盖整个扩展频谱。谐波结构只是在与语音段相关的一定的频率才存在。这样,为了获得在宽带语音的话音段音调贡献的有效表示,音调预测滤波器必须具有在宽带频谱上变化的周期量的灵活性。
在本说明书中公开了能够对宽带信号语音频谱的谐波结构有效建模的改进方法,由此对过去的激发使用了几种形式低通滤波器,并选择了带有较高预测增益的低通滤波器。
当使用子样本音调分辨率时,低通滤波器可结合到用来获得较高音调分辨率的内插滤波器中。这种情形下,对于具有不同低通特性的几个内插滤波器重复音调搜索的第三阶段,在该阶段测试所选择的整数音调滞后的周围的分数,并选择使搜索准则C最小化的分数及滤波器索引。
一种较简单的方法是为了完成上述第三阶段的搜索,以便只使用带有一定频率响应的一个内插滤波器确定最优分数音调滞后,并在结束时通过对选择的音调码本向量VT使用不同的预定的低通滤波器选择最优低通滤波器形状,并选择使音调预测误差最小化的低通滤波器。以下详细讨论该方法。
图3表示所提出的后一种方法的优选实施例的示意框图。
在存储器模块303中存储过去激发信号u(n),n<0。音调码本搜索模块301响应来自存储器模块303的目标向量x,开环音调滞后TOL及过去激发信号u(n),n<0,以进行使以上定义的搜索准则C最小化的音调码本(音调码本)搜索。由在模块301进行的搜索的结果,模块302产生最优音调码本向量vT。注意由于使用了子样本音调分辨率(分数音调),过去激发信号u(n),n<0是内插的,且音调码本向量vT对应于内插的过去激发信号。在本优选实施例中,内插滤波器(在模块301中,但未示出)具有除去7000Hz以上频率成分的低通滤波器特性。
本优选实施例中,使用K滤波器特性;这些滤波器特性可以是低通或带通滤波器特性。一旦确定了最优码向量vT并由音调码向量产生器302提供,就使用K个不同频率形状滤波器,诸如305(j),其中j=1,2,...,K分别计算vT的K个滤波版本。这些滤波版本标记为vf(j),其中j=1,2,...,K。不同的向量vf(j)在各模块304(j)中以脉冲响应h进行卷积处理,其中j=0,1,2,...,K,以获得向量y(j),其中j=0,1,2,...,K。为了对每一向量y(j)计算均方音调预测误差,借助于对应的放大器307(j)使值y(j)乘以增益b,并通过对应的减法器308(j)从目标向量x中减去值by(j)。选择器309选择频率形状滤波器305(j),该滤波器使以下均方音调预测误差最小化
e(j)=‖x-b(j)y(j)‖2,j=1,2,...,K
为了对y(j)的每一值计算均方音调预测误差e(j),借助于对应的放大器307(j)使值y(j)乘以增益b,并通过减法器308(j)从目标向量x中减去值b(j)y(j)。在与索引j的频率形状滤波器相关的对应的增益计算器306(j)中使用以下关系式,计算每一增益b(j)
b(j)=xty(j)/‖y(j)‖2.
在选择器309中,基于使均方音调预测误差e最小化的vT或vf(j)选择参数b,T,及j。
返回来参见图1,对音调码本索引T编码并发送给多路复用器112。量化音调增益b并发送给多路复用器112。使用这一新方法,需要额外的信息对于在多路复用器112中选择的频率形状滤波器的索引j编码。例如,如果使用三个滤波器(j=0,1,2,3),则需要两位表示这一信息。滤波器的索引信息j还能够与音调增益b结合编码。
创新码本
一旦确定了音调或LTP(长期预测)参数b,T和j,下一步是要借助于图1的搜索模块110搜索最优创新激发。首先,通过减去LTP贡献部分更新目标向量x
x2=x-byT
其中b是音调增益,yT是滤波的音调码本向量(如参照图3所述,在延迟T处以选择的低通滤波器滤波并以脉冲响应h卷积的过去激发)。
通过寻求使目标向量与标度滤波码向量之间的均方误差最小化的最优激发码向量ck及增益g,进行CELP中的搜索过程
E=‖x2-gHCk‖2
其中H是从脉冲响应向量h推导的较低的三角形卷积矩阵。
值得注意的是,根据US专利No.5,444,816,使用的创新码本是由后随自适应前置滤波器F(z)的代数码本组成的一种动态码本,该前置滤波器增强特定频谱成分以便改进合成语音质量。可以使用不同的方法来设计这个前置滤波器。这里,使用与宽带信号相关的设计,从而F(z)由两部分组成周期性增强部分1/(1-0.85z-T)和倾斜部分(1-β1z-1),其中T是音调滞后的整数部分,β1与先前的子帧发音相关并以
为界。注意,在码本搜索之前,脉冲响应h(n)必须包含前置滤波器F(z)。这就是,
h(n)←h(n)+βh(n-T)
创新码本搜索所最好借助于以下文献中描述的代数码本在模块110中进行US专利No5,444,816(Adoul等人),1995年8月22日颁发;1997年12月17日授予Adoul等人的5,699,482;1998年5月19日授予Adoul等人的5,754,976;以及5,701,392(Adoul等人),日期1997年12月23日。
有很多设计代数码本的方法。在这里所述的实施例中,代数码本由具有Np非零振幅脉冲(或简言之非零脉冲)pj的码向量组成。
分别称mj和βj为第j个非零脉冲的位置和振幅。将假设振幅βj是已知的,因为或者第j个振幅是固定的,或者因为在码本搜索之前存在某个选择βj的方法。根据上述US专利No.5,754,976所述的方法进行脉冲振幅的预选择。
称“踪迹i”,标记Ti为第i个非零脉冲能够占据的0与N-1之间的位置pi集合。以下假设N=64给出踪迹的某些典型的集合。
在US专利No.5,444,816中已经引入了几个设计例子,并称为“交错单脉冲置换”(ISPP)。这些例子基于长度N=40个样本的码向量。
这里基于长度N=64的码向量及表1给出的“交错单脉冲置换”结构ISPP(64,4),给出新的设计例子。表1ISPP(64,4)设计
在该ISPP(64,4)设计中,64个位置的集合划分为每一个为60/4=16有效位置的4个交错踪迹。需要四位规定给定的非零脉冲的16=24个有效位置。有很多推导码本结构的方法,而这一ISPP设计是在脉冲数或编码位上适应特定需要。基于这一结构通过改变非零脉冲能够放入每一踪迹的数目能够设计出几种码本。
如果单一正负号的非零脉冲放置在每一踪迹中,以4位对脉冲位置编码,并且其符号(如果考虑每一非零脉冲能够或为正或为负)以1位编码。因而,对于这种特定的代数码本结构,总共需要4×(4+1)=20编码位指定脉冲位置和正负号。
如果两个指定正负号的非零脉冲放置在每一踪迹中,以8位对2脉冲位置编码,通过采用脉冲排序它们对应的正负号可以只用1位编码(对此本说明书稍后将详细说明)。因而,对于这种特定的代数码本结构,总共需要4×(4+4+1)=36编码位指定脉冲位置和正负号。
通过在每一踪迹中放置3,4,5或6个非零脉冲,能够设计其它码本结构。对这种结构中脉冲位置和正负号有效编码的方法将在稍后公开。
进而,通过在不同踪迹中放置不等数目的非零脉冲,或通过忽略一定的踪迹或联合一定的踪迹,能够设计其它码本。例如,通过在踪迹T0和T2中放置3个非零脉冲,在踪迹T1和T3中放置2个非零脉冲(13+9+13+9=42位码本),能够设计一种码本。考虑联合踪迹T1和T3,并在踪迹T0、T2和T2-T3中放置非零脉冲能够设计其它码本。
可以看到,围绕ISPP设计的总论题,能够建立各种各样的码本。
脉冲位置和符号的有效编码(码本索引)
这里,考虑每踪迹放置从1到6个有符号的非零脉冲的几种情形,并公开对给定踪迹中的脉冲位置和符号有效地联合编码的方法。
首先将给出对每踪迹1个非零脉冲和2个非零脉冲编码的例子。对每踪迹1个有符号非零脉冲编码是直接的,对每踪迹2个有符号非零脉冲编码已经在文献中描述,即在EFR语音编码标准中(全球移动通信系统,GSM06.60,“数字蜂窝式通信系统;增强的全速率(EFR)语音代码转换,”欧洲远程通信标准学会,1996)。
在对2个有符号非零脉冲编码方法已表述之后,将公开对于每踪迹3,4,5和6个有符号非零脉冲有效编码的方法。
对每踪迹1个有符号脉冲编码
在长度为K的踪迹中,一个有符号非零脉冲需要用于符号的1位和用于位置的log2(K)位。这里将考虑K=2M的特别情形,就是说需要M位对脉冲位置进行编码。这样,对于长度K=2M的一个踪迹中一个有符号非零脉冲需要总共M+1位。在这一优选实施例中,如果非零脉冲为正,则设置表示符号(符号索引)的位为0,如果非零脉冲为负,则设置为1。当然,也可以使用相反的标记法。
通过子帧中脉冲的位置除以(整数除法)在踪迹中的脉冲间隔给出一定的踪迹中脉冲的位置索引。通过这一整数除法的余数找到踪迹的索引。取表1的例子ISPP(64,4),子帧的大小为64(0-63),脉冲间隔为4。子帧位置25处的脉冲有25 DIV 4=6的位置索引和25 MOD 4=1的踪迹索引,其中DIV表示整数除法,MOD表示除法余数。类似地,在子帧位置40的脉冲具有位置索引10和踪迹索引0。
在长度2M的踪迹中位置索引为p而符号索引为s的一个有符号非零脉冲的索引由以下给出
I1p=p+s×2M.对于K=16(M=4位)的情形,有符号脉冲的5-位索引在下表中表示
过程code_1pulse(p,s,M)示出如何对长度为2M的踪迹中的位置索引p和符号索引s的脉冲编码。过程1使用M+1位对长度K=2M的踪迹中1个有符号非零脉冲编码。对每踪迹2个有符号脉冲编码
在K=2M个潜在位置的每踪迹中两个非零脉冲的情下,每一脉冲需要1位用于符号,M位用于位置,这给出总共2M+2位。然而,由于没有价值的脉冲排序存在某些冗余性。例如,在位置p处放置第一个脉冲与在位置q处放置第二个脉冲是和在位置q处放置第一个脉冲与在位置p放置第二个脉冲等价的。通过只对一个符号编码并从索引中位置排序减少第二个符号能够节省一位。在本优选实施例中,索引由以下给出
I2p=p1+p0×2M+s×22M
其中s是在位置索引p0的非零脉冲的符号索引。
在编码器处,如果两个符号相等,则较小的位置设置为p0而较大的位置设置为p1。另一方面,如果两个符号不相等,则较大的位置设置为p0,而较小的位置设置为p1。
在解码器处,在位置p0处的非零脉冲的符号是可用的。由于脉冲排序减少了第二个符号。如果位置p1小于位置p0,则位置p1处的非零脉冲的符号与位置p0处的非零脉冲的符号相反。如果位置p1大于位置p0,则位置p1处的非零脉冲的符号与位置p0处的非零脉冲的符号相同。
在这一优选实施例中,索引中的位的排序表示如下。s对应于非零脉冲p0的符号。
用于对位置索引p0和p1符号索引σ0和σ1的两个非零脉冲编码的过程示于图5。这进而在以下过程2中说明。
过程2使用2M+1位对长度K=2M的踪迹中2个有符号的非零脉冲编码。对每踪迹3个有符号脉冲编码
在每踪迹三个非零脉冲的情形下,能够使用与两个非零脉冲的情形下类似的逻辑。对于有2M个位置的踪迹,需要3M+l位而不是3M+3位。本说明书中所公开的索引非零脉冲的简单方法,是把踪迹的位置分为两半(或部分),并标识包含至少两个非零脉冲的一半。每一部分中的位置数是K/2=2M/2=2M-1,这可用M-1位表示。对在至少包含两个非零脉冲的部分中的两个非零脉冲以需要2(M-1)+1位的过程code_2pulse([p0,p1],[s0,s1],M-1)编码,可能在踪迹中(两个部分的任一部分)中任何位置的其余脉冲以需要M+1位的过程code_1pulse(p,s,M)编码。最后,包含两个非零脉冲部分的索引由1位编码。这样,所需的总位数为2(M-1)+1+M+1+1=3M+1。
检验两个非零脉冲是否位于踪迹的同一半的简单方法,是通过检验它们的位置索引的最高有效位(MSB)是否相等来进行。为此通过异或逻辑运算能够简单地实现,该逻辑运算如果MSB相等给出0,否则给出1。注意,MSB=0意思是说该位置属于踪迹的下半(0-(K/2-1)),而MSB=1意思是说它属于踪迹的上半(K/2-(K-1))。如果两个非零脉冲属于上半,在使用2(M-1)+1位对它们编码之前它们需要移动到范围(0-(K/2-1))。通过以由M-1个一(1)(对应于数目2M-1-1)组成的掩码掩盖M-1个最低有效位(LSB)能够实现这点。
对在位置索引p0,p1,p2和符号索引σ0,σ1和σ2的3个脉冲编码的过程在以下过程中说明。过程code_3pulse([p0p1p2],[σ0σ1σ2],M)开始
if MSB(p0)×OR MSB(p1)=0(如果位置在同一半)
p0=p0 AND(2M-1-1)(掩盖M-1 LSBs)
p1=p1 AND(2M-1-1)(掩盖M-1 LSBs)
i2p=code_2pulse([p0p1],[σ0σ1],M-1)
i1p=code_1pulse(p2,σ2,M)
i3p=i2p+MSB(p0)×22M-1+i1p×22M
Else if MSB(p0)×OR MSB(p2)=0
p0=p0 AND(2M-1-1)
p2=p2 AND(2M-1-1)
i2p=code_2pulse([p0p2],[σ0σ2],M-1)
i1p=code_1pulse[p1,σ1,M)
i3p=i2p+MSB(p0)×22M-1+i1p×22M
Else(如果位置p1和p2在同一半)
p1=p1 AND(2M-1-1)
p2=p2 AND(2M-1-1)
i2p=code_2pulse([p1p2],[σ1σ2],M-1)
i1p=code_1pulse(p0,σ0,M)
i3p=i2p+MSB(p1)×22M-1+i1p×22M结束
过程3使用3M+1位对长度K=2M的踪迹中3个有符号的脉冲编码。
以下表格示出根据本优选实施例对于M=4(K=16)的情形在13-位索引中位的分布。
对每踪迹4个有符号的脉冲编码
对长度为K=2M的踪迹中4个有符号非零脉冲能够使用4M位进行编码。
与3个脉冲的情形类似,踪迹中的K个位置被划分为2部分(两半),每一部分包含K/2个脉冲位置。这里把这两个部分标记为位置0到K/-1的部分A和位置K/2到K-1的部分B。每一部分能够包含从0到4个非零脉冲。以下的表格示出表示每一部分中可能的脉冲数的5种情形
在情形0或4,可使用4(M-1)+1=4M-3位对长度K/2=2M-1的部分的4个脉冲编码(这将在稍后说明)。
在情形1或3,能够以M-1+1=M位对长度K/2=2M-1的部分中的1个脉冲编码,并能够以3(M-1)+1=3M-2位对其它部分中的3个脉冲编码。这给出总共M+3M-2=4M-2位。
在情形2,可用使用2(M-1)+1=2M-1位对长度K/2=2M-1的部分中的脉冲编码。这样,对于两个部分,需要2(2M-1)=4M-2位。
现在,假设情形0和4组合,可用使用2位(4种可能的情形)对索引进行编码。那么,对于1,2或3所需的位数是4M-2。这给出总共4M-2+2=4M位。对于0或4,需要1位标识每一种情形,因而需要4M-3位对该部分中的4个脉冲编码。添加对于一般情形所需的2位,这给出总共1+4M-3+2=4M位。
这样,从以上说明可见,能够以总共4M位对4个脉冲编码。
使用4M位对长度K=2M的踪迹中4个有符号的非零脉冲的编码过程示于以下过程4。
根据本优选实施例,以下的4个表示出对于上述不同情形索引中位的分布,其中M=4(K=16)。这种情形下,对每踪迹4个有符号脉冲编码需要16位。情形0或4情形1情形2情形3过程code-4pulse([p0p1p2p3],[σ0σ1σ2σ3 ],M)开始
找出NA(部分A中的脉冲数)和NB(部分B中的脉冲数)
if NA=0 and NB=4
i4p_B=code_4pulse_Section([p0p1p2p3],[σ0σ1σ2σ3],M-1)
k=1(标识包含4个脉冲的部分的位)
iAB=i4p_B+k×24M-3(总共4M-2位)
if NA=1 and NB=3
i1p_A=code_1pulse(p,σ,M-1)(M位)
i3p_B=code_3pulse([p0p1p2],[σ0σ1σ2],M-1)(3(M-1)+1位)
iAB=i3p_B+i1p_A×23(M-1)+1(总共4M-2位)
if NA=2 and NB=2
i2p_A=code_2pulse([p0p1],[σ0σ1],M-1)(2(M-1)+1位)
i2p_B=code_2pulse([p2p3],[σ2σ3],M-1)(2(M-1)+1位)
iAB=i2p_B+i2p_A×22(M-1)+1(总共4M-2位)
if NA=3 and NB=1
i1p_A=code_1pulse(p,σ,M-1)(M位)
i3p_B=code_3pulse([p0p1p2],[σ0σ1σ2],M-1)(3(M-1)+1位)
iAB=i1p_B+i3p_A×2M(总共4M-2位)
if NA=4 and NB=0
i4p_A=code_4pulse_Section([p0p1p2p3],[σ0σ1σ2σ3],M-1)
k=0(标识包含4个脉冲的部分的位)
iAB=i4p_A+k×24M-3(总共4M-2位)
Case=NA
if NA=4case=0(结合情形0和4,使得“情形”需要2位)
i4p=iAB+case×24M-2(总共4M位)
过程4使用4M位对长度K=2M的踪迹中4个有符号非零脉冲编码。
注意,对于情形0或1,其中4个非零脉冲在同一部分,需要4(M-1)+1=4M-3位。对于长度K/2=2M-1位部分中4个非零脉冲编码可使用一种简单的方法进行。进而通过把该部分划分为长度K/4=2M-2位的2个子部分进行;标识至少包含2个非零脉冲的子部分;使用2(M-2)+1=2M-3位对在该子部分的2个非零脉冲编码;使用1位对包含至少2的非零脉冲的子部分的索引编码;并使用2(M-1)+1=2M-1位对其余2个非零脉冲编码,假设它们在该部分任何地方。这给出总共(2M-3)+(1)+(2M-1)=4M-3位。
使用4M-3位对长度为K/2=2M-1部分中的4个有符号非零脉冲编码示于过程4_Section中。
过程code_4pulse_Section([p0p1p2p3],[σ0σ1σ2σ3],M-1)
开始
if MSB(p0)XOR MSB(p1)=0(如果位置在同一部分)
p0=p0 AND(2M-2-1)(掩盖M-2 LSBs)
p1=p1 AND(2M-2-1)(掩盖M-2 LSBs)
i2p_subsec=code_2pulse([p0p1],[σ0σ1],M-2)(2M-3位)
i2p_sec=code_2pulse([p2p3],[σ2σ3],M-1)(2M-1位)
i4p_sec=i2p_subsec+MSB(p0)×22M-3+i2p_sec×22(M-1)
Else if MSB(p0)XOR MSB(p2)=0
p0=p0 AND(2M-2-1)
p2=p2 AND(2M-2-1)
i2p_subsec=code_2pulse([p0p2],[σ0σ2],M-2)(2M-3位)
i2p_sec=code_2pulse([p1p3],[σ1σ3],M-1)(2M-1位)
i4p_sec=i2p_subsec+MSB(p0)×22M-3+i2p_sec×22(M-1)Else
p1=p1 AND(2M-2-1)
p2=p2 AND(2M-2-1)
i2p_subsec=code_2pulse([p1p2],[σ1σ2],M-2)(2M-3位)
i2p_sec=code_2pulse([p0p3],[σ0σ3],M-1)(2M-1位)
i4p_sec=i2p_subsec+MSB(p1)×22M-3+i2p_sec×22(M-1)结束
过程4_Section使用4M-3位对长度为K/2=2M-1部分中的4个有符号脉冲编码。
对每踪迹5个有符号的脉冲编码
能够使用5M位对长度K=2M的踪迹中5个有符号非零脉冲编码。
与4个非零脉冲的情形类似,踪迹中的K个位置被划分为2部分(两半),每个部分包含K/2位置。这里,把位置0到K/2-1的部分标记为部分A,把位置K/2到K-1的部分标记为部分B。每一部分可包含从0到5个脉冲。以下表格示出表示每一部分中可能的脉冲数的6种情形。
在情形0,1和2中,在部分B中至少有3个非零脉冲。另一方面,在情形3,4和5中,部分A中至少有3个脉冲。这样,对5个非零脉冲编码的简单的方法是,使用需要3(M-1)+1=3M-2位的过程3对在相同部分中的3个非零脉冲编码,并使用需要2M+1位的过程2对其余的2个脉冲编码。这给出5M-1位。需要额外的位以便标识包含至少3个非零脉冲的部分(情形(0,1,2)或情形(3,4,5))。这样,需要总共5M位对5个有符号的非零脉冲编码。
使用5M位对长度K=2M的踪迹中的5个有符号的脉冲编码的过程示于以下的过程5。
以下2个表根据M=4(K=16)的优选实施例,对于上述不同情形示出索引中的位的分布。这种情形下,对每踪迹5个有符号的非零脉冲编码需要20位。情形0,1和2情形3,4和5过程code_5pulse([p0p1p2p3p4],[σ0σ1σ2σ3σ4],M)开始
找出NA(部分A中的脉冲数)及NB(部分B中的脉冲数)
ifNA=0 and NB=5
i3p=code_3pulse([pB0pB1pB2],[σB0σB1σB2],M-1)(3(M-1)+1位)
i2p=code_2pulse([pB3pB4],[σB3σB4],M)(2M+1位)
ifNA=1 and NB=4
i3p=code_3pulse([pB0pB1pB2],[σB0σB1σB2],M-1)(3(M-1)+1位)
i2p=code_2pulse([pB3pA0],[σB3σA0],M)(2M+1位)ifNA=2 and NB=3
i3p=code_3pulse([pB0pB1pB2],[σB0σB1σB2],M-1)(3(M-1)+1位)
i2p=code_2pulse([pA0pA1],[σA0σA1],M)(2M+1位)ifNA=3 and NB=2
i3p=code_3pulse([pA0pA1pA2],[σA0σA1σA2],M-1)(3(M-1)+1位)
i2p=code_2pulse([pB0pB1],[σB0σB1],M)(2M+1位)ifNA=4 and NB=1
i3p=code_3pulse([pA0pA1pA2],[σA0σA1σA2],M-1(3(M-1)+1位)
i2p=code_2pulse([pA3pB0],[σA3σB0],M)(2M+1位)ifNA=5 and NB=0
i3p=code_3pulse([pA0pA1pA2],[σA0σA1σA2],M-1)(3(M-1)+1位)
i2p=code_2pulse([pA3pA4],[σA3σA4],M)(2M+1位)if NA<3 k=1 else k=0(标识有最少3个脉冲的部分)i5p=i2p+i3p×22M+k×25M-1(总共5M位)过程5使用5M位对长度K=2M的踪迹中5个有符号脉冲编码。对每踪迹6个有符号脉冲编码
在本实施例中使用6M-2位对长度K=2M的踪迹中的6个有符号脉冲编码。
与5个脉冲的情形类似,踪迹中的K个位置被划分为每部分包含K/2个位置的2个部分(两半)。这里把位置0到K/2-1的部分标记为部分A,位置K/2到K-1的部分标记为部分B。每一部分可包含从0到6个脉冲。以下表格示出表示每一部分中可能的脉冲数的7种情形。
注意,情形0和6是类似的,所不同的是6个非零脉冲在不同的部分。类似地,情形1和5以及情形2和4之间的差别是包含较多的脉冲的部分。因而,能够使这些情形配对,并可指定额外的位以标识包含较多脉冲的部分。由于这些情形最初需要6M-5位,将表示部分的位考虑在内,配对的情形需要6M-4位。
这样,现在有4种配对的状态,对这些状态需要2个额外的位。对于6个有符号的非零脉冲,这给出总共6M-4+2=6M-2位。配对的情形示于下表。
在情形0或6中,需要1位标识包含6个非零脉冲的部分。使用需要5(M-1)位的过程5对该部分中5个非零脉冲编码(因为脉冲被限制在该部分中),而使用需要1+(M+1)位的过程1对其余的脉冲编码。这样对于这种配对的情形总共需要1+5(M-1)+M=6M-4位。需要额外的2位对配对的情形的状态编码,这样给出总共6M-2位。
在情形1或5中,需要1位标识包含5个脉冲的部分。使用需要5(M-1)位的过程5对该部分的中的5个脉冲编码,并使用需要1+(M+1)位的过程1对其它部分的脉冲编码。这样,对于这些配对的情形需要总共1+5(M-1)+M=6M-4位。需要额外的2位对配对的情形的状态编码,给出总共6M-2位。
情形2或4中,需要1位标识包含4个非零脉冲的的部分。使用需要4(M-1)位的过程4对该部分的中的4个脉冲编码,并使用需要1+2(M-1)位的过程2对其它部分的2个脉冲编码。这样,对于这些配对的情形需要总共1+4(M-1)+1+2(M-1)=6M-4位。需要额外的2位对情形的状态编码,给出总共6M-2位。
在情形3中,使用需要每部分3(M-1)+1位的过程3对每一部分的中的3个非零脉冲编码。对于两个部分这给出6M-4位。需要额外的2位对情形的状态编码,这给出总共6M-2位。
使用6M-2位对长度K=2M的踪迹中的6个有符号非零脉冲编码的过程示于以下过程6。
以下两个表示出根据M=4(K=16)的优选实施例,上述不同情形的索引中位的分布。情形0和6情形1和5情形2和4情形3
过程code_6pulse([p0p1p2p3p4p5],[σ0σ1σ2σ3σ4σ5],M)
开始
找出NA(部分A中的脉冲数)及NB(部分B中的脉冲数)
ifNA=0 and NB=6
i5p=code_5pulse([pB0pB1pB2pB3pB4],[σB0σB1σB2σB3σB4],M-1)
i1p=code_1pulse([pB5σB5,M-1](M位)
iAB=i1p+i5p×2M+1×26M-5(M+(5M-5)+1位)if NA=1 and NB=5
i5p=code_5pulse([pB0pB1pB2pB3pB4],[σB0σB1σB2σB3σB4],M-1)
i1p=code_1pulse([pA0σA0,M-1](M位)
iAB=i1p+i5p×2M+1×26M-5(M+(5M-5)+1位)ifNA=2 and NB=4
i4p=code_4pulse([pB0pB1pB2pB3],[σB0σB1σB2σB3],M-1)(4(M-1)位)
i2p=code_2pulse([pA0pA1],[σA0σA1]M-1)(2(M-1)+1位)
iAB=i2p+i4p×22(M-1)+1+1×26M-5((2M-1)+(4M-4)+1位)if NA=3 and NB=3
i3pA=code_3pulse([pA0pA1pA2],[σA0σA1σA2],M-1)(3(M-1)+1位)
i2pB=code_3pulse([pB0pB1pB2],[σB0σB1σB2],M-1)(3(M-1)+1位)
iAB=i3pB+i3pA×23(M-1)+1(3(M-1)+1+3(M-1)+1位)if NA=4 and NB=2
i4p=code_4pulse([pA0pA1pA2pA3],[σA0σA1σA2σA3],M-1)(4(M-1)位)
i2p=code_2pulse([pB0pB1],[σB0σB1] M-1)(2(M-1)+1位)
iAB=i2p+i4p×22(M-1)+1+0×26M-5((2M-1)+(4M-4)+1位)if NA=5 and NB=1
i5p=code_5pulse([pA0pA1pA2pA3pA3],[σA0σA1σA2σA3pA4],M-1)i1p=code_1pulse(pB0,σB0,M-1)(M位)
iAB=i1p+i5p×2M+0×26M-5(M+(5M-5)+1位)
if NA=6 and NB=0
i5p=code_5pulse([pA0pA1pA2pA3pA3],[σA0σA1σA2σA3pA4],M-1)
i1p=code_1pulse(pA5σA5M-1)(M位)
iAB=i1p+i5p×2M+0×26M-5(M+(5M-5)+1位)
ifNA<4 k=NA else k=6-NA(找到配对情形的4种状态)
i6p=iAB+k×26M-4(总共6M-2位)结束
过程6使用6M-2位对长度K=2M的踪迹中6个有符号脉冲编码。
基于ISPP(64,4)的码本结构的例子
这里,基于上述ISPP(64,4)设计提出不同的码本设计例子。踪迹的大小是K=16,需要每踪迹M=4位。通过改变每踪迹非零脉冲数获得不同设计的例子。以下描述8种可能设计。通过选择每踪迹非零脉冲的不同组合能够易于获得其它码本结构。
设计1每踪迹1个脉冲(20位码本)
这例子中,每一非零脉冲需要(4+1)位(过程1),对于4个踪迹中的4个脉冲给出总共20位。
设计2每踪迹2个脉冲(36位码本)
这例子中,每一踪迹中的两个非零脉冲需要(4+4+1)=9位(过程2),对于4个踪迹中的8个脉冲给出总共36位。
设计3每踪迹3个脉冲(52位码本)
这例子中,每一踪迹中的3个非零脉冲需要(3×4+1)=13位(过程3),对于4个踪迹中的12个脉冲给出总共52位。
设计4每踪迹4个脉冲(64位码本)
这例子中,每一踪迹中的4个非零脉冲需要(4×4)=16位(过程4),对于4个踪迹中的16个脉冲给出总共64位。
设计5每踪迹5个脉冲(80位码本)
这例子中,每一踪迹中的5个非零脉冲需要(5×4)=20位(过程5),对于4个踪迹中的20个非零脉冲给出总共80位。
设计6每踪迹6个脉冲(88位码本)
这例子中,每一踪迹中的6个非零脉冲需要(6×4-2)=22位(过程6),对于4个踪迹中的24个非零脉冲给出总共88位。
设计7踪迹T0和T2中3个脉冲及踪迹T1和T3中2个脉冲(44位码本)
这例子中,3个非零脉冲踪迹T0和T2每踪迹需要(3×4-1)=13位(过程3),而踪迹T1和T3中2个非零脉冲每踪迹需要(1+4+4)=9位(过程2)。对于4踪迹中10个非零脉冲这给出总共(13+9+13+9)=44位。
设计8踪迹T0和T2中5个脉冲及踪迹T1和T3中4个脉冲(72位码本)
这例子中,5个非零脉冲踪迹T0和T2每踪迹需要(5×4)=20位(过程5),而踪迹T1和T3中4个脉冲每踪迹需要(4×4)=16位(过程4)。对于4踪迹中18个非零脉冲这给出总共(20+16+20+16)=72位。
码本搜索
本优选实施例中,使用在US专利5,701,392中描述的深度优先搜索的特别方法,由此显著降低了对存储矩阵HtH(这将在稍后定义)元素的存储器需求。这一矩阵包含脉冲响应h(n)的自相关,这对于进行搜索过程是必须的。本优选实施例中,只计算并存储这矩阵的一部分,其余部分在搜索过程中在线计算。
通过找到使目标向量与标度滤波的码向量之间的均方差达到最小的最优激发码向量ck和增益g来搜索代数码本
E=‖x2-gHck‖2
这里H是从脉冲响应向量h推导的下三角形卷积矩阵。矩阵H定义为有对角线h(0)和下三角形h(1),...,h(N-1)的下三角形Toeplitz卷积矩阵。
可以证明,通过使以下搜索准则最大化可以使均方加权误差E最小化
这里d=Htx2是目标信号x2(n)与脉冲响应h(n)(也称为向后滤波目标向量)之间的相关性,且Φ=HtH是h(n)的相关性矩阵。
向量d的元素由以下公式计算且对称矩阵Φ的元素由以下公式计算
可在码本搜索之前计算向量d和矩阵Φ。
码本的代数结构允许非常快速的搜索,因为创新向量ck只包含很少非零脉冲。搜索准则Qk的计数器中的相关性由以下给出
这里mi是第i个脉冲的位置,βi是振幅,Np是脉冲数。搜索准则Qk的分母中的能量由以下给出
为了简化搜索过程,通过量化一定的参考信号b(n)预先确定脉冲振幅。可以使用几种方法定义这种参考信号。在本实施例中,b(n)由以下给出
这里Ed=d`d是信号d(n)的能量,而E=r`LTPrLTP是长期预测之后残余信号的信号rLTP(n)能量。标度因子α控制参考信号对d(n)的依存量。
在US专利5,754,976中公开的信号选择脉冲振幅方法中,在位置i的脉冲的符号被设置为等于在该位置的参考信号的符号。为了简化搜索,对信号d(n)和矩阵Φ进行修改以结合预选择符号。设sb(n)标记包含b(n)的符号的向量。修改的信号d`(n)由以下给出d`(n)=sb(n)d(n),n=0,...,N-1且修改的自相关矩阵Φ’由以下给出φ`(i,j)=sb(i)sb(j)φ(i,j),i=0,...,N-1;j=0,...,N-1.现在搜索准则Qk的计数器处的相关性由以下给出且搜索准则Qk的分母的能量由以下给出假设脉冲的振幅已经如上所述选择,现在搜索的目标是要确定Np个脉冲位置的最好集合的码向量。基本的选择准则是上述比率Qk的最大化。
根据US专利5,701,392,为了降低搜索复杂性,一次确定Nm个脉冲的脉冲位置。更精确来说,Np可用的脉冲分别被划分为M个Nm个脉冲的非空子集合,使得N1+N2...+Nm...+NM=Np。对于所考虑的首批J=N1+N2...+Nm-1个脉冲位置的具体选择称为级-m路径或长度J的路径。当只考虑J个相关的脉冲时,对于J个脉冲位置的路径的基本准则是比率Qk(J)。
搜索以子集合#1开始,并根据树结构按相继的子集合进行,由此子集合m在树的第m级被搜索。
在级1搜索的目的是考虑子集合#1的N1个脉冲及它们的有效位置,以便确定一个或数个长度N1的候选路径,它们是在级1的树结点。
考虑Nm个新的脉冲及它们的有效位置,每一m-1级终止结点的路径延长到m级长度N1+N2...+Nm。确定一个或数个候选的延长路径以组成m级结点。
对于所有的m级结点,最好的码向量对应于使给定的准则,例如准则Qk(Np)最大化的长度Np的路径。
在本优选实施例中,在搜索过程中一次总考虑2个脉冲,就是说Nm=2。然而,不假设矩阵Φ是被预计算和存储的,这需要N×N个字(本优选实施例中64×64=4k字)的存储器,而是使用显著降低存储器需求的存储器有效方法。在这一新的方法中,搜索过程是这样进行的,使得只预先计算并存储相关矩阵的所需元素的一部分。这部分与对应于相继的踪迹中潜在的脉冲位置脉冲响应相关性,以及对应于φ(j,j),j=0,...,N-1(即矩阵Φ的主对角线元素)的相关性相关。
作为存储器节省的一个例子,在本优选实施例中,子帧的大小为N=64,这就是说相关性矩阵的大小是64×64=4096。由于在相继的踪迹中搜索脉冲是每次两个脉冲,即踪迹T0-T1,T1-T2,T2-T3,T3-T0,所需的相关性元素是对应于相邻的踪迹中脉冲的元素。由于每一踪迹包含16个潜在的位置,因而存在16×16=256个对应于两个相邻踪迹的相关性元素。这样,使用存储器有效方法,对于相邻踪迹(T0-T1,T1-T2,T2-T3,T3-T0)的四种可能性所需元素为4×256=1024。此外,需要矩阵的对角线中64个相关性。这给出存储需求为1088而不是4096个字。
本优选实施例中使用了深度优选树搜索过程的特定形式,其中在同一时间搜索两个相继的踪迹中的两个脉冲。为了降低复杂性,测试第一个脉冲的潜在位置的有限数。进而,对于有大量脉冲的代数码本,可固定搜索树的较高级中的某些脉冲。
为了智能猜测对于第一个脉冲要考虑哪些潜在的脉冲位置,或为了固定某些脉冲位置,使用基于语音相关信号的“脉冲位置似然估计向量”b。这一估计向量b的第p个分量b(p)刻划了在正在搜索的最好码向量中占据位置p(p=0,...,N-1)的脉冲的概率。
对于给定的踪迹,估计向量b指示每一有效位置的相对概率。这一性质可有利地用作为树结构中前几级的选择准则,以代替基本选择准则Qk(j),该准则为了在选择有效位置中提供可靠的性能,在前面几级运算的脉冲数量总量太少。
在本优选实施例中,估计向量b是用于预选择上述脉冲振幅的相同的参考信号。就是说
其中Ed=d`d是信号d(n)的能量,而E=r`LTPrLTP是作为长期预测之后残余信号的信号rLTP(n)能量。
一旦通过模块110选择了最优激发码向量ck和增益g,就对码本索引k和增益g进行编码并发送到多路复用器112。参见图1,参数b,T,j,
(z),k和g在通过通信信道发送之前通过多路复用器112被多路复用。
存储器更新
在存储器模块111(图1)中,通过加权合成滤波器对激发信号u=gck+bvT滤波而更新加权合成滤波器W(z)/
(z)的状态。滤波之后,存储滤波器的状态,并在下一个子帧中作为初始状态用于在计算器模块108中计算零输入的响应。
如同在目标向量x的情形中那样,也可使用业内专业人员所熟知的其它可替代的但数学上等价的方法,更新滤波器状态。
解码器侧
图2的语音解码器装置200表示在数字输入222(到多路分解器217的输入流)与输出采样的语音223(来自加法器221的sout)之间进行的各步骤。
多路分解器217从数字输入信道接收的二进制信息中提取合成模型参数。从每一接收的二进制帧,提取的参数是-线路225上的短期预测参数(STP)
(z)(每帧一次);
-长期预测参数(LTP)T,b,和j(对于每一子帧);以及
-创新码本索引k和增益g(对于每子帧)。
基于以下将要说明的这些参数合成当前语音信号。
创新码本218响应索引k以产生创新码向量ck,该向量由解码的增益g通过放大器224标度。在优选实施例中,如同上述US专利Nos.5,444,816;5,699,482;5,754,976;以及5,701,392中所述,创新码本218用来表示创新码向量ck。
在放大器224的输出端所产生的标度码向量gck通过创新滤波器205处理。
周期性增强
在放大器224的输出端所产生的标度码向量gck还通过频率相关音调增强器,即创新滤波器205处理。
增强激发信号u的周期性可改进语音段情形的质量。在过去,这是通过形式为1/(1-εbz-1)的滤波器对来自创新码本(固定码本)218的创新向量滤波而进行的,其中ε是控制引入的周期性的量小于0.5的一个因子。在宽带情形下由于在整个频谱引入周期性,这一方法有效性不高。作为本发明的一部分公开了一种替代的新方法,其中通过其频率响应对更加强调较高频率而非较低频率的创新滤波器205(F(z)),对来自创新(固定)码本的创新码向量ck滤波而实现周期性的增强。F(z)的系数与激发信号u的周期性量相关。
业内专业人员所熟知的许多方法可用来获得有效周期性系数。例如,增益b的值提供了周期性的指示。就是说,如果增益b接近1,激发信号u的周期性高,而如果增益b小于0.5,则周期性低。
推导滤波器F(z)系数的另一有效方法是使它们与整个激发信号u中的音调贡献量相关。其结果是频率响应与子帧周期性相关,其中对于较高的音调增益较强地强调(较强的整个倾斜)较高的频率。创新滤波器205有这样的效果,即当激发信号u更周期化时,降低低频的创新码向量ck的能量,这更多地在低频比在高频增强了激发信号u的周期性。对于创新滤波器205的建议形式为
(1)F(z)=1-σz-1或(2)F(z)=-αz+1-αz-1
这里σ或α是从激发信号u的周期性水平推导出的周期性因子。
F(z)的第二个三项形式用于一优选实施例。在话音因子产生器204中计算周期性因子α。有几种方法可用来基于激发信号u的周期性推导周期性因子α。以下展示其两个方法。
方法1
首先通过以下公式在话音因子产生器204中计算音调对整个激发信号u的贡献率
其中vT是音调码本向量,b是音调增益,u是激发信号,u由以下公式在加法器219的输出端给出
u=gck+bvT
注意,项bvT在音调码本(音调码本)201中有其响应音调滞后T及存储在存储器203的u的过去值的来源。然后来自音调码本201的音调码向量vT通过低通滤波器202处理,低通滤波器202的截止频率借助于来自多路分解器217的索引j调节。然后所得的码向量vT通过放大器226乘以来自多路分解器217的增益b,以获得信号bvT。
因子α在话音因子产生器204中由以下公式计算
α=qRp界于α<q
这里q是控制增强量的一因子(本优选实施例中q设置为0.25)。
方法2
计算周期性因子α的另一方法讨论如下。
首先,在话音因子产生器204中按以下公式计算话音因子rv
rv=(Ev-Ec)/(Ev+Ec)
其中Ev是标度音调码向量bvT的能量,Ec是标度的创新码向量gck的能量。就是说以及
注意,rv的值处于-1和1之间(1对应于纯粹的发音信号(voiced signal),-1对应于纯粹的不发音信号(unvoiced signal)。
然后在本优选实施例中,在话音因子产生器204中按以下公式计算因子α
α=0.125(1+rv)
对于纯粹不发音信号这对应于0值,对于纯粹发音信号对应于值0.25。
在第一个,即F(z)的两项形式中,在以上方法1和2中可用使用σ=2α近似周期性因子σ。这种情形下,在以上方法1中周期性因子σ计算如下
σ=2qRp界于σ<2q
在方法2中,周期性因子σ计算如下
σ=0.25(1+rv).
因而通过创新滤波器205(F(z))对标度创新码向量gck滤波计算增强的信号cf。
通过如下的加法器220计算增强的激发信号u`
u`=cf+bvT
注意,在编码器100中并不执行这一过程。这样,实质上是使用没有增强的激发信号u更新音调码本201的内容,以保持编码器100与解码器200之间的同步性。因而,使用激发信号u更新音调码本201的存储器203,并在LP合成滤波器206的输入处使用增强的激发信号u`。
合成并去加重
通过LP合成滤波器206对加强的激发信号u`滤波计算合成信号s`,合成滤波器206具有1/
(z)形式,其中
(z)是当前子帧中内插的LP滤波器。在图2中可见,在线路225上将来自多路分解器217的量化的LP系数
(z)提供给LP合成滤波器206,从而调节LP合成滤波器206的参数。去加重滤波器207是图1的预加重滤波器103的逆。去加重滤波器207的传递函数由以下给出
D(z)=1/(1-μz-1)
其中μ是值在0与1之间的预加重因子(典型值是μ=0.7)。还可用使用较高阶的滤波器。
向量s`通过去加重滤波器D(z)(模块207)被滤波,以获得向量sd,该向量通过高通滤波器208以去除不希望有的低于50Hz的频率,并进而获得sh。
过采样和高频再生
过采样模块209进行与图1的下降采样模块101相反的过程。在本优选实施例中,使用业内专业人员所熟知的技术,从12.8kHz采样速率过采样转换为原来的16kHz采样速率。过采样的合成信号标记为。信号还称为合成的宽带中间信号。
过采样合成信号不包含在解码器100处通过下降采样过程(图1的模块101)失去的较高的频率分量。这给出对合成语音信号低通的感觉。为了恢复原始信号的全频带,公开了一种高频产生过程。这一过程在模块210到216及加法器221中进行,并需要来自话音因子产生器204(图2)的输入。
在这新的方法中,通过以激发域中适当标度的白噪声填充频谱的上部分产生高频内容,然后转换为语音域,最好通过以用于合成下降采样的信号的同一LP合成滤波器成形该信号。
以下说明根据本发明的高频产生过程。
随机噪声产生器213,使用业内一般专业人员所熟知的技术,产生在整个频率带宽上有平坦频谱的白噪声序列w`。所产生的序列长度为原始域中子帧的长度N`。注意,N是下降采样域中子帧的长度。在这优选实施例中,N=64而N`=80,这对应于5ms。
白噪声序列在增益调节模块214中被适当地标度。增益调节包括以下步骤。首先,把产生的噪声序列w`的能量设置为等于通过能量计算模块210计算的增强激发信号u`的能量,且所得的标度噪声序列由以下给出
增益标度的第二步骤是考虑在话音因子产生器204的输出处合成信号的高频内容,以便在发音段的情形(与不发音段比较在高频出现的能量较少)降低产生的噪声的能量。测量高频内容最好通过频谱倾斜计算器212,测量合成信号的倾斜并据此降低能量实现。其它的测量法,诸如零交叉测量可同样使用。当对应于发音段的倾斜很强时,进一步降低噪声能量。在模块212中作为合成信号sh的第一相关系数计算的倾斜因子,并由以下给出条件为倾斜≥0以及倾斜≥rv
其中话音因子rv由以下给出
rv=(Ev-Ec)/(Ev+Ec)
其中如前所述Ev是标度音调码向量bvT的能量,Ec是标度的创新码向量gck的能量。话音因子rv常常小于倾斜,但是这一条件是在倾斜值为负而rv值高的地方作为预防高频音调引入的。因而,这条件对这种音调的信号降低了噪声能量。
倾斜值在平坦频谱情形为0,在强发音信号情形为1,并在不发音信号情形下为负值,这时在高频出现较多的能量。
可使用不同的方法从高频内容量推导标度因子gt。本发明中,基于上述信号的倾斜给出两个方法。
方法1
按以下公式从倾斜推导出标度因子gt
gt=1-倾斜 界于0.2≤gt≤1.0
对于倾斜接近1的强发音信号,gt是0.2,并对于强不发音信号gt成为1.0。
方法2
首先倾斜因子gt被限制为大于或等于零,然后按以下公式从倾斜推导出标度因子
gt=10-0.6倾斜
因而在增益调节模块214中产生的标度的噪声序列wg由以下给出
wg=gtw`
当倾斜接近零时,标度因子gt接近1,其结果并非能量的降低。当倾斜值为1时,标度因子gt结果是产生的噪声的能量降低12dB。
一旦噪声被适当地标度(wg),使用频谱整形器215它就被引入语音域。在优选实施例中,通过在下降采样域中(1/
(z/0.8))使用的同一LP合成滤波器的带宽扩展版本对噪声wg滤波,而实现这一点。对应的带宽扩展版LP滤波器系数在频谱整形器215中计算。
然后使用带通滤波器216,已滤波的标度噪声序列wf被带通滤波为所要恢复的频率范围。在优选实施例中,带通滤波器216把噪声序列限制在频率范围5.6-7-2kHz。所得的带通滤波噪声序列z在加法器221中加到过采样合成语音信号,在输出端223获得最后重构的声音信号sout。
虽然以上已通过其优选实施例的方式对本发明进行了说明,本实施例可在不背离本发明的主题的精神和性质之下,在所附权利要求范围内任意修改。虽然优选实施例讨论了宽带语音信号的使用,显然对于业内专业人员本主题发明还包括一般使用宽带信号的其它的实施例,故不必限于语音应用。
权利要求
1.一种在代数码本中索引脉冲位置和振幅的方法,用于对声音信号有效地编码和解码,
-其中
-代数码本包括脉冲振幅/位置组合的一个集合;
-每一脉冲振幅/位置组合定义了数个不同的位置,并包含对该组合各位置指定的零振幅脉冲和非零振幅脉冲两者;以及
-每一非零振幅脉冲取多个可能的振幅之一;以及
-其中所述索引方法包括
形成所述脉冲位置的至少一个踪迹的一集合;
根据脉冲位置的至少一个踪迹的集合,限制码本的组合的非零振幅脉冲的位置;
建立过程1,用于只有当所述一个非零振幅脉冲的位置位于所述集合的一个踪迹中时,索引一个非零振幅脉冲的位置和振幅;
建立过程2,用于只有当所述两个非零振幅脉冲的位置位于所述集合的一个踪迹中时,索引这两个非零振幅脉冲的位置和振幅;以及
当X个非零振幅脉冲的位置位于所述集合的一个踪迹时,其中X≥3
把所述一个踪迹的位置划分为两部分;
使用过程X索引所述X个非零振幅脉冲的位置和振幅,所述X过程包括
标识每一非零振幅脉冲位于两个踪迹部分的哪一个之中;
使用建立的过程1和2在所述踪迹部分和整个踪迹至少之一计算X个非零振幅脉冲的子索引;以及
通过组合所述子索引计算所述X个非零振幅脉冲的位置和振幅的索引。
2.如权利要求1中所定义的索引脉冲位置和振幅的方法,包括交错每一踪迹的脉冲位置与其它踪迹的脉冲位置。
3.如权利要求1中所定义的索引脉冲位置和振幅的方法,其中计算所述X个非零振幅脉冲的位置和振幅索引包括
通过组合至少两个子索引计算至少一个中间索引;以及
通过组合其余子索引和所述至少一个中间索引计算所述X个非零振幅脉冲的位置和振幅索引。
4.如权利要求1中所定义的索引脉冲位置和振幅的方法,其中所述过程1包括产生位置和振幅索引,该索引含有指示所述一个踪迹中的所述一个非零振幅脉冲的位置的位置索引,以及指示所述一个非零振幅脉冲的振幅的振幅索引。
5.如权利要求4中所定义的索引脉冲位置和振幅的方法,其中位置索引包括第一位组,且振幅索引包括至少一位。
6.如权利要求5中所定义的索引脉冲位置和振幅的方法,其中振幅索引的所述至少一位是较高位置的位。
7.如权利要求5中所定义的索引脉冲位置和振幅的方法,其中每一非零振幅脉冲的所述多个可能的振幅包括+1和-1,且其中振幅索引的所述至少一位是符号位。
8.如权利要求1中所定义的索引脉冲位置和振幅的方法,其中
每一非零振幅脉冲的所述多个可能的振幅包括+1和-1;且
过程1包括产生具有以下形式的所述一个非零振幅脉冲的位置和振幅索引
I1p=p+s×2M
其中p是所述一个踪迹中所述一个非零振幅脉冲的位置索引,s是所述一个非零振幅脉冲的符号索引,2M是所述一个踪迹中位置数。
9.如权利要求8中所定义的索引脉冲位置和振幅的方法,其中所述一个踪迹中位置数是16,且其中位置和振幅索引是由以下表格中表示的5-位的索引
10.如权利要求1中所定义的索引脉冲位置和振幅的方法,其中所述过程2包括产生位置和振幅索引,该索引包含
第一和第二位置索引,分别指示所述一个踪迹中两个非零振幅脉冲的的位置;以及
振幅索引,指示所述两个非零振幅脉冲的振幅。
11.如权利要求10中所定义的索引脉冲位置和振幅的方法,其中在位置和振幅索引中
振幅索引包括至少一位;
第一位置索引包括第一位组;以及
第二位置索引包括第二位组。
12.如权利要求11中所定义的索引脉冲位置和振幅的方法,其中在位置和振幅索引中
振幅索引的所述至少一位是较高位置的位;
第一位组的是中间位置的位;以及
第二位组的是较低位置的位。
13.如权利要求11中所定义的索引脉冲位置和振幅的方法,其中每一非零振幅脉冲的所述多个可能的振幅包括+1和-1,且其中振幅索引的所述至少一位是符号位。
14.如权利要求10中所定义的索引脉冲位置和振幅的方法,其中过程2包括
当所述两个脉冲具有相同振幅时,产生一振幅索引,指示其位置由第一位置索引指示的非零振幅脉冲的振幅,产生一个第一位置索引,指示所述一个踪迹中两个非零振幅脉冲较小的位置,并产生一个第二位置索引,指示所述一个踪迹中两个非零振幅脉冲较大的位置;以及
当所述两个脉冲具有不同振幅时,产生一振幅索引,指示其位置由第一位置索引指示的非零振幅脉冲的振幅,产生一个第一位置索引,指示所述一个踪迹中两个非零振幅脉冲较大的位置,并产生一个第二位置索引,指示所述一个踪迹中两个非零振幅脉冲较小的位置。
15.如权利要求1中所定义的索引脉冲位置和振幅的方法,其中过程2包括,当位置索引p0和符号索引σ0的第一非零振幅脉冲的位置,及位置索引p1和符号索引σ1的第二非零振幅脉冲的位置位于所述集合的一个踪迹中时,产生以下形式的所述第一和第二非零振幅脉冲的位置和振幅索引
其中2M是所述一个踪迹中的位置数。
16.如权利要求15中所定义的索引脉冲位置和振幅的方法,其中所述一个踪迹中的位置数是16,且其中位置和振幅索引是9-位的索引,表示为下表
17.如权利要求1中所定义的索引脉冲位置和振幅的方法,其中当X=3时;
把所述一个踪迹的位置划分为两个部分包括把所述一个踪迹的位置划分为上和下踪迹部分;并且
过程3包括
标识上和下踪迹部分包含至少两个非零振幅脉冲的位置的一个;
使用过程2于所述一个踪迹部分的位置,计算位于所述一个踪迹部分中所述至少两个非零振幅脉冲的第一子索引;
使用过程1于整个所述一个踪迹的位置,计算其余非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生三个非零振幅脉冲的位置和振幅索引。
18.如权利要求17中所定义的索引脉冲位置和振幅的方法,其中
使用过程2计算位于所述一个踪迹部分中所述至少两个非零振幅脉冲的第一子索引包括,当所述至少两个非零振幅脉冲的位置位于上部分时,把所述至少两个非零振幅脉冲的位置从上部分移动到下部分。
19.如权利要求18中所定义的索引脉冲位置和振幅的方法,其中把所述至少两个非零振幅脉冲的位置从上部分移动到下部分,包括以由数个1组成的掩码掩盖所述至少两个非零振幅脉冲的位置索引的数个最低有效位。
20.如权利要求17中所定义的索引脉冲位置和振幅的方法,其中使用过程2计算位于所述一个踪迹部分中所述至少两个非零振幅脉冲的第一子索引,包括插入一个部分索引,指示所述至少两个非零振幅脉冲所位于的所述下和上踪迹部分之一。
21-如权利要求17中所定义的索引脉冲位置和振幅的方法,其中所述一个踪迹中的位置数是16,且其中位置和振幅索引是表示为下表的13-位的索引
22.如权利要求1中所定义的索引脉冲位置和振幅的方法,其中
所述过程1包括产生位置和振幅索引,该索引包含表示所述一个非零振幅脉冲在所述一个踪迹中的位置的位置索引,及表示所述一个非零脉冲振幅的振幅索引,其中位置索引包括第一位组,且位置索引包括至少一位;
所述过程2包括产生位置和振幅索引,该索引包含分别表示所述二个非零振幅脉冲在所述一个踪迹中的位置的第一和第二位置索引,及表示所述二个非零脉冲振幅的振幅索引,其中振幅索引包括至少一位,第一位置索引包括第一位组,且第二位置索引包括第二位组;
当X=3时
把所述一个踪迹的位置划分为两个部分包括把所述一个踪迹的位置划分为上和下踪迹部分;并且
过程3包括
标识上和下踪迹部分包含至少两个非零振幅脉冲的位置的一个;
使用过程2于所述一个踪迹部分的位置,计算位于所述一个踪迹部分中所述至少两个非零振幅脉冲的第一子索引;
使用过程1于整个所述一个踪迹的位置,计算其余非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生三个非零振幅脉冲的位置和振幅索引。
23.如权利要求22中所定义的索引脉冲位置和振幅的方法,其中当X=4时
把所述一个踪迹的位置划分为两个部分包括把所述一个踪迹的位置划分为上和下踪迹部分;并且
过程4包括
-当上踪迹部分包含四个非零振幅脉冲的位置时
进而把该上踪迹部分划分下和上踪迹子部分;
标识上和下踪迹子部分包含至少两个非零振幅脉冲的位置的一个;
使用过程2于所述一个踪迹子部分的位置,计算位于所述一个踪迹子部分中所述至少两个非零振幅脉冲的第一子索引;
使用过程1于整个上踪迹部分的位置,计算其余两个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生四个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含一个非零振幅脉冲的位置,而上踪迹部分包含三个其它非零振幅脉冲的位置时
使用过程1于所述下踪迹部分的位置,计算位于下踪迹子部分中所述一个非零振幅脉冲的第一子索引;
使用过程3于上踪迹的位置,计算位于该上踪迹部分其余三个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生四个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含二个非零振幅脉冲的位置,而上踪迹部分包含二个其它非零振幅脉冲的位置时
使用过程2于所述下踪迹部分的位置,计算位于下踪迹子部分中所述二个非零振幅脉冲的第一子索引;
使用过程2于上踪迹的位置,计算位于该上踪迹部分其余二个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生四个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含三个非零振幅脉冲的位置,而上踪迹部分包含其它非零振幅脉冲的位置时
使用过程3于所述下踪迹部分的位置,计算位于下踪迹子部分中所述三个非零振幅脉冲的第一子索引;
使用过程1于上踪迹的位置,计算位于该上踪迹部分其余非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生四个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含四个非零振幅脉冲的位置时;
进而把该下踪迹部分划分为下和上踪迹子部分;
标识上和下踪迹子部分包含至少两个非零振幅脉冲的位置的一个
使用过程2于所述一个踪迹子部分的位置,计算位于所述一个踪迹子部分中所述至少两个非零振幅脉冲的第一子索引;
使用过程2于整个下踪迹部分的位置,计算其余两个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生三个非零振幅脉冲的位置和振幅索引。
24.如权利要求24中所定义的索引脉冲位置和振幅的方法,其中过程4包括
-当所述一个踪迹的子部分是上子部分时,
使用过程2计算位于所述一个踪迹子部分中的所述至少两个非零振幅脉冲的第一子索引,包括把所述至少两个非零振幅脉冲的位置从上踪迹子部分移动到下踪迹子部分。
25.如权利要求24中所定义的索引脉冲位置和振幅的方法,其中把所述至少两个非零振幅脉冲的位置从上子部分移动到下子部分包括以由数个1组成的掩码掩盖所述至少两个非零振幅脉冲的位置索引的数个最低有效位。
26.如权利要求23中所定义的索引脉冲位置和振幅的方法,其中当X=5时
把所述一个踪迹的位置划分为两个踪迹部分包括把所述一个踪迹的位置划分为下和上部分;并且
过程5包括
检测至少三个非零振幅脉冲的位置位于其中的下和上踪迹部分之一;
使用过程3于所述一个踪迹部分的位置,计算位于所述一个踪迹部分中的三个非零振幅脉冲的第一子索引;
使用过程2于整个所述一个踪迹的位置,计算其余二个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生五个非零振幅脉冲的位置和振幅索引。
27.如权利要求23中所定义的索引脉冲位置和振幅的方法,其中当X=5时
把所述一个踪迹的位置划分为两个踪迹部分包括把所述一个踪迹的位置划分为下和上踪迹部分;并且
过程5包括
-当上踪迹部分包含五个非零振幅脉冲的位置时
使用过程3于所述上踪迹部分的位置,计算位于所述上踪迹部分中的三个非零振幅脉冲的第一子索引;
使用过程2于整个所述一个踪迹的位置,计算其余二个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生五个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含一个非零振幅脉冲的位置,且上踪迹部分包含其它四个非零振幅脉冲的位置时
使用过程3于所述上踪迹部分的位置,计算位于所述上踪迹部分中的三个非零振幅脉冲的第一子索引;
使用过程2于整个所述一个踪迹的位置,计算其余二个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生五个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含两个非零振幅脉冲的位置,且上踪迹部分包含其它三个非零振幅脉冲的位置时
使用过程3于所述上踪迹部分的位置,计算位于所述上踪迹部分中的三个非零振幅脉冲的第一子索引;
使用过程2于整个所述一个踪迹的位置,计算其余二个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生五个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含三个非零振幅脉冲的位置,且上踪迹部分包含其它两个非零振幅脉冲的位置时
使用过程3于所述下踪迹部分的位置,计算位于所述下踪迹部分中的三个非零振幅脉冲的第一子索引;
使用过程2于整个所述一个踪迹的位置,计算位于上踪迹部分的其余二个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生五个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含四个非零振幅脉冲的位置,且上踪迹部分包含其它的非零振幅脉冲的位置时
使用过程3于所述下踪迹部分的位置,计算位于所述下踪迹部分中的三个非零振幅脉冲的第一子索引;
使用过程2于整个所述一个踪迹的位置,计算其余二个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生五个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含五个非零振幅脉冲的位置时
使用过程3于所述下踪迹部分的位置,计算位于所述下踪迹部分中的三个非零振幅脉冲的第一子索引;
使用过程2于整个所述一个踪迹的位置,计算其余二个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生五个非零振幅脉冲的位置和振幅索引。
28.如权利要求27中所定义的索引脉冲位置和振幅的方法,其中当X=6时
把所述一个踪迹的位置划分为两个踪迹部分包括把所述一个踪迹的位置划分为下和上踪迹部分;并且
过程6包括
-当上踪迹部分包含六个非零振幅脉冲的位置时
使用过程5于所述上踪迹部分的位置,计算位于所述上踪迹部分中的五个非零振幅脉冲的第一子索引;
使用过程1于上踪迹部分的位置,计算其余非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生六个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含一个非零振幅脉冲的位置,且上踪迹部分包含五个其它非零振幅脉冲的位置时
使用过程5于所述上踪迹部分的位置,计算位于所述上踪迹部分中的五个非零振幅脉冲的第一子索引;
使用过程1于所述下踪迹的位置,计算位于下踪迹部分中非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生六个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含两个非零振幅脉冲的位置,且上踪迹部分包含四个其它非零振幅脉冲的位置时
使用过程4于所述上踪迹部分的位置,计算位于所述上踪迹部分中的四个非零振幅脉冲的第一子索引;
使用过程2于所述下踪迹的位置,计算位于下踪迹部分的其余二个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生六个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含三个非零振幅脉冲的位置,且上踪迹部分包含其它三个非零振幅脉冲的位置时
使用过程3于所述下踪迹部分的位置,计算位于下踪迹部分中的三个非零振幅脉冲的第一子索引;
使用过程3于上踪迹部分的位置,计算位于上踪迹部分的其余三个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生六个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含四个非零振幅脉冲的位置,且上踪迹部分包含其它的两个非零振幅脉冲的位置时
使用过程4于所述下踪迹部分的位置,计算位于所述下踪迹部分中的四个非零振幅脉冲的第一子索引;
使用过程2于整个所述上踪迹的位置,计算位于上踪迹部分的其余二个非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生六个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含五个非零振幅脉冲的位置,且上踪迹部分包含其余的非零振幅脉冲的位置时
使用过程5于所述下踪迹部分的位置,计算位于所述下踪迹部分中的五个非零振幅脉冲的第一子索引;
使用过程1于所述上踪迹部分的位置,计算位于上踪迹部分其余非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生六个非零振幅脉冲的位置和振幅索引;
-当下踪迹部分包含六个非零振幅脉冲的位置时
使用过程5于所述下踪迹部分的位置,计算位于所述下踪迹部分中的五个非零振幅脉冲的第一子索引;
使用过程1于所述下踪迹部分的位置,计算位于下踪迹部分其余非零振幅脉冲的第二子索引;以及
通过组合所述第一和第二子索引,产生六个非零振幅脉冲的位置和振幅索引。
29.一种用于在代数码本中索引脉冲位置和振幅的装置,以便对声音信号有效地编码和解码,
-其中
-码本包括脉冲振幅/位置组合的一个集合;
-每一脉冲振幅/位置组合定义了数个不同的位置,并包含指定给该组合各位置的零振幅脉冲和非零振幅脉冲两者;且
-每一非零振幅脉冲取多个可能的振幅之一;且
-其中所述索引装置包括
用于形成所述脉冲位置的至少一个踪迹的集合的装置;
根据脉冲位置的至少一个踪迹的集合,限制码本的组合的非零振幅脉冲位置的装置;
用于建立过程1的装置,该过程用于只有当一个所述非零振幅脉冲的位置位于所述集合的一个踪迹中时,索引一个非零振幅脉冲的位置和振幅;
用于建立过程2的装置,该过程用于只有当所述两个非零振幅脉冲的位置位于该集合的一个踪迹中时,索引这两个非零振幅脉冲的位置和振幅;以及
当X个非零振幅脉冲的位置位于所述集合的一个踪迹时,X≥3
用于把所述踪迹的位置划分为两部分的装置;
用于处理过程X的装置,过程X索引所述X个非零振幅脉冲的位置和振幅,所述过程X处理装置包括
用于标识每一非零振幅脉冲位于两个踪迹部分的哪一个之中的装置;以及
使用建立的过程1和2,在所述踪迹部分和整个踪迹至少之一计算所述X个非零振幅脉冲的子索引的装置;以及
用于计算所述X个非零振幅脉冲的位置和振幅索引的装置,所述索引计算装置包括用于组合子索引的装置。
30.如权利要求29中定义的用于索引脉冲位置和振幅的装置,包括用于交错每一踪迹的脉冲位置与其它踪迹的脉冲位置的装置。
31.如权利要求29中定义的用于索引脉冲位置和振幅的装置,其中用于计算所述X个非零振幅脉冲的位置和振幅索引的装置包括
用于通过组合至少两个所述子索引计算至少一个中间索引的装置;以及
通过组合其余子索引和所述至少一个中间索引,计算所述X个非零振幅脉冲的位置和振幅索引。
32.如权利要求29中定义的用于索引脉冲位置和振幅的装置,其中所述过程1包括用于产生位置和振幅索引的装置,该索引包含表示所述一个非零振幅脉冲在所述一个踪迹中的位置的位置索引,及表示所述一个非零脉冲振幅的振幅索引。
33.如权利要求32中定义的用于索引脉冲位置和振幅的装置,其中位置索引包括第一位组,且振幅索引包括至少一位。
34.如权利要求33中定义的用于索引脉冲位置和振幅的装置,其中振幅索引的所述至少一位是较高位置的位。
35.如权利要求33中定义的用于索引脉冲位置和振幅的装置,其中每一非零振幅脉冲的所述多个可能的振幅包括+1和-1,且其中振幅索引的所述至少一位是符号位。
36.如权利要求29中定义的用于索引脉冲位置和振幅的装置,其中
每一非零振幅脉冲的所述多个可能的振幅包括+1和-1;且
过程1包括产生具有以下形式的所述一个非零振幅脉冲的位置和振幅索引的装置
I1p=p+s×2M
其中p是所述一个踪迹中所述一个非零振幅脉冲的位置索引,s是所述一个非零振幅脉冲的符号索引,2M是所述一个踪迹中位置数。
37.如权利要求36中定义的用于索引脉冲位置和振幅的装置,其中所述一个踪迹中位置数是16,且其中位置和振幅索引是由以下表格中表示的5-位的索引
38.如权利要求29中定义的用于索引脉冲位置和振幅的装置,其中所述过程2包括用于产生位置和振幅索引的装置,该索引包含
第一和第二位置索引,分别指示所述一个踪迹中两个非零振幅脉冲的的位置;以及
振幅索引,指示所述两个非零振幅脉冲的振幅。
39.如权利要求38中定义的用于索引脉冲位置和振幅的装置,其中在位置和振幅索引中
振幅索引包括至少一位;
第一位置索引包括第一位组;以及
第二位置索引包括第二位组。
40.如权利要求39中定义的用于索引脉冲位置和振幅的装置,其中在位置和振幅索引中
振幅索引的所述至少一位是较高位置的位;
第一位组是中间位置的位;以及
第二位组是较低位置的位。
41.如权利要求39中定义的用于索引脉冲位置和振幅的装置,其中每一非零振幅脉冲的所述多个可能的振幅包括+1和-1,且其中振幅索引的所述至少一个位是符号位。
42.如权利要求39中定义的用于索引脉冲位置和振幅的装置,其中过程2包括
-当所述两个脉冲具有相同振幅时
用于产生一振幅索引的装置,该索引指示其位置由第一位置索引指示的非零振幅脉冲的振幅;
用于产生一个第一位置索引的装置,该索引指示所述一个踪迹中两个非零振幅脉冲较小的位置;
用于产生一个第二位置索引的装置,该索引指示所述一个踪迹中两个非零振幅脉冲较大的位置;以及
-当所述两个脉冲具有不同振幅时
用于产生一振幅索引的装置,该索引指示其位置由第一位置索引指示的非零振幅脉冲的振幅;
用于产生一个第一位置索引的装置,该索引指示所述一个踪迹中两个非零振幅脉冲较大的位置;以及
用于产生一个第二位置索引的装置,该索引指示所述一个踪迹中两个非零振幅脉冲较小的位置。
43.如权利要求29中定义的用于索引脉冲位置和振幅的装置,其中过程2包括,当位置索引p0和符号索引σ0的第一非零振幅脉冲的位置,及位置索引p1和符号索引σ1的第二非零振幅脉冲的位置位于所述集合的一个踪迹中时,用于产生以下形式的所述第一和第二非零振幅脉冲的位置和振幅索引的装置
其中2M是所述一个踪迹中的位置数。
44.如权利要求43中定义的用于索引脉冲位置和振幅的装置,其中所述一个踪迹中的位置数是16,且其中位置和振幅索引是9-位的索引,表示为下表
45.如权利要求29中定义的用于索引脉冲位置和振幅的装置,其中当X=3时;
用于把所述一个踪迹的位置划分为两个部分的装置包括把所述一个踪迹的位置划分为上和下踪迹部分的装置;并且
过程3包括
用于标识上和下踪迹部分包含至少两个非零振幅脉冲的位置的一个的装置;
使用过程2于所述一个踪迹部分的位置,计算位于所述一个踪迹部分中所述至少两个非零振幅脉冲的第一子索引的装置;
使用过程1于整个所述一个踪迹的位置,计算其余非零振幅脉冲的第二子索引的装置;以及
用于产生三个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置。
46.如权利要求45中定义的用于索引脉冲位置和振幅的装置,其中
使用过程2计算位于所述一个踪迹部分中所述至少两个非零振幅脉冲的第一子索引的装置包括,当所述至少两个非零振幅脉冲的位置位于上部分时,把所述至少两个非零振幅脉冲的位置从上部分移动到下部分的装置。
47.如权利要求46中定义的用于索引脉冲位置和振幅的装置,其中用于把所述至少两个非零振幅脉冲的位置从上部分移动到下部分的装置,包括用于以由数个1组成的掩码掩盖所述至少两个非零振幅脉冲的位置索引的数个最低有效位的装置。
48.如权利要求45中定义的用于索引脉冲位置和振幅的装置,其中使用过程2计算位于所述一个踪迹部分中所述至少两个非零振幅脉冲的第一子索引的装置,包括用于插入部分的索引的装置,该索引指示所述至少两个非零振幅脉冲所位于的所述下和上踪迹部分之一。
49.如权利要求45中定义的用于索引脉冲位置和振幅的装置,其中所述一个踪迹中的位置数是16,且其中位置和振幅索引是表示为下表的13-位的索引
50.如权利要求29中定义的用于索引脉冲位置和振幅的装置,其中
所述过程1包括用于产生位置和振幅索引的装置,该索引包含表示所述一个非零振幅脉冲在所述一个踪迹中的位置的位置索引,及表示所述一个非零脉冲振幅的振幅索引,其中位置索引包括第一位组,且位置索引包括至少一位;
所述过程2包括用于产生位置和振幅索引的装置,该索引包含分别表示所述二个非零振幅脉冲在所述一个踪迹中的位置的第一和第二位置索引,及表示所述二个非零脉冲振幅的振幅索引,其中振幅索引包括至少一位,第一位置索引包括第一位组,且第二位置索引包括第二位组;
当X=3时
用于把所述一个踪迹的位置划分为两个部分的装置包括把所述一个踪迹的位置划分为上和下踪迹部分的装置;并且
过程3包括
用于标识上和下踪迹部分包含至少两个非零振幅脉冲的位置的一个的装置;
使用过程2于所述一个踪迹部分的位置,计算位于所述一个踪迹部分中所述至少两个非零振幅脉冲的第一子索引的装置;
使用过程1于整个所述一个踪迹的位置,计算其余非零振幅脉冲的第二子索引的装置;以及
用于产生三个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置。
51.如权利要求50中定义的用于索引脉冲位置和振幅的装置,其中当X=4时
用于把所述一个踪迹的位置划分为两个部分的装置包括把所述一个踪迹的位置划分为上和下踪迹部分的装置;并且
过程4包括
-当上踪迹部分包含四个非零振幅脉冲的位置时
用于进而把该上踪迹部分划分下和上踪迹子部分的装置;
用于标识上和下踪迹子部分包含至少两个非零振幅脉冲的位置的一个的装置;
使用过程2于所述一个踪迹子部分的位置,计算位于所述一个踪迹子部分中所述至少两个非零振幅脉冲的第一子索引的装置;
使用过程2于整个上踪迹部分的位置,计算其余两个非零振幅脉冲的第二子索引的装置;以及
用于产生四个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含一个非零振幅脉冲的位置,而上踪迹部分包含三个其它非零振幅脉冲的位置时
使用过程1于所述下踪迹部分的位置,计算位于下踪迹子部分中所述一个非零振幅脉冲的第一子索引的装置;
使用过程3于上踪迹的位置,计算位于该上踪迹部分其余三个非零振幅脉冲的第二子索引的装置;以及
用于产生四个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含二个非零振幅脉冲的位置,而上踪迹部分包含其它二个非零振幅脉冲的位置时
使用过程2于所述下踪迹部分的位置,计算位于下踪迹子部分中所述二个非零振幅脉冲的第一子索引的装置;
使用过程2于上踪迹的位置,计算位于该上踪迹部分其余二个非零振幅脉冲的第二子索引的装置;以及
用于产生四个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含三个非零振幅脉冲的位置,而上踪迹部分包含其它非零振幅脉冲的位置时
使用过程3于所述下踪迹部分的位置,计算位于下踪迹子部分中所述三个非零振幅脉冲的第一子索引的装置;
使用过程1于上踪迹的位置,计算位于该上踪迹部分其余非零振幅脉冲的第二子索引的装置;以及
用于产生四个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含四个非零振幅脉冲的位置时
用于进而把该下踪迹部分划分下和上踪迹子部分的装置;
用于标识上和下踪迹子部分包含至少两个非零振幅脉冲的位置的一个的装置;
使用过程2于所述一个踪迹子部分的位置,计算位于所述一个踪迹子部分中所述至少两个非零振幅脉冲的第一子索引的装置;
使用过程2于整个下踪迹部分的位置,计算其余两个非零振幅脉冲的第二子索引的装置;以及
用于产生四个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置。
52.如权利要求51中定义的用于索引脉冲位置和振幅的装置,其中过程4包括
-当所述一个踪迹的子部分是上子部分时,
使用过程2计算位于所述一个踪迹子部分中的所述至少两个非零振幅脉冲的第一子索引的装置,包括用于把所述至少两个非零振幅脉冲的位置从上踪迹子部分移动到下踪迹子部分的装置。
53.如权利要求24中定义的用于索引脉冲位置和振幅的装置,其中用于把所述至少两个非零振幅脉冲的位置从上子部分移动到下子部分的装置,包括用于以由数个1组成的掩码掩盖所述至少两个非零振幅脉冲的位置索引的数个最低有效位的装置。
54.如权利要求51中定义的用于索引脉冲位置和振幅的装置,其中当X=5时
用于把所述一个踪迹的位置划分为两个踪迹部分的装置包括把所述一个踪迹的位置划分为下和上踪迹部分的装置;并且
过程5包括
用于检测至少三个非零振幅脉冲位于其中的下和上踪迹部分之一的装置;
使用过程3于所述一个踪迹部分的位置,计算位于所述一个踪迹部分中的三个非零振幅脉冲的第一子索引的装置;
使用过程2于整个所述一个踪迹的位置,计算其余二个非零振幅脉冲的第二子索引的装置;以及
用于产生五个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置。
55.如权利要求51中定义的用于索引脉冲位置和振幅的装置,其中当X=5时
用于把所述一个踪迹的位置划分为两个踪迹部分的装置,包括用于把所述一个踪迹的位置划分为下和上踪迹部分的装置;并且
过程5包括
-当上踪迹部分包含五个非零振幅脉冲的位置时;
使用过程3于所述上踪迹部分的位置,计算位于所述上踪迹部分中的三个非零振幅脉冲的第一子索引的装置;
使用过程2于整个所述一个踪迹的位置,计算其余二个非零振幅脉冲的第二子索引的装置;以及
用于产生五个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含一个非零振幅脉冲的位置,且上踪迹部分包含其它四个非零振幅脉冲的位置时
使用过程3于所述上踪迹部分的位置,计算位于所述上踪迹部分中的三个非零振幅脉冲的第一子索引的装置;
使用过程2于整个所述一个踪迹的位置,计算其余二个非零振幅脉冲的第二子索引的装置;以及
用于产生五个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含两个非零振幅脉冲的位置,且上踪迹部分包含其它三个非零振幅脉冲的位置时
使用过程3于所述上踪迹部分的位置,计算位于所述上踪迹部分中的三个非零振幅脉冲的第一子索引的装置;
使用过程2于整个所述一个踪迹的位置,计算位于下踪迹部分的其余二个非零振幅脉冲的第二子索引的装置;以及
用于产生五个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含三个非零振幅脉冲的位置,且上踪迹部分包含其它两个非零振幅脉冲的位置时
使用过程3于所述下踪迹部分的位置,计算位于所述下踪迹部分中的三个非零振幅脉冲的第一子索引的装置;
使用过程2于整个所述一个踪迹的位置,计算位于上踪迹部分的其余二个非零振幅脉冲的第二子索引的装置;以及
用于产生五个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含四个非零振幅脉冲的位置,且上踪迹部分包含其它的非零振幅脉冲的位置时
使用过程3于所述下踪迹部分的位置,计算位于所述下踪迹部分中的三个非零振幅脉冲的第一子索引的装置;
使用过程2于整个所述一个踪迹的位置,计算其余二个非零振幅脉冲的第二子索引的装置;以及
用于产生五个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含五个非零振幅脉冲的位置时
使用过程3于所述下踪迹部分的位置,计算位于所述下踪迹部分中的三个非零振幅脉冲的第一子索引的装置;
使用过程2于整个所述一个踪迹的位置,计算其余二个非零振幅脉冲的第二子索引的装置;以及
用于产生五个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置。
56.如权利要求55中定义的用于索引脉冲位置和振幅的装置,其中当X=6时
用于把所述一个踪迹的位置划分为两个踪迹部分的装置包括用于把所述一个踪迹的位置划分为下和上踪迹部分的装置;并且
过程6包括
-当上踪迹部分包含六个非零振幅脉冲的位置时;
使用过程5于所述上踪迹部分的位置,计算位于所述上踪迹部分中的五个非零振幅脉冲的第一子索引的装置;
使用过程1于上踪迹部分的位置,计算其余非零振幅脉冲的第二子索引的装置;以及
用于产生六个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含一个非零振幅脉冲的位置,且上踪迹部分包含五个其它非零振幅脉冲的位置时
使用过程5于所述上踪迹部分的位置,计算位于所述上踪迹部分中的五个非零振幅脉冲的第一子索引的装置;
使用过程1于所述下踪迹的位置,计算位于下踪迹部分中非零振幅脉冲的第二子索引的装置;以及
用于产生六个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含两个非零振幅脉冲的位置,且上踪迹部分包含四个其它非零振幅脉冲的位置时
使用过程4于所述上踪迹部分的位置,计算位于所述上踪迹部分中的四个非零振幅脉冲的第一子索引的装置;
使用过程2于所述下踪迹的位置,计算位于下踪迹部分的其余二个非零振幅脉冲的第二子索引的装置;以及
用于产生六个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含三个非零振幅脉冲的位置,且上踪迹部分包含其它三个非零振幅脉冲的位置时
使用过程3于所述下踪迹部分的位置,计算位于下踪迹部分中的三个非零振幅脉冲的第一子索引的装置;
使用过程3于上踪迹部分的位置,计算位于上踪迹部分的其余三个非零振幅脉冲的第二子索引的装置;以及
用于产生六个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含四个非零振幅脉冲的位置,且上踪迹部分包含其它的两个非零振幅脉冲的位置时
使用过程4于所述下踪迹部分的位置,计算位于所述下踪迹部分中的四个非零振幅脉冲的第一子索引的装置;
使用过程2于整个所述上踪迹的位置,计算位于上踪迹部分的其余二个非零振幅脉冲的第二子索引的装置;以及
用于产生六个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含五个非零振幅脉冲的位置,且上踪迹部分包含其余的非零振幅脉冲的位置时
使用过程5于所述下踪迹部分的位置,计算位于所述下踪迹部分中的五个非零振幅脉冲的第一子索引的装置;
使用过程1于所述上踪迹部分的位置,计算位于上踪迹部分其余非零振幅脉冲的第二子索引的装置;以及
用于产生六个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置;
-当下踪迹部分包含六个非零振幅脉冲的位置时
使用过程5于所述下踪迹部分的位置,计算位于所述下踪迹部分中的五个非零振幅脉冲的第一子索引的装置;
使用过程1于所述下踪迹部分的位置,计算位于下踪迹部分其余非零振幅脉冲的第二子索引的装置;以及
用于产生六个非零振幅脉冲的位置和振幅索引的装置,所述索引产生装置包括用于组合所述第一和第二子索引的装置。
57.一种服务于划分为多个小区的广大地理区域的蜂窝通信系统,包括
移动式发射机/接收机单元;
分别位于所述小区中的蜂窝基地台;
用于控制蜂窝基地台之间通信的装置;
处于一个小区的每一移动单元与所述一个小区的蜂窝基地台之间的双向无线通信子系统,所述双向无线通信子系统在移动单元和蜂窝基地台中都包括(a)发射机,包含用于对语音信号编码的装置及用于发送已编码语音信号的装置,以及(b)接收机,包含用于接收发送的编码语音信号的装置及对接收的编码语音信号解码的装置;
-其中所述语音信号编码装置包括响应语音信号产生语音信号编码参数的装置,且其中所述语音信号编码参数产生装置包括为产生至少一个语音信号编码参数搜索代数码本的装置,以及如以上权利要求29到56所述用于索引所述代数码本中的脉冲位置和振幅的装置,所述语音信号构成所述声音信号。
58.一种蜂窝式网络单元,包括(a)发射机,包含用于对语音信号编码的装置及用于发送已编码语音信号的装置,以及(b)接收机,包含用于接收发送的编码语音信号的装置及对接收的被编码的语音信号解码的装置;
-其中所述语音信号编码装置包括响应语音信号产生语音信号编码参数的装置,且其中所述语音信号编码参数产生装置包括为产生至少一个所述语音信号编码参数搜索代数码本的装置,以及如以上权利要求29到56所述,用于索引所述代数码本中的脉冲位置和振幅的装置,所述语音信号构成所述声音信号;
59.一种蜂窝式移动发射机/接收机单元,包括(a)发射机,包含用于对语音信号编码的装置及用于发送已编码语音信号的装置,以及(b)接收机,包含用于接收发送的编码语音信号的装置及对接收的被编码的语音信号解码的装置;
-其中所述语音信号编码装置包括响应语音信号产生语音信号编码参数的装置,且其中所述语音信号编码参数产生装置包括为产生至少一个所述语音信号编码参数搜索代数码本的装置,以及如以上权利要求29到56所述用于索引所述代数码本中的脉冲位置和振幅的装置,所述语音信号构成所述声音信号。
60.服务于被划分为多个小区的广大地理区域的蜂窝通信系统,并包括移动式发射机/接收机单元;分别位于所述小区中的蜂窝基地台;以及用于控制蜂窝基地台之间通信的装置;
处于一个小区的每一移动单元与所述一个小区的蜂窝基地台之间的双向无线通信子系统,所述双向无线通信子系统在移动单元和蜂窝基地台中都包括(a)发射机,包含用于对语音信号编码的装置及用于发送已编码语音信号的装置,以及(b)接收机,包含用于接收发送的编码语音信号的装置及对接收的编码语音信号解码的装置;
-其中语音信号编码装置包括响应语音信号产生语音信号编码参数的装置,且其中所述语音信号编码参数产生装置包括为产生至少一个所述语音信号编码参数搜索代数码本的装置,以及如以上权利要求29到56所述,用于索引所述代数码本中的脉冲位置和振幅的装置,所述语音信号构成所述声音信号。
61.用于对声音信号进行编码的编码器,包括响应声音信号语音产生语音信号编码参数的声音信号处理装置,其中所述声音信号处理装置包括
用于为产生至少一个所述语音信号编码参数搜索代数码本的装置;以及
如以上任何权利要求29到56所述,用于在所述代数码本中索引脉冲位置和振幅的装置。
62.用于响应声音信号编码参数合成声音信号的解码器,包括
响应所述声音信号编码参数而产生激发信号的编码参数处理装置,其中编码参数处理装置包括
响应至少一个所述声音信号编码参数产生所述激发信号一部分的代数码本;以及
如以上权利要求29到56所述,用于在所述代数码本中索引脉冲位置和振幅的装置;以及
合成滤波器装置,用于响应所述激发信号合成所述声音信号。
全文摘要
一种索引方法包括形成脉冲位置踪迹集合,根据脉冲位置踪迹集合约束码本组合的非零振幅脉冲位置,并在码本中至少关于对应踪迹的位置索引组合的每一非零振幅脉冲,脉冲的振幅,及所述对应踪迹中脉冲位置数。对于索引一个和两个非零振幅脉冲的位置,分别使用过程代码_1脉冲和代码_2脉冲。当X个非零振幅脉冲的位置位于一个踪迹,X≥3时,使用过程代码_1脉冲和代码_2脉冲计算这X个脉冲的子索引,并通过组合这些子索引计算全局索引。
文档编号G10L19/12GK1395724SQ0180395
公开日2003年2月5日 申请日期2001年11月22日 优先权日2000年11月22日
发明者B·伯瑟特 申请人:语音时代公司
在用于宽带信号编码的代数码本中索引脉冲位置和符号的制作方法
相关推荐
专利名称:法布里-珀罗干涉型光纤水听器中的相位载波解调方法技术领域:发明涉及的是一种法布里-珀罗干涉型光纤水听器的系统输出检测方法,具 体地说是在法布里-珀罗干涉型光纤水听器中采用本发明方法能够实现相位载波 解调技术的运用。(二) 背景技术
专利名称:调频竹笛的制作方法技术领域:本发明涉及一种横吹的民族乐器—竹笛,特别是涉及一种可以调整音调频率的调频竹笛,既是对现有竹笛结构的改进,更是对现有竹笛品种的补充,属于传统的民族乐器技术领域,适于竹笛演奏者在不同的温度条件下使用。背景技
专利名称:应用于语音解码存储器系统的资料简拼方法技术领域:本发明是关于语音资料解码的技术领域,尤指一种应用于语音解码存储器系统的资料简拼方法。背景技术: 一般语音资料为节省储存空间,常以一可适性差分脉冲码调变(Adaptive Differ
专利名称:一种相片成册组装机的制作方法技术领域:本实用新型属于一种组装相册的机器,涉及一种能够对相片进 行压线、粘贴、压平以及剪裁等搡作的成册组装机。 背景技术:现有技术中,相片组装成册需要若干个步骤。首先,在相片左右对中处预压压痕,以便相
专利名称:多功能宽带增透眼镜片的制作方法技术领域:本实用新型提供一种多功能宽带增透眼镜片。在日常生活中,人们的眼睛除受到自然光的紫外、红外线的幅射伤害外,也受到越来越多的现代文明带来的光、电磁污染的危害,例如舞台、卡拉OK等娱乐场所的光污染
专利名称:一种高效散热led灯泡的制作方法技术领域:一种高效散热LED灯泡技术领域[0001 ] 本实用新型涉及一种LED灯泡。背景技术:[0002]目前在照明领域,LED因具有节能、高光效、长寿命、启动快等优点,已经越来越广泛应用到光源中