专利名称:用于帧擦除恢复的系统、方法和设备的制作方法
技术领域:
本发明涉及语音信号的处理。
背景技术:
通过数字技术来传输音频(例如话音和音乐)已变得较为普遍,尤其是在长距离电 话、例如IP话音(还称为VoIP,其中IP表示因特网协议)等包交换式电话和例如蜂窝 式电话等数字无线电电话中。此迅速扩散已使得产生了对减少用以经由传输信道传送话 音通信的信息量且同时维持经重构语音的感知质量的关注。举例来说,需要最佳地利用 可用无线系统带宽。 一种用以有效地使用系统带宽的方式是采用信号压縮技术。对于载 运语音信号的无线系统来说,语音压縮(或"语音编码")技术通常用于此目的。
经配置以通过提取与人类语音产生模型有关的参数来压縮语音的装置经常称为声 码器、"音频编码装置"或"语音编码装置"。音频编码装置通常包括编码器和解码器。 编码器通常将传入的语音信号(表示音频信息的数字信号)划分为称为"帧"的时间片 段,分析每一帧以提取某些相关参数,且将所述参数量化为经编码帧。经由传输信道(即, 有线或无线网络连接)将经编码帧传输到包括解码器的接收器。解码器接收并处理经编 码帧,对其进行解量化以产生参数,且使用经解量化参数来重建语音帧。
在典型会话中,每一说话者在约百分之六十的时间内是静默的。语音编码器通常经 配置以区分语音信号的含有语音的帧("有效帧")与语音信号的仅含有静默或背景噪声 的帧("无效帧")。此编码器可经配置以使用不同的编码模式和/或速率来编码有效帧和 无效帧。举例来说,语音编码器通常经配置以使用比编码有效帧所使用的位少的位来编 码无效帧。语音编码装置可对无效帧使用较低位速率,以支持以较低平均位速率进行语 音信号传送,其中存在极少到毫无感知质量损失。用以编码有效帧的位速率的实例包括171位/帧、80位/帧和40位/帧。用以编码无 效帧的位速率的实例包括16位/帧。在蜂窝式电话系统(尤其是符合如由弗吉尼亚州阿 灵屯页电f言工业助、会(Telecommunications Industry Association, Arlington, VA)发布的暂用 标准(IS) -95或类似工业标准的系统)的情形中,这四个位速率还分别称为"全速率"、 "半速率"、"四分之一速率"和"八分之一速率"。
采用语音编码装置的许多通信系统(例如蜂窝式电话和卫星通信系统)依靠无线信 道来传递信息。在传递此信息期间,无线传输信道可能遭受若干错误来源,例如多路径 衰退。传输错误可能导致帧的不可恢复的讹误(还称为"帧擦除")。在典型的蜂窝式电 话系统中,帧擦除以百分之一到百分之三的比率发生,且可能甚至达到或超过百分之五。
采用音频编码布置(例如,因特网协议话音或"VoIP")的包交换式网络中的包损 失的问题非常类似于无线情形中的帧擦除。也就是说,由于包损失的缘故,音频解码器 可能未能接收到帧或可能接收到具有大量位错误的帧。在任一情况下,音频解码器呈现 有相同问题不管经压縮语音信息的损失,仍需要产生经解码音频帧。出于此描述的目 的,术语"帧擦除"可视为包括"包损失"。
帧擦除可在解码器处根据校验功能(例如CRC (循环冗余校验)功能或使用(例如) 一个或一个以上校验和及/或奇偶校验位的其它错误检测功能)的失败而被检测到。此功 能通常由信道解码器执行(例如,在多路复用子层中),所述信道解码器还可执行例如 巻积解码和/或解交错等任务。在典型解码器中,帧错误检测器在接收到帧中存在不可校 正错误的指示后便设定帧擦除旗标。解码器可经配置以选择帧擦除恢复模块来处理设定 帧擦除旗标所针对的帧。
发明内容
根据一种配置的语音解码方法包括在经编码语音信号中检测持续有声片段的第二 帧的擦除。所述方法还包括基于持续有声片段的第一帧而计算用于所述第二帧的替换 帧。在此方法中,计算替换帧包括获得高于第一帧的对应增益值的增益值。
根据另一配置的获得经解码语音信号的帧的方法包括基于来自经编码语音信号的
第一经编码帧的信息和第一激励信号而计算经解码语音信号的第一帧。此方法还包括响
应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示且基于第
二激励信号而计算所述经解码语音信号的紧跟在所述第一帧之后的第二帧。此方法还包
括基于第三激励信号而计算在所述经解码语音信号的所述第一帧之前的第三帧。在此方
法中,第一激励信号基于(A)基于来自第三激励信号的信息的第一值序列与(B)第一增益因数的乘积。在此方法中,计算第二帧包括根据阈值与基于第一增益因数的值之间 的关系而产生第二激励信号,使得第二激励信号基于(A)基于来自所述第一激励信号 的信息的第二值序列与(B)大于第一增益因数的第二增益因数的乘积。
根据另一配置的获得经解码语音信号的帧的方法包括产生第一激励信号,所述第一 激励信号基于第一增益因数与第一值序列的乘积。此方法还包括基于第一激励信号和来 自经编码语音信号的第一经编码帧的信息而计算经解码语音信号的第一帧。此方法还包 括响应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示且根 据阈值与基于第一增益因数的值之间的关系而产生第二激励信号,所述第二激励信号基 于(A)大于第一增益因数的第二增益因数与(B)第二值序列的乘积。此方法还包括基 于第二激励信号而计算紧跟在经解码语音信号的所述第一帧之后的第二帧。此方法还包 括基于第三激励信号而计算在经解码语音信号的所述第一帧之前的第三帧。在此方法 中,第一序列基于来自第三激励信号的信息,且第二序列基于来自第一激励信号的信息。
根据另一配置的用于获得经解码语音信号的帧的设备包括激励信号产生器,其经配 置以产生第一、第二和第三激励信号。此设备还包括频谱整形器,其经配置以(A)基 于第一激励信号和来自经编码语音信号的第一经编码帧的信息而计算经解码语音信号 的第一帧;(B)基于第二激励信号而计算紧跟在经解码语音信号的所述第一帧之后的第 二帧;和(C)基于第三激励信号而计算在经解码语音信号的所述第一帧之前的第三帧。 此设备还包括逻辑模块,其(A)经配置以评估阈值与基于第一增益因数的值之间的关 系,且(B)经布置以接收经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除 的指示。在此设备中,激励信号产生器经配置以产生第一激励信号,所述第一激励信号
基于(A)第一增益因数与(B)基于来自第三激励信号的信息的第一值序列的乘积。在
此设备中,逻辑模块经配置以响应于所述擦除指示且根据所评估的关系而致使激励信号
产生器产生第二激励信号,所述第二激励信号基于(A)大于第一增益因数的第二增益
因数与(B)基于来自第一激励信号的信息的第二值序列的乘积。
根据另一配置的用于获得经解码语音信号的帧的设备包括用于产生基于第一增益
因数与第一值序列的乘积的第一激励信号的装置。此设备还包括用于基于第一激励信号
和来自经编码语音信号的第一经编码帧的信息而计算经解码语音信号的第一帧的装置。
此设备还包括用于响应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的
擦除的指示且根据阈值与基于第一增益因数的值之间的关系而产生基于(A)大于第一
增益因数的第二增益因数与(B)第二值序列的乘积的第二激励信号的装置。此设备还
包括用于基于第二激励信号而计算紧跟在经解码语音信号的所述第一帧之后的第二帧的装置。此设备还包括用于基于第三激励信号而计算在经解码语音信号的所述第一帧之 前的第三帧的装置。在此设备中,第一序列基于来自第三激励信号的信息,且第二序列 基于来自第一激励信号的信息。
根据另一配置的计算机程序产品包括计算机可读媒体,其包括用于致使至少一个计 算机产生基于第一增益因数与第一值序列的乘积的第一激励信号的代码。此媒体还包括 用于致使至少一个计算机基于第一激励信号和来自经编码语音信号的第一经编码帧的 信息而计算经解码语音信号的第一帧的代码。此媒体还包括用于致使至少一个计算机响 应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示且根据阈 值与基于第一增益因数的值之间的关系而产生基于(A)大于第一增益因数的第二增益 因数与(B)第二值序列的乘积的第二激励信号的代码。此媒体还包括用于致使至少一 个计算机基于第二激励信号而计算紧跟在经解码语音信号的所述第一帧之后的第二帧 的代码。此媒体还包括用于致使至少一个计算机基于第三激励信号而计算在经解码语音 信号的所述第一帧之前的第三帧的代码。在此产品中,第一序列基于来自第三激励信号 的信息,且第二序列基于来自第一激励信号的信息。
图1为基于激励式合成滤波器的通用语音解码器的框图。
图2为表示有声语音片段随时间的振幅的图。
图3为具有固定和自适应码簿的CELP解码器的框图。
图4说明解码以CELP格式编码的帧系列的过程中的数据相依性。
图5展示多模式可变速率语音解码器的实例的框图。
图6说明解码跟随有CELP帧的NELP帧(例如,静默或无声语音帧)的序列的过 程中的数据相依性。
图7说明处置跟随在以CELP格式编码的帧之后的帧擦除的过程中的数据相依性。 图8展示符合EVRC服务选项3的帧擦除方法的流程图。 图9展示包括持续有声片段的开始的时间帧序列。
图10a、图10b、图10c和图10d分别展示根据本发明的数种配置的方法M110、M120、 M130和M140的流程图。
图11展示方法M120的实施方案M180的流程图。 图12展示根据一配置的语音解码器的实例的框图。
图13A展示根据通用配置的获得经解码语音信号的帧的方法M200的流程图。图13B展示根据通用配置的用于获得经解码语音信号的帧的设备F200的框图。
图14说明方法M200的实施方案的应用中的数据相依性。
图15A展示方法M200的实施方案方法M201的流程图。
图15B展示对应于图15A的方法M201的设备F201的框图。
图16说明方法M201的典型应用中的一些数据相依性。
图17说明方法M201的实施方案的应用中的数据相依性。
图18展示方法M200的实施方案方法M203的流程图。
图19说明图18的方法M203的典型应用中的一些数据相依性。
图20说明图18的方法M203的应用的一些数据相依性。
图21A展示根据通用配置的用于获得经解码语音信号的帧的设备A100的框图。 图21B说明设备A100的典型应用。
图22展示描述逻辑模块110的实施方案112的操作的逻辑示意图。
图23展示逻辑模块110的实施方案114的操作的流程图。
图24展示逻辑模块110的另一实施方案116的操作的描述。
图25展示逻辑模块116的实施方案118的操作的描述。
图26A展示设备A100的实施方案A100A的框图。
图26B展示设备A100的实施方案A100B的框图。
图26C展示设备A100的实施方案A100C的框图。
图27A展示激励信号产生器120的实施方案122的框图。
图27B展示激励信号产生器122的实施方案124的框图。
图28展示语音参数计算器230的实施方案232的框图。
图29A展示包括擦除检测器210、格式检测器220、语音参数计算器230和设备A100 的实施方案的系统的实例的框图。
图29B展示包括格式检测器220的实施方案222的系统的框图。
具体实施例方式
本文中所描述的配置包括用于帧擦除恢复的系统、方法和设备,其可用以针对其中
持续有声片段的重要帧被擦除的情况提供改进的效能。或者,持续有声片段的重要帧可
被表示为关键帧。明确地预期且特此揭示,此类配置可适于在包交换式网络(例如,经
布置以根据例如VoIP等协议来载运话音传输的有线和/或无线网络)和/或电路交换式网
络中使用。还明确地预期且特此揭示,此类配置可适于在窄带编码系统(例如,编码约四千赫兹或五千赫兹的音频频率范围的系统)以及包括全带编码系统和分带编码系统的 宽带编码系统(例如,编码大于五千赫兹的音频频率的系统)中使用。
除非受其上下文明确地限制,否则术语"产生"在本文中用以指示其普通意义中的 任一者,例如计算或以其它方式生成。除非受其上下文明确地限制,否则术语"计算" 在本文中用以指示其普通意义中的任一者,例如计算、评估和/或从值集合中选择。除非 受其上下文明确地限制,否则术语"获得"用以指示其普通意义中的任一者,例如计算、 导出、接收(例如,从外部装置)和/或检索(例如,从存储元件阵列)。在本描述和权 利要求书中使用术语"包含"的情况下,其并不排除其它元件或操作。术语"基于"(如 在"A基于B"中)用以指示其普通意义中的任一者,包括以下情况(i)"基于至少" (例如,"A基于至少B");以及如果在特定上下文中适当的话,贝U (ii)"等于"(例如, "A等于B")。
除非另有指示,否则具有特定特征的语音解码器的任何揭示还明确地希望揭示具有 类似特征的语音解码方法(且反之亦然),且根据特定配置的语音解码器的任何揭示还 明确地希望揭示根据类似配置的语音解码方法(且反之亦然)。
出于语音编码目的,语音信号通常经数字化(或量化)以获得样本流。数字化过程 可根据此项技术中已知的各种方法中的任一者来执行,所述方法包括(例如)脉冲码调 制(PCM)、压扩p法则PCM和压扩A法则PCM。窄带语音编码器通常使用8 kHz的 取样速率,而宽带语音编码器通常使用较高取样速率(例如,12kHz或16kHz)。
经数字化语音信号被处理为帧系列。此系列通常被实施为非重叠系列,但处理帧或 帧片段(还称为子帧)的操作还可在其输入中包括一个或一个以上相邻帧的片段。语音 信号的帧通常足够短以使得可预期信号的频谱包络在所述帧内保持相对稳定。 一帧通常 对应于语音信号的5毫秒与35毫秒之间(或约40到200个样本),其中IO毫秒、20毫 秒和30毫秒为常见帧大小。经编码帧的实际大小可随编码位速率而逐帧改变。
20毫秒的帧长度对应于处于七千赫兹(kHz)的取样速率下的140个样本、处于8kHz 的取样速率下的160个样本和处于16 kHz的取样速率下的320个样本,但可使用被视 为适合于特定应用的任何取样速率。可用于语音编码的取样速率的另一实例为12.8 kHz, 且另外实例包括在从12.8 kHz到38.4 kHz的范围内的其它速率。
通常,所有帧具有相同长度,且在本文中所描述的特定实例中假定均一帧长度。然 而,还明确地预期且特此揭示,可使用非均一帧长度。举例来说,方法M100和M200 的实施方案还可在针对有效帧和无效帧和/或针对有声帧和无声帧采用不同帧长度的应 用中使用。经编码帧通常含有可从其重构语音信号的对应帧的值。举例来说,经编码帧可包括 所述帧内的能量在频谱上的分布的描述。此能量分布还称为帧的"频率包络"或"频谱 包络"。经编码帧通常包括描述所述帧的频谱包络的有序值序列。在一些情况下,所述 有序序列中的每一值指示信号在对应频率处或在对应频谱区域内的振幅或量值。此描述 的一个实例为有序傅立叶(Fourier)变换系数序列。
在其它情况下,有序序列包括编码模型的参数的值。此有序序列的一个典型实例为 线性预测编码(LPC)分析的系数的值的集合。这些系数编码经编码语音的共振(还称 为"共振峰")且可经配置作为滤波器系数或作为反射系数。最现代的语音编码装置的 编码部分包括提取用于每一帧的LPC系数值集合的分析滤波器。所述集合(其通常经布 置为一个或一个以上向量)中的系数值的数目还称为LPC分析的"阶"。如由通信装置 (例如蜂窝式电话)的语音编码器所执行的LPC分析的典型阶的实例包括4、 6、 8、 10、 12、 16、 20、 24、 28和32。
频谱包络的描述通常以量化形式出现在经编码帧内(例如,作为进入对应査找表或 "码簿"中的一个或一个以上索引)。因此,习惯上使解码器接收呈对于量化更有效的形 式的LPC系数值集合,例如线谱对(LSP)、线谱频率(LSF)、导抗谱对(ISP)、导抗 谱频率(ISF)、倒谱系数或对数面积比的值的集合。语音解码器通常经配置以将此集合 转换成对应LPC系数值集合。
图1展示包括激励式合成滤波器的语音解码器的通用实例。为了解码经编码帧,使 用经解量化LPC系数值以在解码器处配置合成滤波器。经编码帧还可包括时间信息或描 述帧周期内随时间的能量分布的信息。举例来说,时间信息可描述用以激励合成滤波器 以再生语音信号的激励信号。
语音信号的有效帧可经分类为两个或两个以上不同类型中的一者,例如有声(例如, 表示元音声)、无声(例如,表示摩擦音)或过渡(例如,表示词的开头或结尾)。有声 语音的帧倾向于具有长期(即,持续一个以上帧周期)且与音调有关的周期性结构,且 通常更有效的是使用编码此长期频谱特征的描述的编码模式来编码有声帧(或有声帧序 列)。此类编码模式的卖例包括代码激励线性预测(CELP)、原型音调周期(PPP)和原 型波形内插(PWI)。另一方面,无声帧和无效帧通常缺乏任何显著的长期频谱特征,且 语音编码器可经配置以使用并不试图描述此特征的编码模式来编码这些帧。噪声激励线 性预测(NELP)是此编码模式的一个实例。
图2展示有声语音片段(例如元音)随时间的振幅的一个实例。对于有声帧来说,
激励信号通常酷似在音调频率处为周期性的脉冲系列,而对于无声帧来说,激励信号通常类似于白高斯(Gaussian)噪声。CELP编码装置可利用作为有声语音片段的特性的较 高周期性来实现更好的编码效率。
CELP编码装置是使用一个或一个以上码簿来编码激励信号的合成式分析语音编码 装置。在编码器处,选择一个或一个以上码簿条目。解码器接收这些条目的码簿索引以 及增益因数的对应值(其还可为进入一个或一个以上增益码簿中的索引)。解码器通过 增益因数来縮放码簿条目(或基于其的信号)以获得激励信号,所述激励信号用以激励 合成滤波器且获得经解码语音信号。
一些CELP系统使用音调预测性滤波器来模型化周期性。其它CELP系统使用自适 应码簿(或ACB,还称为"音调码簿")来模型化激励信号的周期性或音调相关分量, 其中固定码簿(还称为"创新码簿")通常用以将非周期性分量模型化为(例如)脉冲 位置系列。 一般来说,高有声片段是最为感知相关的。对于使用自适应CELP方案来编 码的高有声语音帧来说,激励信号的大部分由ACB模型化,所述ACB通常为强周期性 的,其中主要频率分量对应于音调滞后。
对激励信号的ACB贡献表示当前帧的残余部分与来自一个或一个以上过去帧的信 息之间的相关性。ACB通常被实施为存储过去语音信号的样本或其导出物(例如语音残 余或激励信号)的存储器。举例来说,ACB可含有被延迟不同量的先前残余部分的复本。 在一个实例中,ACB包括先前合成的语音激励波形的不同音调周期的集合。
经自适应编码的帧的一个参数是音调滞后(还称为延迟或音调延迟)。此参数通常 经表达为最大化所述帧的自相关功能的语音样本数目且可包括分数分量。人类话音的音 调频率通常在从40Hz到500 Hz的范围内,其对应于约200到16个样本。自适应CELP 解码器的一个实例通过音调滞后来转译选定ACB条目。解码器还可内插经转译条目(例 如,使用有限脉冲响应或FIR滤波器)。在一些情况下,音调滞后可充当ACB索引。自 适应CELP解码器的另一实例经配置以根据音调滞后参数的对应连续但不同的值而使自 适应码簿的片段平滑(或"时间扭曲")。
经自适应编码的帧的另一参数是ACB增益(或音调增益),其指示长期周期性的强 度且通常针对每一子帧来评估。为了获得对用于特定子帧的激励信号的ACB贡献,解 码器将内插信号(或其对应部分)乘以对应ACB增益值。图3展示具有ACB的CELP 解码器的一个实例的框图,其中ge和gp分别表示码簿增益和音调增益。另一常见ACB 参数是A延迟,其指示当前帧与先前帧之间的延迟差值且可用以计算经擦除或讹误帧的 音调滞后。
众所周知的时域语音编码装置是L.B.拉比纳(L.B. Rabiner)和R.W.夏佛(R.W.Schafer)的"语音信号的数字处理(Digital Processing of Speech Signals)"第396到453 页(1978年)中所描述的代码激励线性预测(CELP)编码装置。示范性可变速率CELP 编码装置在第5,414,796号美国专利中描述,所述专利转让给本发明的受让人且以引用 的方式全部并入本文中。存在CELP的许多变型。代表性实例包括下列各项AMR语 音编解码器(自适应多速率,第三代合作伙伴计划(3GPP)技术规格(TS) 26.090,第 4、5禾B6章,2004年12月);AMR-WB语音编解码器(AMR-宽带,国际电信联盟(ITU) -丁建议&722.2,第5和6章,2003年7月);以及EVRC (增强型可变速率编解码器, 电子工业联盟(EIA) /电信工业协会(TIA)暂用标准IS-127,第4章和第5章,1997 年1月)。
图4说明解码CELP帧系列的过程中的数据相依性。经编码帧B提供自适应增益因 数B,且自适应码簿提供基于来自先前激励信号A的信息的序列A。解码过程产生基于 自适应增益因数B和序列A的激励信号B,所述激励信号B根据来自经编码帧B的频 谱信息而经频谱整形以产生经解码帧B。解码过程还基于激励信号B而更新自适应码簿。 下一经编码帧C提供自适应增益因数C,且自适应码簿提供基于激励信号B的序列B。 解码过程产生基于自适应增益因数C和序列B的激励信号C,所述激励信号C根据来自 经编码帧C的频谱信息而经频谱整形以产生经解码帧C。解码过程还基于激励信号C而 更新自适应码簿,等等,直到遇到以不同编码模式(例如,NELP)编码的帧为止。
可能需要使用可变速率编码方案(例如,以平衡网络需求和容量)。还可能需要使 用多模式编码方案,其中根据基于(例如)周期性或发声的分类而使用不同模式来编码 帧。举例来说,可能需要使语音编码装置针对有效帧和无效帧使用不同的编码模式和/ 或位速率。还可能需要使语音编码装置针对不同类型的有效帧使用不同的位速率与编码 模式组合(还称为"编码方案")。此语音编码装置的一个实例针对含有有声语音的帧和 过渡帧使用全速率CELP方案,针对含有无声语音的帧使用半速率NELP方案,且针对 无效帧使用八分之一速率NELP方案。此语音编码装置的其它实例支持用于一个或一个 以上编码方案(例如全速率与半速率CELP方案和/或全速率与四分之一速率PPP方案) 的多个编码速率。
图5展示接收包和对应包类型指示符(例如,从多路复用子层)的多模式可变速率
解码器的实例的框图。在此实例中,帧错误检测器根据包类型指示符来选择对应速率(或
擦除恢复),且解包化器分解包且选择对应模式。或者,帧擦除检测器可经配置以选择
正确编码方案。此实例中的可用模式包括全速率与半速率CELP、全速率与四分之一速
率PPP (原型音调周期,用于强有声帧)、NELP (用于无声帧)和静默。解码器通常包括经配置以减少量化噪声(例如,通过强调共振峰频率和/或衰减频谱谷)的后置滤波器 且还可包括自适应增益控制。
图6说明解码跟随有CELP帧的NELP帧的过程中的数据相依性。为了解码经编码 NELP帧N,解码过程产生噪声信号作为激励信号N,所述激励信号N根据来自经编码 帧N的频谱信息而经频谱整形以产生经解码帧N。在此实例中,解码过程还基于激励信 号N而更新自适应码簿。经编码CELP帧C提供自适应增益因数C,且自适应码簿提供 基于激励信号N的序列N。 NELP帧N的激励信号与CELP帧C的激励信号之间的相关 性可能非常低,使得序列N与帧C的激励信号之间的相关性也可能非常低。因此,自适 应增益因数C可能具有接近于零的值。解码过程产生名义上基于自适应增益因数C和序 列N但可能更大量地基于来自经编码帧C的固定码簿信息的激励信号C,且激励信号C 根据来自经编码帧C的频谱信息而经频谱整形以产生经解码帧C。解码过程还基于激励 信号C而更新自适应码簿。
在一些CELP编码装置中,针对每一帧而更新LPC系数,而针对每一子帧而更新例 如音调滞后和/或ACB增益等激励参数。在AMR-WB中,举例来说,针对四个子帧中 的每一者而将例如音调滞后和ACB增益等CELP激励参数更新一次。在EVRC的CELP 模式中,160样本帧的三个子帧(分别具有长度53、 53和54个样本)中的每一者具有 对应ACB和FCB增益值以及对应FCB索引。单个编解码器内的不同模式还可以不同方 式处理帧。在EVRC编解码器中,举例来说,CELP模式根据具有三个子帧的帧来处理 激励信号,而NELP模式根据具有四个子帧的帧来处理激励信号。还存在根据具有两个 子帧的帧来处理激励信号的模式。
可变速率语音解码器可经配置以从例如帧能量等一个或一个以上参数确定经编码 帧的位速率。在一些应用中,编码系统经配置以针对特定位速率仅使用一个编码模式, 使得经编码帧的位速率还指示编码模式。在其它情况下,经编码帧可包括例如一个或一 个以上位的集合等信息,其识别编码所述帧所根据的编码模式。此位集合还称为"编码 索引"。在一些情况下,编码索引可明确地指示编码模式。在其它情况下,编码索引可 (例如)通过指示对于另一编码模式将为无效的值来隐含地指示编码模式。在此描述和 所附权利要求书中,术语"格式"或"帧格式"用以指示经编码帧的可从中确定编码模 式的一个或一个以上方面,所述方面可包括如上所述的位速率和/或编码索引。
图7说明处置跟随在CELP帧之后的帧擦除的过程中的数据相依性。如在图4中,
经编码帧B提供自适应增益因数B,且自适应码簿提供基于来自先前激励信号A的信息
的序列A。解码过程产生基于自适应增益因数B和序列A的激励信号B,所述激励信号B根据来自经编码帧B的频谱信息而经频谱整形以产生经解码帧B。解码过程还基于激 励信号B而更新自适应码簿。响应于下一经编码帧被擦除的指示,解码过程继续以先前 编码模式(即,CELP)进行操作,使得自适应码簿提供基于激励信号B的序列B。在 此情况下,解码过程产生基于自适应增益因数B和序列B的激励信号X,所述激励信号 X根据来自经编码帧B的频谱信息而经频谱整形以产生经解码帧X。
图8展示符合3GPP2标准C.S0014-A vl.O (EVRC服务选项3)(第5章,2004年4 月)的帧擦除恢复方法的流程图。第2002/0123887号美国专利申请公开案(恩诺(U皿o)) 描述根据ITU-T建议G729的类似过程。此方法可(例如)通过如图5所示的帧错误恢 复模块来执行。所述方法以检测到当前帧为不可用(例如,用于当前帧的帧擦除旗标 [FER(m)]的值为真)来起始。任务T110确定先前帧是否也为不可用。在此实施方案中, 任务T110确定用于先前帧的帧擦除旗标[FER(m-l)]的值是否也为真。
如果先前帧未被擦除,则任务T120将用于当前帧的平均自适应码簿增益[g,g(m)]
的值设定为用于先前帧的平均自适应码簿增益[gpavg(m-l)]的值。否则(即,如果先前帧
也被擦除),则任务T130将用于当前帧的平均ACB增益[gpavg(m)]的值设定为用于先前 帧的平均ACB增益[gpavg(m-l)]的经衰减版本。在此实例中,任务T130将平均ACB增 益设定为gp^(m-l)的值的0.75倍。任务T140接着将用于当前帧的子帧的ACB增益 [gp(m.i),其中1 = 0,1,2]的值设定为gpavg(m)的值。通常,针对经擦除帧而将FCB增益因 数设定为零。3GPP2标准C.S0014-C vl.O的章节5.2.3.5针对EVRC服务选项68而描述 此方法的变型,其中如果先前帧被擦除或经处理为静默或NELP帧,则将用于当前帧的 子帧的ACB增益[gp(m.i),其中i = 0,1,2]的值设定为零。
跟随在帧擦除之后的帧可仅在无记忆系统或编码模式中毫无错误地进行解码。对于 利用与一个或一个以上过去帧的相关性的模式来说,帧擦除可能致使错误传播到后续帧
中。举例来说,自适应解码器的状态变量可能需要一些时间来从帧擦除中恢复。对于 CELP编码装置来说,自适应码簿引入强帧间相依性且通常是此错误传播的主因。因此, 典型的是使用不高于先前平均值的ACB增益(如在任务T120中)或甚至使ACB增益 衰减(如在任务T130中)。然而,在某些情况下,此实践可能会不利地影响后续帧的再 生。
图9说明包括跟随有持续有声片段的非有声片段的帧序列的实例。所述持续有声片
段可出现在例如"crazy"或"fed"等单词中。如此图中所指示,持续有声片段的第一
帧对过去具有低相依性。具体地说,如果使用自适应码簿来编码所述帧,则用于所述帧
的自适应码簿增益值将较低。对于持续有声片段中的其余帧来说,ACB增益值将由于邻近帧之间的强相关性而通常较高。
在此情形中,如果持续有声片段的第二帧被擦除,则可能出现问题。因为此帧对先 前帧具有高相依性,所以其自适应码簿增益值应较高,从而加强周期性分量。然而,因 为帧擦除恢复将通常从先前帧重构经擦除帧,所以经恢复帧将具有低自适应码簿增益 值,使得来自先前有声帧的贡献将不适当地低。此错误可传播穿过接下来的若干帧。出 于此些原因,持续有声片段的第二帧还称为重要帧。或者,持续有声片段的第二帧还可 称为关键帧。
图10a、图10b、图10c和图10d展示根据本发明的相应配置的方法M110、 M120、 M130和M140的流程图。这些方法中的第一任务(任务Tll、 T12和T13)检测在帧擦 除之前的两个帧中的一个或一个以上特定模式序列或(任务T14)检测持续有声片段的 重要帧的擦除。在任务Tll、 T12和T13中,通常参考编码那些帧所根据的模式来确定 特定序列。
在方法M110中,任务T11检测序列(非有声帧、有声帧、帧擦除)。"非有声帧" 的类别可包括静默帧(即,背景噪声)以及例如摩擦音等无声帧。举例来说,类别"无 声帧"可经实施为包括以NELP模式或静默模式(其通常也为NELP模式)编码的帧。 如图10b所示,"有声帧"的类别可在任务T12中限于使用CELP模式(例如,在还具 有一个或一个以上PPP模式的解码器中)而编码的帧。此类别还可进一步限于使用具有 自适应码簿的CELP模式(例如,在还支持仅具有固定码簿的CELP模式的解码器中) 而编码的帧。
方法M130的任务T13按照用于帧中的激励信号来特性化目标序列,其中第一帧具 有非周期性激励(例如,如在NELP或静默编码中所使用的随机激励),且第二帧具有 自适应周期性激励(例如,如在具有自适应码簿的CELP模式中所使用)。在另一实例 中,任务T13经实施以使得所检测序列还包括不具有激励信号的第一帧。方法M140的 任务T14 (其检测持续有声片段的重要帧的擦除)可经实施以检测紧跟在序列(NELP 或静默帧、CELP帧)之后的帧擦除。
任务T20至少部分地基于擦除之前的帧来获得增益值。举例来说,所获得的增益值 可为针对经擦除帧而预测(例如,通过帧擦除恢复模块)的增益值。在特定实例中,增 益值为通过帧擦除恢复模块而针对经擦除帧所预测的激励增益值(例如ACB增益值)。 图8的任务T110到T140展示一个实例,其中基于在擦除之前的帧而预测若干ACB值。
如果检测到所指示序列(或所指示序列中的一者),则任务T30将所获得的增益值
与阈值进行比较。如果所获得的增益值小于(或者,不大于)所述阈值,则任务T40增加所获得的增益值。举例来说,任务T40可经配置以将正值添加到所获得的增益值或将所获得的增益值乘以大于一的因数。或者,任务T40可经配置以用一个或一个以上较高值来替换所获得的增益值。
图11展示方法M120的配置M180的流程图。任务TllO、 T120、 T130和T140如上文所描述。在已设定gpavg(m)的值(任务T120或T130)之后,任务N210、 N220和N230测试与当前帧和近来历史有关的某些条件。任务N210确定先前帧是否经编码为CELP帧。任务N220确定先前帧之前的帧是否经编码为非有声帧(例如,经编码为NELP或静默)。任务N230确定gpavg(m)的值是否小于阈值Tmax。如果任务N210、N220和N230中的任一者的结果为否定的,则如上所述来执行任务T140。否则,任务N240将新增益轮廓指派给当前帧。
在图11所示的特定实例中,任务N240将值Tl、 T2和T3分别指派给gp(m.i)(其中1 = 0,1,2)的值。这些值可经布置以使得Tl^r22T3,从而产生为水平或渐减的增益轮廓,其中T1接近于(或等于)Tmax。
任务N240的其它实施方案可经配置以将gp(m.i)的一个或一个以上值乘以相应增益因数(至少一个增益因数大于一)或共用增益因数,或将正偏移添加到gp(m.i)的一个或一个以上值。在此些情况下,可能需要对gp(m.i)的每一值强加上限(例如,Tmax)。任务N210到N240可经实施为帧擦除恢复模块内的硬件、固件和/或软件例行程序。
在一些技术中,从在一个或一个以上先前帧和(可能) 一个或一个以上跟随帧期间所接收的信息外推经擦除帧。在一些配置中,先前帧与未来帧两者中的语音参数用于重构经擦除帧。在此情况下,任务T20可经配置以基于擦除之前的帧与擦除之后的帧两者来计算所获得的增益值。另外或替代地,任务T40的实施方案(例如,任务N240)可使用来自未来帧的信息来选择增益轮廓(例如,经由内插增益值)。举例来说,任务T40的此实施方案可选择水平或渐增的增益轮廓代替渐减的增益轮廓,或选择渐增的增益轮廓代替水平的增益轮廓。此种类的配置可使用抖动缓冲器来指示未来帧是否可用于此用途。
图12展示根据一配置的包括帧擦除恢复模块100的语音解码器的框图。此模块100可经配置以执行如本文中所描述的方法MllO、 M120、 M130或M180。
图13A展示根据通用配置的获得经解码语音信号的帧的方法M200的流程图,所述
方法包括任务T210、 T220、 T230、 T240、 T245和T250。任务T210产生第一激励信号。
基于第一激励信号,任务T220计算经解码语音信号的第一帧。任务T230产生第二激励
信号。基于第二激励信号,任务T240计算紧跟在经解码语音信号的第一帧之后的第二帧。任务T245产生第三激励信号。依据特定应用而定,任务T245可经配置以产生基于所产生噪声信号和/或基于来自自适应码簿的信息(例如,基于来自一个或一个以上先前激励信号的信息)的第三激励信号。基于第三激励信号,任务T250计算紧接在经解码语音信号的第一帧之前的第三帧。图14说明方法M200的典型应用中的一些数据相依性。
任务T210响应于经编码语音信号的第一经编码帧具有第一格式的指示而执行。第一格式指示将使用基于对过去激励信息的记忆的激励信号来解码所述帧(例如,使用CELP编码模式)。对于在第一经编码帧的位速率下仅使用一个编码模式的编码系统来说,位速率的确定可足以确定编码模式,使得位速率的指示还可用以指示帧格式。
对于在第一经编码帧的位速率下使用一个以上编码模式的编码系统来说,经编码帧可包括编码索引,例如识别编码模式的一个或一个以上位的集合。在此情况下,格式指示可基于编码索引的确定。在一些情况下,编码索引可明确地指示编码模式。在其它情况下,编码索引可(例如)通过指示对于另一编码模式将为无效的值来隐含地指示编码模式。
响应于格式指示,任务T210产生基于第一值序列的第一激励信号。第一值序列基于来自第三激励信号的信息,例如第三激励信号的片段。第一序列与第三激励信号之间的此关系由图13A中的虚线指示。在典型实例中,第一序列基于第三激励信号的最后子帧。任务T210可包括从自适应码簿检索第一序列。
图13B展示根据通用配置的用于获得经解码语音信号的帧的设备F200的框图。设备F200包括用于执行图13A的方法M200的各种任务的装置。装置F210产生第一激励信号。基于第一激励信号,装置F220计算经解码语音信号的第一帧。装置F230产生第二激励信号。基于第二激励信号,装置F240计算紧跟在经解码语音信号的第一帧之后的第二帧。装置F245产生第三激励信号。依据特定应用而定,装置F245可经配置以产生基于所产生噪声信号和/或基于来自自适应码簿的信息(例如,基于来自一个或一个以上先前激励信号的信息)的第三激励信号。基于第三激励信号,装置F250计算紧接在经解码语音信号的第一帧之前的第三帧。
图14展示其中任务T210产生基于第一增益因数和第一序列的第一激励信号的实例。在此情况下,任务T210可经配置以产生基于第一增益因数与第一序列的乘积的第一激励信号。第一增益因数可基于来自第一经编码帧的信息,例如自适应增益码簿索引。任务T210可经配置以产生基于来自第一经编码帧的其它信息(例如指定对第一激励信号的固定码簿贡献的信息(例如, 一个或一个以上码簿索引和对应增益因数值或码簿索引))的第一激励信号。基于第一激励信号和来自第一经编码帧的信息,任务T220计算经解码语音信号的第一帧。通常,来自第一经编码帧的信息包括频谱参数值集合(例如, 一个或一个以上LSF或LPC系数向量),使得任务T220经配置以根据所述频谱参数值来整形第一激励信号的频谱。任务T220还可包括对第一激励信号、来自第一经编码帧的信息和/或所计算的第一帧执行一个或一个以上其它处理操作(例如,滤波、平滑、内插)。
任务T230响应于紧跟在经编码语音信号中的第一经编码帧之后的经编码帧的擦除的指示而执行。所述擦除指示可基于下列条件中的一者或一者以上(1)所述帧含有过多位错误要恢复;(2)针对所述帧而指示的位速率为无效或无支持的;(3)所述帧的所有位均为零;(4)针对所述帧而指示的位速率为八分之一速率,且所述帧的所有位均为一;(5)所述帧为空白的且上一有效位速率不为八分之一速率。
任务T230还根据阈值与基于第一增益因数的值(还称为"基线增益因数值")之间的关系而执行。举例来说,任务T230可经配置以在基线增益因数值小于(或者,不大于)阈值的情况下执行。尤其对于其中第一经编码帧仅包括一个自适应码簿增益因数的应用来说,基线增益因数值可仅仅为第一增益因数的值。对于其中第一经编码帧包括若干自适应码簿增益因数(例如,用于每一子帧的不同因数)的应用来说,基线增益因数值还可基于其它自适应码簿增益因数中的一者或一者以上。在此情况下,举例来说,如在参看图11而论述的值gpavg(m)中,基线增益因数值可为第一经编码帧的自适应码簿增益因数的平均值。
任务T230还可响应于第一经编码帧具有第一格式且在第一经编码帧之前的经编码帧("先前帧")具有不同于第一格式的第二格式的指示而执行。第二格式指示将使用基于噪声信号的激励信号来解码所述帧(例如,使用NELP编码模式)。对于在先前帧的位速率下仅使用一个编码模式的编码系统来说,位速率的确定可足以确定编码模式,使得位速率的指示还可用来指示帧格式。或者,先前帧可包括指示编码模式的编码索引,使得格式指示可基于编码索引的确定。
任务T230产生基于大于第一增益因数的第二增益因数的第二激励信号。第二增益因数还可大于基线增益因数值。举例来说,第二增益因数可等于或甚至大于阈值。对于其中任务T230经配置以产生第二激励信号作为一系列子帧激励信号的情况来说,可针对每一子帧激励信号使用第二增益因数的不同值,其中所述值中的至少一者大于基线增益因数值。在此情况下,第二增益因数的不同值可能需要经布置以在帧周期内上升或下降。
任务T230通常经配置以产生基于第二增益因数与第二值序列的乘积的第二激励信号。如图14所示,第二序列基于来自第一激励信号的信息,例如第一激励信号的片段。在典型实例中,第二序列基于第一激励信号的最后子帧。因此,任务T210可经配置以基于来自第一激励信号的信息而更新自适应码簿。对于将方法M200应用于支持松弛CELP (RCELP)编码模式的编码系统来说,任务T210的此实施方案可经配置以根据音调滞后参数的对应值来使片段时间扭曲。此扭曲操作的实例在上文所引用的3GPP2文献C.S0014-C vl.O的章节5.2.2 (参看章节4.11.5)中描述。任务T230的其它实施方案可包括如上所述的方法MllO、 M120、 M130、 M140和M180中的一者或一者以上。
基于第二激励信号,任务T240计算紧跟在经解码语音信号的第一帧之后的第二帧。如图14所示,任务T240还可经配置以基于来自第一经编码帧的信息(例如,如上所述的频谱参数值集合)而计算第二帧。举例来说,任务T240可经配置以根据频谱参数值集合来整形第二激励信号的频谱。
或者,任务T240可经配置以根据基于所述频谱参数值集合的第二频谱参数值集合来整形第二激励信号的频谱。举例来说,任务T240可经配置以将第二频谱参数值集合计算为来自第一经编码帧的频谱参数值集合与初始频谱参数值集合的平均值。此计算为
加权平均值的实例在上文所引用的3GPP2文献C.S0014-C vl.O的章节5.2.1中描述。任务T240还可包括对第二激励信号、来自第一经编码帧的信息和所计算的第二帧中的一者或一者以上执行一个或一个以上其它处理操作(例如,滤波、平滑、内插)。
基于第三激励信号,任务T250计算在经解码语音信号中的第一帧之前的第三帧。任务T250还可包括通过存储第一序列来更新自适应码簿,其中第一序列基于第三激励信号的至少一片段。对于方法M200应用于支持松弛CELP (RCELP)编码模式的编码系统的应用来说,任务T250可经配置以根据音调滞后参数的对应值来使片段时间扭曲。此扭曲操作的实例在上文所引用的3GPP2文献C.S0014-C vl.O的章节5.2.2 (参看章节4.11.5)中描述。
经编码帧的至少一些参数可经布置以将对应经解码帧的一方面描述为子帧系列。举
例来说,常见的是使根据CELP编码模式而格式化的经编码帧包括用于所述帧的频谱参
数值集合和用于所述子帧中的每一者的独立时间参数集合(例如,码簿索引和增益因数
值)。对应解码器可经配置以通过子帧递增地计算经解码帧。在此情况下,任务T210可
经配置以产生第一激励信号作为子帧激励信号系列,使得所述子帧激励信号中的每一者
可基于不同增益因数和/或序列。任务T210还可经配置以用来自子帧激励信号中的每一
者的信息来连续地更新自适应码簿。同样地,任务T220可经配置以基于第一激励信号
的不同子帧而计算第一经解码帧的每一子帧。任务T220还可经配置以在帧之间内插子帧内的频谱参数集合或以其它方式使其平滑。
图15A展示解码器可经配置以使用来自基于噪声信号的激励信号(例如,响应于NELP格式的指示而产生的激励信号)的信息来更新自适应码簿。明确地说,图15A展示方法M200 (来自图13A且上文论述)的此实施方案M201的流程图,所述实施方案M201包括任务T260和T270。任务T260产生噪声信号(例如,近似白高斯噪声的伪随机信号),且任务T270产生基于所产生的噪声信号的第三激励信号。再次,第一序列与第三激励信号之间的关系由图15A中的虚线指示。可能需要使任务T260使用基于来自对应经编码帧的其它信息(例如,频谱信息)的种子值来产生噪声信号,因为此技术可用以支持在编码器处已使用的相同噪声信号的产生。方法M201还包括任务T250 (来自图13A且上文论述)的实施方案T252,其基于第三激励信号而计算第三帧。任务T252还经配置以基于来自紧接在第一经编码帧之前("先前帧")且具有第二格式的经编码帧的信息而计算第三帧。在此些情况下,任务T230可基于(A)先前帧具有第二格式和(B)第一经编码帧具有第一格式的指示。
图15B展示对应于上文相对于图15A所论述的方法M201的设备F201的框图。设备F201包括用于执行方法M201的各种任务的装置。各种元件可根据能够执行此些任务的任何结构(包括用于执行本文中所揭示的此些任务的结构中的任一者)来实施(例如,作为一个或一个以上指令集合、 一个或一个以上逻辑元件阵列,等等)。图15B展示解码器可经配置以使用来自基于噪声信号的激励信号(例如,响应于NELP格式的指
示而产生的激励信号)的信息来更新自适应码簿。图15B的设备F201类似于图13B的
设备F200,其中添加了装置F260、 F270和F252。装置F260产生噪声信号(例如,近
似白高斯噪声的伪随机信号),且装置F270产生基于所产生的噪声信号的第三激励信号。
再次,第一序列与第三激励信号之间的关系由所说明的虚线指示。可能需要使装置F260
使用基于来自对应经编码帧的其它信息(例如,频谱信息)的种子值来产生噪声信号,
因为此技术可用以支持在编码器处已使用的相同噪声信号的产生。设备F201还包括对
应于装置F250 (来自图13A且上文论述)的装置F252。装置F252基于第三激励信号而
计算第三帧。装置F252还经配置以基于来自紧接在第一经编码帧之前("先前帧")且
具有第二格式的经编码帧的信息而计算第三帧。在此情况下,装置F230可基于(A)先
前帧具有第二格式和(B)第一经编码帧具有第一格式的指示。
图16说明方法M201的典型应用中的一些数据相依性。在此应用中,紧接在第一经
编码帧之前的经编码帧(在此图中被指示为"第二经编码帧")具有第二格式(例如,
NELP格式)。如图16所示,任务T252经配置以基于来自第二经编码帧的信息而计算第三帧。举例来说,任务T252可经配置以根据基于来自第二经编码帧的信息的频谱参数值集合来整形第三激励信号的频谱。任务T252还可包括对第三激励信号、来自第二经编码帧的信息和所计算的第三帧中的一者或一者以上执行一个或一个以上其它处理操作(例如,滤波、平滑、内插)。任务T252还可经配置以基于来自第三激励信号的信息(例如,第三激励信号的片段)而更新自适应码簿。
语音信号通常包括期间说话者静默的周期。可能需要使编码器在此周期期间针对不到全部的无效帧传输经编码帧。此操作还称为不连续传输(DTX)。在一个实例中,语音编码器通过针对具有32个连续无效帧的每一串传输一个经编码无效帧(还称为"静默描述符"、"静默描述"或SID)来执行DTX。在其它实例中,语音编码器通过针对具有不同数目的连续无效帧(例如,8个或16个)的每一串传输一个SID和/或通过在某其它事件(例如帧能量改变或频谱倾斜)后即传输SID来执行DTX。对应解码器针对尚未接收到经编码帧时的后续帧周期使用所述SID中的信息(通常,频谱参数值和增益轮廓)来合成无效帧。
可能需要在还支持DTX的编码系统中使用方法M200。图17说明方法M201的此应用的一些数据相依性,其中第二经编码帧为SID帧,且此帧与第一经编码帧之间的帧被消隐(此处被指示为"DTX时间间隔")。将第二经编码帧连接到任务T252的线为虚线,以指示来自第二经编码帧的信息(例如,频谱参数值)用以计算经解码语音信号的一个以上帧。
如上所述,任务T230可响应于在第一经编码帧之前的经编码帧具有第二格式的指示而执行。对于如图17所示的应用来说,第二格式的此指示可为紧接在第一经编码帧之前的帧对于DTX而被消隐的指示,或NELP编码模式用以计算经解码语音信号的对应帧的指示。或者,第二格式的此指示可为第二经编码帧的格式的指示(即,在第一经编码帧之前的最后SID帧的格式的指示)。
图17展示特定实例,其中第三帧紧接在经解码语音信号中的第一帧之前且对应于DTX时间间隔内的最后帧周期。在其它实例中,第三帧对应于DTX时间间隔内的另一帧周期,使得一个或一个以上帧将经解码语音信号中的第三帧与第一帧分离。图17还展示其中在DTX时间间隔期间不更新自适应码簿的实例。在其它实例中,在DTX时间间隔期间所产生的一个或一个以上激励信号用以更新自适应码簿。
对基于噪声的激励信号的记忆可能对于产生用于后续帧的激励信号没有用。因此,
可能需要使解码器不使用来自基于噪声的激励信号的信息来更新自适应码簿。举例来
说,此解码器可经配置以仅在解码CELP帧时或仅在解码CELP、 PPP或PWI帧时且不在解码NELP帧时更新自适应码簿。
图18展示方法M200 (图13A)的此实施方案方法M203的流程图,所述方法M203 包括任务T260、 T280和T290。任务T280产生基于由任务T260所产生的噪声信号的第 四激励信号。在此特定实例中,任务T210和T280经配置以根据第二经编码帧具有第二 格式的指示而执行,如实线所指示。基于第四激励信号,任务T2卯计算经解码语音信 号的紧接在第三帧之前的第四帧。方法M203还包括任务T250 (图13A)的实施方案 T254,其基于来自任务T245的第三激励信号而计算经解码语音信号的第三帧。
任务T290基于来自在第一经编码帧之前的第二经编码帧的信息(例如频谱参数值 集合)而计算第四帧。举例来说,任务T290可经配置以根据频谱参数值集合来整形第 四激励信号的频谱。任务T254基于来自在第二经编码帧之前的第三经编码帧的信息(例 如频谱参数值集合)而计算第三帧。举例来说,任务T254可经配置以根据频谱参数值 集合来整形第三激励信号的频谱。任务T254还可经配置以响应于第三经编码帧具有第 一格式的指示而执行。
图19说明方法M203 (图18)的典型应用中的一些数据相依性。在此应用中,第三 经编码帧可通过其激励信号不用以更新自适应码簿的一个或一个以上经编码帧(例如, 具有NELP格式的经编码帧)来与第二经编码帧分离。在此情况下,第三与第四经解码 帧将通常通过使第二与第三经编码帧分离的相同数目的帧来分离。
如上所述,可能需要在还支持DTX的编码系统中使用方法M200。图20说明方法 M203 (图18)的此应用的一些数据相依性,其中第二经编码帧为SID帧,且此帧与第 一经编码帧之间的帧被消隐。将第二经编码帧连接到任务T290的线为虚线,以指示来 自第二经编码帧的信息(例如,频谱参数值)用以计算经解码语音信号的一个以上帧。
如上所述,任务T230可响应于在第一经编码帧之前的经编码帧具有第二格式的指 示而执行。对于如图20所示的应用来说,第二格式的此指示可为紧接在第一经编码帧 之前的帧针对DTX而被消隐的指示,或NELP编码模式用以计算经解码语音信号的对 应帧的指示。或者,第二格式的此指示可为第二经编码帧的格式的指示(即,在第一经 编码帧之前的最后SID帧的格式的指示)。
图20展示特定实例,其中第四帧紧接在经解码语音信号中的第一帧之前且对应于 DTX时间间隔内的最后帧周期。在其它实例中,第四帧对应于DTX时间间隔内的另一 帧周期,使得一个或一个以上帧将经解码语音信号中的第四帧与第一帧分离。
在方法M200 (图13A)的实施方案的典型应用中,逻辑元件阵列(例如,逻辑门)
经配置以执行所述方法的各种任务中的一者、 一者以上或甚至全部。所述任务中的一者或一者以上(可能为全部)还可被实施为包含于计算机程序产品(例如, 一个或一个以 上数据存储媒体,例如磁盘、快闪或其它非易失性存储卡、半导体存储器芯片,等等) 中的代码(例如, 一个或一个以上指令集合),所述代码可由包括逻辑元件阵列(例如, 处理器、微处理器、微控制器或其它有限状态机)的机器(例如,计算机)读取且/或执 行。方法M200 (图13A)的实施方案的任务还可通过一个以上此阵列或机器来执行。 在这些或其它实施方案中,所述任务可在用于无线通信的装置(例如蜂窝式电话或具有 此通信能力的其它装置)内执行。此装置可经配置以与电路交换式和/或包交换式网络通 信(例如,使用例如VoIP等一个或一个以上协议)。举例来说,此装置可包括经配置以 接收经编码帧的RF电路。
图21A展示根据通用配置的用于获得经解码语音信号的帧的设备A100的框图。举 例来说,设备A100可经配置以执行包括如本文中所述的方法M100或M200的实施方 案的语音解码方法。图21B说明设备A100的典型应用,所述设备经配置以基于(A) 经编码语音信号的第一经编码帧和(B)紧跟在经编码语音信号中的第一经编码帧之后 的帧的擦除的指示而计算经解码语音信号的连续第一和第二帧。设备A100包括逻辑 模块110,其经布置以接收擦除指示;激励信号产生器120,其经配置以如上所述产生 第一、第二和第三激励信号;以及频谱整形器130,其经配置以计算经解码语音信号的 第一和第二帧。
包括设备A100的通信装置(例如蜂窝式电话)可经配置以从有线、无线或光学传 输信道接收包括经编码语音信号的传输。此装置可经配置以对载波信号进行解调且/或对 传输执行预处理操作以获得经编码语音信号,例如解交错和/或解码错误校正码。此装置 还可包括设备A100和用于编码且/或传输双工会话的另一语音信号的设备(例如,如在 收发器中)的两者的实施方案。
逻辑模块110经配置且经布置以致使激励信号产生器120输出第二激励信号。第二 激励信号基于大于基线增益因数值的第二增益因数。举例来说,逻辑模块110与激励信 号产生器120的组合可经配置以执行如上所述的任务T230。
逻辑模块110可经配置以根据若干条件而从两个或两个以上选项中选择第二增益因
数。这些条件包括(A)最近经编码帧具有第一格式(例如,CELP格式);(B)在最
近经编码帧之前的经编码帧具有第二格式(例如,NELP格式);(C)当前经编码帧被擦
除;以及(D)阈值与基线增益因数值之间的关系具有特定状态(例如,阈值大于基线
增益因数值)。图22展示描述使用AND门140和选择器150的逻辑模块110的此实施
方案112的操作的逻辑示意图。如果所有所述条件均为真,则逻辑模块112选择第二增益因数。否则,逻辑模块112选择基线增益因数值。
图23展示逻辑模块110的另一实施方案114的操作的流程图。在此实例中,逻辑 模块114经配置以执行如图8所示的任务N210、 N220和N230。逻辑模块114的实施方 案还可经配置以执行如图8所示的任务T110到T140中的一者或一者以上(可能全部)。
图24展示逻辑模块110的包括状态机的另一实施方案116的操作的描述。对于每 一经编码帧来说,状态机根据当前经编码帧的格式或擦除的指示来更新其状态(其中状 态1为初始状态)。如果状态机在其接收到当前帧被擦除的指示时处于状态3,则逻辑模 块116确定基线增益因数值是否小于(或者,不大于)阈值。依据此比较的结果而定, 逻辑模块116在基线增益因数值或第二增益因数中选择一者。
激励信号产生器120可经配置以产生第二激励信号作为子帧激励信号系列。逻辑模 块110的对应实施方案可经配置以针对每一子帧激励信号选择或以其它方式产生第二增 益因数的不同值,其中所述值中的至少一者大于基线增益因数值。举例来说,图25展 示逻辑模块116的经配置以执行如图8所示的任务T140、 T230和T240的此实施方案 118的操作的描述。
逻辑模块120可经布置以从包括在设备A100内或在设备A100外部(例如,在包 括设备A100的装置(例如蜂窝式电话)内)的擦除检测器210接收擦除指示。擦除检 测器210可经配置以在检测到下列条件中的任何一者或一者以上后即产生用于帧的擦除 指示(1)所述帧含有过多位错误要恢复;(2)针对所述帧而指示的位速率为无效或无 支持的;(3)所述帧的所有位均为零;(4)针对所述帧而指示的位速率为八分之一速率, 且所述帧的所有位均为一;(5)所述帧为空白的,且上一有效位速率不为八分之一速率。
逻辑模块IIO的另外实施方案可经配置以执行擦除处理的额外方面,例如由如上所 述的帧擦除恢复模块IOO所执行的那些方面。举例来说,逻辑模块IIO的此实施方案可 经配置以执行例如计算基线增益因数值和/或计算用于对第二激励信号进行滤波的频谱 参数值集合等任务。对于其中第一经编码帧仅包括一个自适应码簿增益因数的应用来 说,基线增益因数值可仅仅为第一增益因数的值。对于其中第一经编码帧包括若干自适 应码簿增益因数(例如,用于每一子帧的不同因数)的应用来说,基线增益因数值还可 基于其它自适应码簿增益因数中的一者或一者以上。在此情况下,举例来说,逻辑模块 110可经配置以将基线增益因数值计算为第一经编码帧的自适应码簿增益因数的平均 值。
逻辑模块110的实施方案可根据其致使激励信号产生器120输出第二激励信号的方
式来分类。逻辑模块110的一个类别IIOA包括经配置以将第二增益因数提供到激励信号产生器120的实施方案。图26A展示设备A100的实施方案A100A的框图,所述实施 方案A100A包括逻辑模块110的此实施方案和激励信号产生器120的对应实施方案 120A。
逻辑模块110的另一类别110B包括经配置以致使激励信号产生器110从两个或两 个以上选项中选择第二增益因数(例如,作为输入)的实施方案。图26B展示设备A100 的实施方案A100B的框图,所述实施方案A100B包括逻辑模块110的此实施方案和激 励信号产生器120的对应实施方案120B。在此情况下,在图22中经展示为在逻辑模块 112内的选择器150改为位于激励信号产生器120B内。明确地预期且特此揭示,逻辑模 块110的实施方案112、 114、 116、 118中的任一者可根据类别IIOA或类别IIOB来进 行配置和布置。
图26C展示设备A100的实施方案A100C的框图。设备A100C包括逻辑模块110 的类别110B的实施方案,其经布置以致使激励信号产生器120从两个或两个以上激励 信号中选择第二激励信号。激励信号产生器120C包括激励信号产生器120的两个子实 施方案120Cl、 120C2,其中一者经配置以产生基于第二增益因数的激励信号,且另一 者经配置以产生基于另一增益因数值(例如,基线增益因数值)的激励信号。激励信号 产生器120C经配置以通过选择基于第二增益因数的激励信号而根据从逻辑模块110B到 选择器150的控制信号来产生第二激励信号。应注意,激励信号产生器120的类别120C 的配置与类别120A或120B的对应实施方案相比可能消耗较多的处理循环、功率和/或 存储量。
激励信号产生器120经配置以产生基于第一增益因数和第一值序列的第一激励信 号。举例来说,激励信号产生器120可经配置以执行如上所述的任务T210。第一值序列 基于来自第三激励信号的信息,例如第三激励信号的片段。在典型实例中,第一序列基 于第三激励信号的最后子帧。
激励信号产生器120的典型实施方案包括经配置以接收和存储第一序列的存储器 (例如,自适应码簿)。图27A展示激励信号产生器120的包括此存储器160的实施方案 122的框图。或者,自适应码簿的至少一部分可位于在设备A100内部或外部的其它地 方的存储器中,使得第一序列的一部分(可能为全部)经提供作为到激励信号产生器120 的输入。
如图27A所示,激励信号产生器120可包括乘法器170,其经配置以计算当前增益
因数与序列的乘积。第一增益因数可基于来自第一经编码帧的信息,例如增益码簿索弓l。
在此情况下,激励信号产生器120可包括增益码簿以及经配置以检索第一增益因数作为对应于此索引的值的逻辑。激励信号产生器120还可经配置以接收指示第一序列在自适 应码簿内的位置的自适应码簿索引。
激励信号产生器120可经配置以产生基于来自第一经编码帧的额外信息的第一激励 信号。此信息可包括指定对第一激励信号的固定码簿贡献的一个或一个以上固定码簿索 引和对应增益因数值或码簿索引。图27B展示激励信号产生器122的实施方案124的框 图,所述实施方案124包括经配置以存储所产生的激励信号可基于的其它信息的码簿180 (例如,固定码簿)、经配置以计算固定码簿序列与固定码簿增益因数的乘积的乘法器190 和经配置以将激励信号计算为固定码簿贡献与自适应码簿贡献的总和的加法器195。激 励信号产生器124还可包括经配置以根据对应索引而从相应码簿检索序列和增益因数的 逻辑。
激励信号产生器120还经配置以产生基于第二增益因数和第二值序列的第二激励信 号。第二增益因数大于第一增益因数且可大于基线增益因数值。第二增益因数还可等于 或甚至大于阈值。对于其中激励信号产生器120经配置以产生第二激励信号作为子帧激 励信号系列的情况来说,可针对每一子帧激励信号使用第二增益因数的不同值,其中所 述值中的至少一者大于基线增益因数值。在此情况下,可能需要使第二增益因数的不同 值经布置以在帧周期内上升或下降。
第二值序列基于来自第一激励信号的信息,例如第一激励信号的片段。在典型实例 中,第二序列基于第一激励信号的最后子帧。因此,激励信号产生器120可经配置以基 于来自第一激励信号的信息而更新自适应码簿。对于设备A100应用于支持松弛CELP (RCELP)编码模式的编码系统的应用来说,激励信号产生器120的此实施方案可经配 置以根据音调滞后参数的对应值来使片段时间扭曲。此扭曲操作的实例在上文所引用的 3GPP2文献C.S0014-Cv1.0的章节5.2.2 (参看章节4.11.5)中描述。
激励信号产生器120还经配置以产生第三激励信号。在一些应用中,激励信号产生 器120经配置以产生基于来自自适应码簿(例如,存储器160)的信息的第三激励信号。
激励信号产生器120可经配置以产生基于噪声信号的激励信号(例如,响应于NELP
格式的指示而产生的激励信号)。在此些情况下,激励信号产生器120可经配置以包括
经配置以执行任务T260的噪声信号产生器。可能需要使噪声产生器使用基于来自对应
经编码帧的其它信息(例如频谱信息)的种子值,因为此技术可用以支持在编码器处已
使用的相同噪声信号的产生。或者,激励信号产生器120可经配置以接收所产生的噪声
信号。依据特定应用而定,激励信号产生器120可经配置以产生基于所产生的噪声信号
的第三激励信号(例如,以执行任务T270)或产生基于所产生的噪声信号的第四激励信号(例如,以执行任务T280)。
激励信号产生器120可经配置以根据帧格式的指示来产生基于来自自适应码簿的序 列的激励信号或产生基于所产生的噪声信号的激励信号。在此情况下,激励信号产生器 120通常经配置以在当前帧被擦除的情况下根据上一有效帧的编码模式来继续操作。
激励信号产生器122通常经实施以更新自适应码簿,使得存储在存储器160中的序 列基于用于先前帧的激励信号。如上所述,自适应码簿的更新可包括根据音调滞后参数 的值来执行时间扭曲操作。激励信号产生器122可经配置以在每一帧处(或甚至在每一 子帧处)更新存储器160。或者,激励信号产生器122可经实施以仅在使用基于来自存 储器的信息的激励信号而解码的帧处更新存储器160。举例来说,激励信号产生器122 可经实施以基于来自用于CELP帧的激励信号的信息而不基于来自用于NELP帧的激励 信号的信息来更新存储器160。对于其中不更新存储器160的帧周期来说,存储器160 的内容可保持不变或可甚至复位到初始状态(例如,设定为零)。
频谱整形器130经配置以基于第一激励信号和来自经编码语音信号的第一经编码帧 的信息而计算经解码语音信号的第一帧。举例来说,频谱整形器130可经配置以执行任 务T220。频谱整形器130还经配置以基于第二激励信号而计算经解码语音信号的紧跟在 第一帧之后的第二帧。举例来说,频谱整形器130可经配置以执行任务T240。频谱整形 器130还经配置以基于第三激励信号而计算经解码语音信号的在第一帧之前的第三帧。 举例来说,频谱整形器130可经配置以执行任务T250。依据应用而定,频谱整形器130 还可经配置以基于第四激励信号而计算经解码语音信号的第四帧(例如,以执行任务 T290)。
频谱整形器130的典型实施方案包括根据用于帧的频谱参数值集合(例如LPC系数 值集合)而配置的合成滤波器。频谱整形器130可经布置以从如本文中所述的语音参数 计算器和/或从逻辑模块110 (例如,在帧擦除的情况下)接收频谱参数值集合。频谱整 形器130还可经配置以根据激励信号的不同子帧系列和/或不同频谱参数值集合系列来 计算经解码帧。频谱整形器130还可经配置以对激励信号、对经整形激励信号和/或对频 谱参数值执行一个或一个以上其它处理操作(例如其它滤波操作)。
包括在设备A100内或在设备A100外部(例如,在包括设备A100的装置(例如蜂
窝式电话)内)的格式检测器220可经布置以将第一经编码帧和其它经编码帧的帧格式
的指示提供到逻辑模块110、激励信号产生器120和频谱整形器130中的一者或一者以
上。格式检测器220可含有擦除检测器210,或可独立地实施这两个元件。在一些应用
中,编码系统经配置以针对特定位速率仅使用一个编码模式。对于这些情况来说,经编码帧的位速率(如(例如)从例如帧能量等一个或一个以上参数所确定)还指示帧格式。 对于在经编码帧的位速率下使用一个以上编码模式的编码系统来说,格式检测器220可 经配置以从编码索引(例如,经编码帧内的识别编码模式的一个或一个以上位的集合) 确定格式。在此情况下,格式指示可基于编码索引的确定。在一些情况下,编码索引可 明确地指示编码模式。在其它情况下,编码索引可(例如)通过指示对于另一编码模式 将为无效的值来隐含地指示编码模式。
设备A100可经布置以从包括在设备A100内或在设备A100外部(例如,在包括设 备A100的装置(例如蜂窝式电话)内)的语音参数计算器230接收经编码帧的语音参 数(例如,频谱参数值、自适应和/或固定码簿索引、增益因数值和/或码簿索引)。图28 展示语音参数计算器230的实施方案232的框图,所述实施方案232包括剖析器310(还 称为"解包化器")、解量化器320和330以及转换器340。剖析器310经配置以根据经 编码帧的格式来剖析所述经编码帧。举例来说,剖析器310可经配置以根据各种类型的 信息在帧内的位位置来区分帧中的各种类型的信息,如由格式所指示。
解量化器320经配置以解量化频谱信息。举例来说,解量化器320通常经配置以将 从经编码帧所剖析的频谱信息作为索引应用于一个或一个以上码簿以获得频谱参数值 集合。解量化器330经配置以解量化时间信息。举例来说,解量化器330还通常经配置 以将从经编码帧中剖析的时间信息作为索引应用于一个或一个以上码簿以获得时间参 数值(例如,增益因数值)。或者,激励信号产生器120可经配置以执行一些或所有时 间信息(例如,自适应和/或固定码簿索引)的解量化。如图28所示,解量化器320和 330中的一者或两者可经配置以根据特定帧格式来解量化对应帧信息,因为不同编码模 式可使用不同量化表或方案。
如上所述,LPC系数值在量化之前通常被转换为另一形式(例如,LSP、 LSF、 ISP 和/或ISF值)。转换器340经配置以将经解量化频谱信息转换为LPC系数值。对于经擦 除帧来说,语音参数计算器230的输出可依据特定设计选择而为空值、未定义或不变。 图29A展示包括擦除检测器210、格式检测器220、语音参数计算器230和设备A100 的实施方案的系统的实例的框图。图29B展示包括还执行擦除检测的格式检测器220的 实施方案222的类似系统的框图。
设备A100的实施方案的各种元件(例如,逻辑模块110、激励信号产生器120和
频谱整形器130)可以被视为适合于既定应用的硬件、软件和/或固件的任何组合来实施。
举例来说,此些元件可被制造为驻存(例如)在同一芯片上或在芯片组中的两个或两个
以上芯片之间的电子和/或光学装置。此装置的一个实例为例如晶体管或逻辑门等逻辑元件的固定或可编程阵列,且这些元件中的任一者可被实施为一个或一个以上此类阵列。 这些元件中的任何两者或两者以上或者甚至全部可实施于相同的一个或多个阵列内。所 述一个或多个阵列可实施于一个或一个以上芯片内(例如,实施于包括两个或两个以上 芯片的芯片组内)。
如本文中所述的设备A100的各种实施方案的一个或一个以上元件(例如,逻辑模 块110、激励信号产生器120和频谱整形器130)还可全部或部分地实施为一个或一个 以上指令集合,所述指令集合经布置以在一个或一个以上固定或可编程逻辑元件阵列上 执行,所述逻辑元件例如为微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA (现场可编程门阵列)、ASSP (专用标准产品)和ASIC (专用集成电路)。设备A100的 实施方案的各种元件中的任一者还可实施为一个或一个以上计算机(例如,包括经编程 以执行一个或一个以上指令集合或序列的一个或一个以上阵列的机器,还称为"处理 器"),且这些元件中的任何两者或两者以上或者甚至全部可实施于相同的所述一或多个 计算机内。
设备A100的实施方案的各种元件可包括在用于无线通信的装置(例如蜂窝式电话 或具有此通信能力的其它装置)内。此装置可经配置以与电路交换式和/或包交换式网络 通信(例如,使用例如VoIP等一个或一个以上协议)。此装置可经配置以对载运经编码 帧的信号执行操作,例如一个或一个以上巻积码的解交错、解穿孔、解码、 一个或一个 以上错误校正码的解码、 一个或一个以上网络协议(例如,以太网、TCP/IP、 cdma2000) 层的解码、射频(RF)解调和/或RF接收。
有可能使设备A100的实施方案的一个或一个以上元件用以执行任务或执行不直接
与所述设备的操作有关的其它指令集合,例如与嵌入有所述设备的装置或系统的另一操
作有关的任务。还有可能使设备A100的实施方案的一个或一个以上元件具有共同的结
构(例如,用以在不同时间执行代码的对应于不同元件的部分的处理器、经执行以在不
同时间执行对应于不同元件的任务的指令集合,或在不同时间针对不同元件执行操作的
电子和/或光学装置的布置)。在一个此实例中,逻辑模块110、激励信号产生器120和
频谱整形器130被实施为经布置以在同一处理器上执行的指令集合。在另一此实例中,
这些元件以及擦除检测器210、格式检测器220和语音参数计算器230中的一者或一者
以上(可能为全部)被实施为经布置以在同一处理器上执行的指令集合。在又一实例中,
激励信号产生器120C1和120C2被实施为在不同时间执行的相同指令集合。在又一实例
中,解量化器320和330被实施为在不同时间执行的相同指令集合。
用于无线通信的装置(例如蜂窝式电话或具有此通信能力的其它装置)可经配置以包括设备A100和语音编码器两者的实施方案。在此情况下,有可能使设备A100与语 音编码器具有共同的结构。在一个此实例中,设备A100和语音编码器经实施以包括经 布置以在同一处理器上执行的指令集合。
提供先前对所描述的配置的呈现是为了使得所属领域的技术人员能够制造或使用 本文中所揭示的方法和其它结构。本文中所展示和描述的流程图、框图、状态图和其它 结构仅为实例,且这些结构的其它变型也属于本发明的范围内。有可能对这些配置做出 各种修改,且本文中所呈现的一般原理同样可应用于其它配置。举例来说,尽管所述实 例主要描述对跟随在CELP帧之后的经擦除帧的应用,但明确地预期且特此揭示,此些 方法、设备和系统还可应用于其中经擦除帧跟随在根据使用基于对过去激励信息的记忆 的激励信号的另一编码模式(例如PPP或其它PWI编码模式)而编码的帧之后的情况。 因此,本发明并不希望限于上文所展示的特定实例或配置,而是应符合与本文中以任何 方式所揭示的原理和新颖特征一致的最广范围,所述原理和新颖特征包括在如所申请的 所附权利要求书中,所述权利要求书形成原始揭示内容的一部分。
可与如本文中所述的语音解码器和/或语音解码方法一起使用或适于与其一起使用 的编解码器的实例包括增强型可变速率编解码器(EVRC),如文献3GPP2C.S0014-C 版本1.0 "用于宽带展频数字系统的增强型可变速率编解码器、语音服务选项3、 68和 70 (Enhanced Variable Rate Codec, Speech Service Options 3, 68, and 70 for Wideband Spread Spectrum Digital Systems)"(第5章,2007年1月)中所描述;自适应多速率(AMR) 语音编解码器,如文献ETSITS 126 092 V6.0.0 (第6章,2004年12月)中所描述;以 及AMR宽带语音编解码器,如文献ETSI TS 126 192 V6.0.0 (第6章,2004年12月) 中所描述。
所属领域的技术人员将了解,信息和信号可使用多种不同技艺和技术中的任一者来 表示。举例来说,在整个上述描述中可能提及的数据、指令、命令、信息、信号、位和 符号可由电压、电流、电磁波、磁场或磁性粒子、光场或光学粒子或者其任一组合表示。 虽然从中导出经编码帧的信号和所解码的信号被称为"语音信号",但还预期且特此揭 示,这些信号可在有效帧期间载运音乐或其它非语音信息内容。
所属领域的技术人员将进一步了解,结合本文中所揭示的配置而描述的各种说明性
逻辑区块、模块、电路和操作可实施为电子硬件、计算机软件或所述两者的组合。此类
逻辑区块、模块、电路和操作可用通用处理器、数字信号处理器(DSP)、 ASIC、 FPGA
或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或经设计以执行本文所描
述的功能的其任何组合来实施或执行。通用处理器可为微处理器,但在替代方案中,处理器可为任何常规的处理器、控制器、微控制器或状态机。处理器还可经实施为计算装 置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个 以上微处理器或任何其它此类配置。
本文所描述的方法和算法的任务可直接以硬件、由处理器执行的软件模块或所述两 者的组合实施。软件模块可驻存于RAM存储器、快闪存储器、ROM存储器、EPROM 存储器、EEPROM存储器、寄存器、硬盘、可移除式盘、CD-ROM或此项技术中已知 的任何其它形式的存储媒体中。说明性存储媒体耦合到处理器,使得处理器可从存储媒 体读取信息和将信息写入到存储媒体。在替代方案中,存储媒体可与处理器成一体式。 处理器和存储媒体可驻存于ASIC中。ASIC可驻存于用户终端中。在替代方案中,处理 器和存储媒体可作为离散组件而驻存于用户终端中。
本文所描述的配置中的每一者可至少部分地实施为硬连线电路、经制造到专用集成 电路中的电路配置或者经加载到非易失性存储装置中的固件程序或作为机器可读代码 (此类代码为可由例如微处理器或其它数字信号处理单元等逻辑元件阵列执行的指令) 而从数据存储媒体加载或加载到数据存储媒体中的软件程序。数据存储媒体可为例如半 导体存储器(其可包括但不限于动态或静态RAM (随机存取存储器)、ROM (只读存储 器)和/或快闪RAM)或者铁电、磁阻、双向、聚合或相变存储器等存储元件的阵列; 或例如磁盘或光盘等盘媒体。应将术语"软件"理解为包括源代码、汇编语言代码、机 器代码、二进制代码、固件、宏代码、微代码、可由逻辑元件阵列执行的任何一个或一 个以上指令集合或序列以及此类实例的任何组合。
权利要求
1. 一种获得经解码语音信号的帧的方法,所述方法包含基于来自经编码语音信号的第一经编码帧的信息和第一激励信号,计算所述经解码语音信号的第一帧;响应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示且基于第二激励信号,计算所述经解码语音信号的紧跟在所述第一帧之后的第二帧;和基于第三激励信号,计算在所述经解码语音信号的所述第一帧之前的第三帧,其中所述第一激励信号基于(A)基于来自所述第三激励信号的信息的第一值序列与(B)第一增益因数的乘积,且其中所述计算第二帧包括根据阈值与基于所述第一增益因数的值之间的关系而产生所述第二激励信号,使得所述第二激励信号基于(A)基于来自所述第一激励信号的信息的第二值序列与(B)大于所述第一增益因数的第二增益因数的乘积。
2. —种获得经解码语音信号的帧的方法,所述方法包含产生第一激励信号,所述第一激励信号基于第一增益因数与第一值序列的乘积; 基于所述第一激励信号和来自经编码语音信号的第一经编码帧的信息,计算所述经解码语音信号的第一帧;响应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示,且根据阈值与基于所述第一增益因数的值之间的关系,产生第二激励信号,所述第二激励信号基于(A)大于所述第一增益因数的第二增益因数与(B)第二值序列的乘积;基于所述第二激励信号,计算紧跟在所述经解码语音信号的所述第一帧之后的第 二帧;和基于第三激励信号,计算在所述经解码语音信号的所述第一帧之前的第三帧, 其中所述第一序列基于来自所述第三激励信号的信息,且其中所述第二序列基于 来自所述第一激励信号的信息。
3. 根据权利要求2所述的获得经解码语音信号的帧的方法,其中所述第二序列基于所 述第一激励信号的至少一片段。
4. 根据权利要求2所述的获得经解码语音信号的帧的方法,其中所述第一增益因数基于来自所述第一经编码帧的信息。
5. 根据权利要求2所述的获得经解码语音信号的帧的方法,其中所述计算所述经解码语音信号的第一帧包括根据第一多个频谱参数值来处理所述第一激励信号,其中所述第一多个频谱参数值基于来自所述第一经编码帧的所述信息,且其中所述计算所述经解码语音信号的第二帧包括根据第二多个频谱参数值来处理所述第二激励信号,其中所述第二多个频谱参数值基于所述第一多个频谱参数值。
6. 根据权利要求2所述的获得经解码语音信号的帧的方法,其中所述产生所述第一激励信号包括根据至少一个音调参数来处理所述第一序列,其中所述至少一个音调参数基于来自所述第一经编码帧的信息。
7. 根据权利要求2所述的获得经解码语音信号的帧的方法,其中所述方法包含产生噪声信号;和产生基于所述所产生的噪声信号的所述第三激励信号。
8. 根据权利要求7所述的获得经解码语音信号的帧的方法,其中所述第三帧紧接在所述经解码语音信号中的所述第一帧之前。
9. 根据权利要求8所述的获得经解码语音信号的帧的方法,其中所述计算第三帧包括根据多个频谱参数值来处理所述第三激励信号,其中所述多个频谱参数值基于来自所述经编码语音信号中的所述第一经编码帧之前的第二经编码帧的信息。
10. 根据权利要求9所述的获得经解码语音信号的帧的方法,其中至少一个帧周期将所述经编码语音信号中的所述第二经编码帧与所述第一经编码帧分离。
11. 根据权利要求7所述的获得经解码语音信号的帧的方法,其中所述产生基于第一值序列的所述第一激励信号由于经编码语音信号的第一经编码帧具有第一格式的指示而发生,且其中所述产生基于所述所产生的噪声信号的所述第三激励信号由于所述经编码语音信号中的所述第一经编码帧之前的第二经编码帧具有第二格式的指示而发生,且其中所述产生基于所述第二增益因数的所述第二激励信号由于(A)所述第一经编码帧具有所述第一格式和(B)所述第二经编码帧具有所述第二格式的指示而发生。
12. 根据权利要求2所述的获得经解码语音信号的帧的方法,其中所述产生基于第一值序列的所述第一激励信号由于所述第一经编码帧具有第一格式的指示而发生,且其中所述方法包含产生噪声信号,且其中所述方法包含基于(A)来自在所述经编码语音信号中的所述第一经编码帧之前的第二经编码帧的信息和(B)基于所述所产生的噪声信号的第四激励信号,计算紧接在所述经解码语音信号中的所述第三帧之前的第四帧,且其中所述计算第三帧包括根据多个频谱参数值来处理所述第三激励信号,其中所述多个频谱参数值基于来自第三经编码帧的信息,所述第三经编码帧(A)在所述经编码语音信号中的所述第二经编码帧之前且(B)具有所述第一格式。
13. 根据权利要求12所述的获得经解码语音信号的帧的方法,其中所述方法包含由于所述第二经编码帧具有第二格式的指示而产生基于所述所产生的噪声信号的所述第四激励信号,且其中所述产生基于所述第二增益因数的所述第二激励信号由于(A)所述第一经编码帧具有所述第一格式和(B)所述第二经编码帧具有所述第二格式的指示而发生。
14. 根据权利要求2所述的获得经解码语音信号的帧的方法,其中所述方法包含将基于所述第一增益因数的值与阚值进行比较;和基于所述比较的结果,执行以下至少一者(A)从多个增益因数值中选择所述第二增益因数;以及(B)基于所述第一增益因数和基于所述第一增益因数的所述值中的至少一者而计算所述第二增益因数。
15. 根据权利要求2所述的获得经解码语音信号的帧的方法,其中所述经解码语音信号的所述第一帧包括多个子帧,所述多个子帧中的每一者基于多个子帧激励信号中的对应一者,且其中所述多个子帧激励信号中的每一者基于(A)多个子帧增益因数中的对应一者与(B)多个子帧序列中的对应一者的乘积,且其中所述第一激励信号包括所述多个子帧激励信号,所述第一增益因数是所述多个子帧增益因数中的一者,且所述第一序列是所述多个子帧序列中的一者。
16. 根据权利要求15所述的获得经解码语音信号的帧的方法,其中基于所述第一增益因数的所述值基于所述子帧增益因数的平均值。
17. 根据权利要求16所述的获得经解码语音信号的帧的方法,其中所述第二增益因数大于所述子帧增益因数的所述平均值。
18. —种用于获得经解码语音信号的帧的设备,所述设备包含激励信号产生器,其经配置以产生第一、第二和第三激励信号;频谱整形器,其经配置以(A)基于所述第一激励信号和来自经编码语音信号的第一经编码帧的信息而计算经解码语音信号的第一帧,(B)基于所述第二激励信号而计算紧跟在所述经解码语音信号的所述第一帧之后的第二帧,且(C)基于所述第三激励信号而计算在所述经解码语音信号的所述第一帧之前的第三帧;和逻辑模块,其(A)经配置以评估阈值与基于第一增益因数的值之间的关系,且(B)经布置以接收所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示,其中所述激励信号产生器经配置以产生基于(A)第一增益因数与(B)基于来自所述第三激励信号的信息的第一值序列的乘积的所述第一激励信号,且其中,响应于所述擦除指示且根据所述所评估的关系,所述逻辑模块经配置以致使所述激励信号产生器产生基于(A)大于所述第一增益因数的第二增益因数与(B)基于来自所述第一激励信号的信息的第二值序列的乘积的所述第二激励信号。
19. 根据权利要求18所述的用于获得经解码语音信号的帧的设备,其中所述频谱整形器经配置以基于第一多个频谱参数值而计算所述第一帧,其中所述第一多个频谱参数值基于来自所述第一经编码帧的信息,且其中所述频谱整形器经配置以基于第二多个频谱参数值而计算所述第二帧,其中所述第二多个频谱参数值基于所述第一多个频谱参数值。
20. 根据权利要求18所述的用于获得经解码语音信号的帧的设备,其中所述逻辑模块经配置以通过将所述阈值与(A)所述第一增益因数和(B)基于所述第一增益因数的值中的至少一者进行比较来评估所述阈值与基于所述第一增益因数的所述值之间的所述关系。
21. 根据权利要求18所述的用于获得经解码语音信号的帧的设备,其中所述第一经解码帧包括多个子帧,所述多个子帧中的每一者基于多个子帧激励信号中的对应一者,且其中所述多个子帧激励信号中的每一者基于(A)多个子帧增益因数中的对应一者与(B)多个子帧序列中的对应一者的乘积,且其中所述第一激励信号包括所述多个子帧激励信号,所述第一增益因数是所述多个子帧增益因数中的一者,且所述第一序列是所述多个子帧序列中的一者,且其中基于所述第一增益因数的所述值基于所述子帧增益因数的平均值。
22. 根据权利要求18所述的用于获得经解码语音信号的帧的设备,其中所述激励信号产生器经配置以响应于所述第一经编码帧具有第一格式的指示而产生所述第一激励信号,且其中,响应于第三经编码帧具有不同于所述第一格式的第二格式的指示,所述激励信号产生器经配置以产生基于所产生的噪声信号的所述第三激励信号,且所述逻辑模块经配置以致使所述激励信号产生器响应于(A)所述第一经编码帧具有所述第一格式和(B)所述第三经编码帧具有所述第二格式的指示而产生所述第二激励信号。
23. —种用于获得经解码语音信号的帧的设备,所述设备包含用于产生基于第一增益因数与第一值序列的乘积的第一激励信号的装置;用于基于所述第一激励信号和来自经编码语音信号的第一经编码帧的信息而计算所述经解码语音信号的第一帧的装置;用于响应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示且根据阈值与基于所述第一增益因数的值之间的关系而产生基于(A)大于所述第一增益因数的第二增益因数与(B)第二值序列的乘积的第二激励信号的装置;用于基于所述第二激励信号而计算紧跟在所述经解码语音信号的所述第一帧之后的第二帧的装置;和用于基于第三激励信号而计算在所述经解码语音信号的所述第一帧之前的第三帧的装置,其中所述第一序列基于来自所述第三激励信号的信息,且其中所述第二序列基于来自所述第一激励信号的信息。
24. 根据权利要求23所述的用于获得经解码语音信号的帧的设备,其中所述用于产生第一激励信号的装置经配置以响应于所述第一经编码帧具有第一格式的指示而产生所述第一激励信号,且其中所述设备包含用于响应于第三经编码帧具有不同于所述第一格式的第二格式的指示而产生基于所产生的噪声信号的所述第三激励信号的装置,且其中所述用于产生第二激励信号的装置经配置以响应于(A)所述第一经编码帧具有所述第一格式和(B)所述第三经编码帧具有所述第二格式的指示而产生所述第二激励信号。
25. —种计算机程序产品,其包含计算机可读媒体,所述媒体包含用于致使至少一个计算机产生基于第一增益因数与第一值序列的乘积的第一激励信号的代码;用于致使至少一个计算机基于所述第一激励信号和来自经编码语音信号的第一经编码帧的信息而计算经解码语音信号的第一帧的代码;用于致使至少一个计算机响应于所述经编码语音信号的紧跟在所述第一经编码帧之后的帧的擦除的指示且根据阈值与基于所述第一增益因数的值之间的关系而产生基于(A)大于所述第一增益因数的第二增益因数与(B)第二值序列的乘积的第二激励信号的代码;用于致使至少一个计算机基于所述第二激励信号而计算紧跟在所述经解码语音信号的所述第一帧之后的第二帧的代码;和用于致使至少一个计算机基于第三激励信号而计算在所述经解码语音信号的所述第一帧之前的第三帧的代码,其中所述第一序列基于来自所述第三激励信号的信息,且其中所述第二序列基于来自所述第一激励信号的信息。
全文摘要
在一种配置中,检测持续有声片段的重要帧的擦除。基于先前帧而计算用于所述经擦除帧的自适应码簿增益值。如果所述计算值小于(或者,不大于)阈值,则针对所述经擦除帧使用较高的自适应码簿增益值。所述较高值可从所述计算值导出或从一个或一个以上预定值中选择。
文档编号G10L19/00GK101523484SQ200780036845
公开日2009年9月2日 申请日期2007年10月7日 优先权日2006年10月6日
发明者文卡特什·克里希南, 阿南塔帕德马纳卜汉·阿萨尼帕莱·坎达哈达伊 申请人:高通股份有限公司
用于帧擦除恢复的系统、方法和设备的制作方法
相关推荐
专利名称:对于资源受限客户机设备的上游质量增强信号处理的制作方法技术领域:本公开总体上涉及媒体数据的信号处理,例如用于质量增强的以流方式传送 (streaming)音频数据的信号处理。背景技术:便携式设备在流行性和功能性方面继续增长。这种日
专利名称:一种基于光纤腔衰荡技术的分布式光纤传感器的制作方法技术领域:本实用新型涉及一种基于光纤腔衰荡技术的分布式光纤传感器,属于光纤传感器 领域,是一种分布式光纤传感器的设计及其解调方法。 背景技术:光纤传感技术是上世纪七十年代随着光纤和
专利名称:一种带有可收放支架的折叠式led台灯的制作方法技术领域:本实用新型涉及照明设备技术领域,特别是涉及一种带有可收放支架的折叠式LED台灯。背景技术:LED台灯具有节能、环保、安全可靠的特点,是现在市场上主要的台灯类型,现在的LED台
专利名称:光刻设备和器件制造方法技术领域:本发明涉及一种光刻设备和一种器件制造方法。背景技术:光刻设备是一种将所需图案应用到衬底上,通常是衬底的目标部分上的机器。例 如,可以将光刻设备用在集成电路(IC)的制造中。在这种情况下,可以将可选地
空中虚拟电子乐鼓的制作方法【专利摘要】为了解决现有激光虚拟电子乐器需要设置多个固定激光束而引起的制造成本提高、设置特定雾气环境来显示激光束的存在、以及要求演奏者准确遮挡激光束所带来的演奏难度增加等问题,本发明提出了一种利用激光传感技术在空气
专利名称:一种车间用吊灯安装座的制作方法技术领域:本实用新型涉及现代厂房车间用吊灯安装座。背景技术:随着经济的发展,工业建设充分得到扩大化,建设的钢构车间已经是遍布各个角落,钢构车间以其大容量无立柱赢得使用者的青睐,但是钢构车间的照明也需要