当前位置:网站首页>专利 >正文

一种相邻高低速率编码模式间切换的变速率音频编码方法

专利名称:一种相邻高低速率编码模式间切换的变速率音频编码方法
技术领域
本发明涉及一种相邻高低速率编码模式间切换的变速率音频编码方法,尤其是适合于包含多种编码速率的音频编码器,属于音频编码领域
背景技术
变速率的音频编码技术是根据输入音频信号的统计特性,或者通信链路质量,或者网络用户的需求来控制信息传输速率,从而降低传输的平均码率,提高传输效率,它相对于传统的固定速率编码方法能够更好的节省信道带宽,受到研究者的广泛重视。一般而言, 变速率的语音编码算法可以分为信源控制的或信道控制的两大类,后者可以是信道或网络控制编码速率可变,通常是根据外部控制信号从一种速率切换为预定速率集合中的另一种速率,如AMR自适应多速率语音编码,也可以是可分级的编解码方式。信源控制的变速率编码方法则是根据输入信号的特性来动态的分配编码比特或采用不同的编码模式,其编码器的目的是为了确保输出信号质量的同时给每帧音频信号分配尽可能少的比特,如3GPP2标准中提出的SMV可选模式声码器。目前变速率编码的方法大多用于基于线性预测和码本激励的语音编码器,例如我国专利申请号为200810210215(
公开日2009年03月18日)和申请专利号为 200710153938 (
公开日2009年02月04日)的发明专利提出了根据合成数字话音帧的话音激活检测结果或者清浊音检测结果来确定编码速率的变速率码激励线性预测编码器和编码方法。后期产生了多模式变速率方法,它是针对不同特性的输入信号帧设计最佳的编码模式和分配最低的编码速率,并使编码器能够保持较好的解码声音质量。通常有两种技术可以实现多模式变速率,一种是闭环方式,一种是开环方式。前者基于某种失真准则通过闭环搜索判断哪种模式最适合当前帧编码,当选择合适的失真准则时能够使得语音帧和编码模式达到最佳匹配,后者通常基于语音帧分类的方式,对不同类的语音帧采用不同的编码模式或编码速率,以达到编码比特有效分配的效果。开环方式的复杂度较低,但需要鲁棒性较高的语音帧分类算法,闭环的计算复杂度较高,但编码模式匹配效果较好。VAD话音激活检测技术是变速率语音编码器中常用的方法,它通过降低语音静默段的量化编码比特从而大大降低整体编码速率,但在音乐信号的编码中并不适用,音乐信号不像语音信号在通话过程中存在50%左右的静默段,可以利用VAD技术来降低静默段的编码速率。3GPP2标准中提出的EVRC增强型可变速率编码器和SMV可选模式声码器都是基于语音帧分类的方式来确定每帧的量化编码方式和编码速率,从而达到整体编码速率的降低。而3GPP 标准中的 AMR-NB (TS 26. 090)、AMR-ffB (TS 26. 190)则是根据信道传输的恶劣情况来从预定的多种速率中选择合适的编码速率传输窄带或宽带语音,AMR-WB+(TS 26. 290)则是一种在AMR-WB基础上发展的自适应多速率的语音和音乐混合编码方法,在编码之前首先确定编码速率,对于每帧音频信号再选择合适的ACELP (代数码本激励)或 TCX (Transform Coded Excitation)变换码激励编码模式,ACELP倾向于编码语音帧,TCX 倾向于编码音频帧,对于每帧输入音频信号,从26种ACELP/TCX组合编码模式中选择最佳的编码模式。我国AVS数字音视频编码标准工作组提出的AVS-PlO是多速率的移动语音和音频混合的编解码器,与AMR-WB+的编解码原理相似,其核心模块的编码方式有所不同, AVS-PlO核心模块采用ACELP/TVC (Transform Vector Coding,变换域矢量编码),两者的单声道编码速率都有8种速率,立体声编码速率都有16种速率,两者均是信道控制的变速率编码,而没有采用信源控制变速率编码方法,尤其对音乐信号未有合适的源控变速率方式
发明内容
本发明的目的是为了进一步提高多速率音频编码器的编码效率,压缩编码带宽, 利用闭环源控变速率的方式降低某些音频帧的编码速率,通过设计合适的闭环选择准则从而达到整体的平均编码速率的降低。为了实现上述目的,本发明采用的技术方案是首先对每帧音频信号在高速率下进行编解码,将该速率下各种编码模式的编码输入信号和解码输出信号通过感知加权滤波器后计算平均分段信噪比,并选出使感知加权平均分段信噪比最大的编码模式,然后在临近高速率的低编码速率下选出使编码输入信号和解码输出信号的感知加权平均分段信噪比最大的编码模式,最后分别对于高、低速率下选出来的编码模式,计算编码输入信号和解码输出信号平均分段信噪比,如果低速率编码模式下的平均分段信噪比相比高速率编码模式下的偏大,则切换到低速率编码模式,反之则切换到高速率编码模式。本发明所用到的技术方案中涉及到的感知加权滤波器的表达式为
P
权利要求
1.一种相邻高低速率编码模式间切换的变速率音频编码方法,设置一个预先设定的编码速率集合和一个预先设定的编码模式集合,该编码速率集合涉及一组从高到低的不同编码速率,且至少包含两种编码速率,该编码模式集合涉一组不同的音频信号编码模式,且至少包含两种编码模式,每帧音频信号将从由高速率到低速率的编码模式集合中根据解码输出信号相对于编码输入信号和的失真大小选择最佳编码模式和编码速率;其特征在于,本发明是通过如下步骤实现的对于待处理的每帧音频信号(1)从编码速率集合(Ri,i = 1,...,M,M是编码速率的个数)中选定一种编码速率 Rh(h > 1),在该编码速率下对于编码模式集合(O” i = 1,...,N,N是编码模式的个数)中的每种编码模式,对该帧音频信号分别进行编解码;(2)分别将步骤(1)中每种编码模式下得到的编码输入信号和解码输出信号通过感知加权滤波器得到加权输入信号和加权输出信号;(3)分别计算步骤(2)中每个编码模式下得到的加权输入信号和加权输出信号的平均分段信噪比,选出使平均分段信噪比最大的编码模式,记为Oh ;(4)在步骤(3)中选出来的高速率编码模式Oh下,计算编码输入信号和解码输出信号的平均分段信噪比,记为SH;(5)采用比编码速率Rh低一级的相邻编码速率R1G=h-l)对该帧音频信号进行编解码,并在每种编码模式下,将编码输入信号和解码输出信号分别通过感知加权滤波器后计算平均分段信噪比,选出使平均分段信噪比最大的编码模式,记为;(6)在步骤(5)中选出来的低速率编码模式下,计算编码输入信号和解码输出信号的平均分段信噪比,记为(7)对上述步骤中选出来的高速率编码模式Oh下的Sh和低速率编码模式下的&判断大小,如果& > Sh,则从高速率编码模式Oh切换到低速率编码模式(\,反之则从低速率编码模式切换到高速率编码模式0H。
2.如权利要求1所述的一种相邻高低速率编码模式间切换的变速率音频编码方法,其特征在于步骤(2)中所述的感知加权滤波器的表达式为P
3.如权利要求1所述的一种相邻高低速率编码模式间切换的变速率音频编码方法,其特征在于输出信号釾“)相对于输入信号χ (η)的平均分段信噪比的计算过程为a.将一帧信号划分为Nsf个子帧,计算每个子帧的分段信噪比
全文摘要
本发明涉及一种相邻高低速率编码模式间切换的变速率音频编码方法,属于音频编码领域,特别是适合用于多速率的音频编码器。其技术特点是首先对每帧音频信号在高速率下进行编解码,将该速率下各种编码模式的编码输入信号和解码输出信号通过感知加权滤波器后计算平均分段信噪比,并选出使感知加权平均分段信噪比最大的编码模式,然后在临近高速率的低编码速率下选出使编码输入信号和解码输出信号的感知加权平均分段信噪比最大的编码模式,最后分别对于高、低速率下选出来的编码模式,计算编码输入信号和解码输出信号平均分段信噪比,如果低速率编码模式下的平均分段信噪比相比高速率编码模式下的偏大,则切换到低速率编码模式,反之则切换到高速率编码模式。本发明的方法对每帧音频信号根据输出信号相对输入信号的失真大小,在相邻的高低编码速率下的各编码模式间切换,从而在保持良好编码质量的同时,降低音频信号的平均编码速率,从而提高多速率音频编码器的编码效率。
文档编号G10L19/12GK102254562SQ201110180050
公开日2011年11月23日 申请日期2011年6月29日 优先权日2011年6月29日
发明者孟凯, 杨果, 王晶, 赵胜辉 申请人:北京理工大学

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:改良灯眼光束的背光源的制作方法技术领域:本实用新型涉及背光源生产技术领域,特别涉及一种改良灯眼光束的背光源。背景技术:现有的背光源一般采用多个LED灯发光,从侧面射入导光板内,通过导光板及其背面的扩散模和反射膜将光线发散,使光线从

    专利发布时间:2025-08-16阅读:(111)

    专利名称:文本到语音设备的制作方法技术领域:本发明涉及用于对字符数据进行转换并输出语音的文本到语音(text-to-speech)朗读设备、程序和方法,其中字符数据包括文档中的表音 字符(phonetic character)。更具体地,本

    专利发布时间:2025-08-16阅读:(130)

    一种改进的led防爆灯的制作方法【专利摘要】本发明公开了一种改进的LED防爆灯,包括灯管,灯管两端设置有外壳,外壳外设有加强板,灯管内设有基板,基板下设有LED灯珠,基板上设有散热片,基板上方设有LED驱动器,LED驱动器两端通过引脚与LE

    专利发布时间:2025-08-16阅读:(94)

    专利名称:全方位发光的led灯的制作方法技术领域:本实用新型涉及一种LED灯。背景技术:通常LED球泡灯的光源设于泡壳与灯座的相交面上,光源基板的顶面设发光体,发光体出光被基板和灯座的遮挡,出光角度小,一般小于180度,为增大出光角需增加光

    专利发布时间:2025-08-16阅读:(122)

    异常声音检测和识别系统的制作方法【专利摘要】异常声音检测和识别系统,是一种基于短时处理异常声音检测和识别技术,通过对异常声音进行采集、预处理、然后进行整合形成样本库,然后对样本库进行预加重、加窗分帧,最后进行特征提取,识别出结果,在安全监控

    专利发布时间:2025-08-16阅读:(81)

    专利名称:一种led球泡灯的散热器的制作方法技术领域:本实用新型涉及一种LED球泡灯的散热器。背景技术:现有的LED球泡灯,如图1和图2,其散热器100’与散热板200’为分体式,散热板200’通过铆压的方式固接在散热器100’上,生产工艺

    专利发布时间:2025-08-16阅读:(114)