当前位置:网站首页>专利 >正文

一种相邻高低速率编码模式间切换的变速率音频编码方法

专利名称:一种相邻高低速率编码模式间切换的变速率音频编码方法
技术领域
本发明涉及一种相邻高低速率编码模式间切换的变速率音频编码方法,尤其是适合于包含多种编码速率的音频编码器,属于音频编码领域
背景技术
变速率的音频编码技术是根据输入音频信号的统计特性,或者通信链路质量,或者网络用户的需求来控制信息传输速率,从而降低传输的平均码率,提高传输效率,它相对于传统的固定速率编码方法能够更好的节省信道带宽,受到研究者的广泛重视。一般而言, 变速率的语音编码算法可以分为信源控制的或信道控制的两大类,后者可以是信道或网络控制编码速率可变,通常是根据外部控制信号从一种速率切换为预定速率集合中的另一种速率,如AMR自适应多速率语音编码,也可以是可分级的编解码方式。信源控制的变速率编码方法则是根据输入信号的特性来动态的分配编码比特或采用不同的编码模式,其编码器的目的是为了确保输出信号质量的同时给每帧音频信号分配尽可能少的比特,如3GPP2标准中提出的SMV可选模式声码器。目前变速率编码的方法大多用于基于线性预测和码本激励的语音编码器,例如我国专利申请号为200810210215(
公开日2009年03月18日)和申请专利号为 200710153938 (
公开日2009年02月04日)的发明专利提出了根据合成数字话音帧的话音激活检测结果或者清浊音检测结果来确定编码速率的变速率码激励线性预测编码器和编码方法。后期产生了多模式变速率方法,它是针对不同特性的输入信号帧设计最佳的编码模式和分配最低的编码速率,并使编码器能够保持较好的解码声音质量。通常有两种技术可以实现多模式变速率,一种是闭环方式,一种是开环方式。前者基于某种失真准则通过闭环搜索判断哪种模式最适合当前帧编码,当选择合适的失真准则时能够使得语音帧和编码模式达到最佳匹配,后者通常基于语音帧分类的方式,对不同类的语音帧采用不同的编码模式或编码速率,以达到编码比特有效分配的效果。开环方式的复杂度较低,但需要鲁棒性较高的语音帧分类算法,闭环的计算复杂度较高,但编码模式匹配效果较好。VAD话音激活检测技术是变速率语音编码器中常用的方法,它通过降低语音静默段的量化编码比特从而大大降低整体编码速率,但在音乐信号的编码中并不适用,音乐信号不像语音信号在通话过程中存在50%左右的静默段,可以利用VAD技术来降低静默段的编码速率。3GPP2标准中提出的EVRC增强型可变速率编码器和SMV可选模式声码器都是基于语音帧分类的方式来确定每帧的量化编码方式和编码速率,从而达到整体编码速率的降低。而3GPP 标准中的 AMR-NB (TS 26. 090)、AMR-ffB (TS 26. 190)则是根据信道传输的恶劣情况来从预定的多种速率中选择合适的编码速率传输窄带或宽带语音,AMR-WB+(TS 26. 290)则是一种在AMR-WB基础上发展的自适应多速率的语音和音乐混合编码方法,在编码之前首先确定编码速率,对于每帧音频信号再选择合适的ACELP (代数码本激励)或 TCX (Transform Coded Excitation)变换码激励编码模式,ACELP倾向于编码语音帧,TCX 倾向于编码音频帧,对于每帧输入音频信号,从26种ACELP/TCX组合编码模式中选择最佳的编码模式。我国AVS数字音视频编码标准工作组提出的AVS-PlO是多速率的移动语音和音频混合的编解码器,与AMR-WB+的编解码原理相似,其核心模块的编码方式有所不同, AVS-PlO核心模块采用ACELP/TVC (Transform Vector Coding,变换域矢量编码),两者的单声道编码速率都有8种速率,立体声编码速率都有16种速率,两者均是信道控制的变速率编码,而没有采用信源控制变速率编码方法,尤其对音乐信号未有合适的源控变速率方式
发明内容
本发明的目的是为了进一步提高多速率音频编码器的编码效率,压缩编码带宽, 利用闭环源控变速率的方式降低某些音频帧的编码速率,通过设计合适的闭环选择准则从而达到整体的平均编码速率的降低。为了实现上述目的,本发明采用的技术方案是首先对每帧音频信号在高速率下进行编解码,将该速率下各种编码模式的编码输入信号和解码输出信号通过感知加权滤波器后计算平均分段信噪比,并选出使感知加权平均分段信噪比最大的编码模式,然后在临近高速率的低编码速率下选出使编码输入信号和解码输出信号的感知加权平均分段信噪比最大的编码模式,最后分别对于高、低速率下选出来的编码模式,计算编码输入信号和解码输出信号平均分段信噪比,如果低速率编码模式下的平均分段信噪比相比高速率编码模式下的偏大,则切换到低速率编码模式,反之则切换到高速率编码模式。本发明所用到的技术方案中涉及到的感知加权滤波器的表达式为
P
权利要求
1.一种相邻高低速率编码模式间切换的变速率音频编码方法,设置一个预先设定的编码速率集合和一个预先设定的编码模式集合,该编码速率集合涉及一组从高到低的不同编码速率,且至少包含两种编码速率,该编码模式集合涉一组不同的音频信号编码模式,且至少包含两种编码模式,每帧音频信号将从由高速率到低速率的编码模式集合中根据解码输出信号相对于编码输入信号和的失真大小选择最佳编码模式和编码速率;其特征在于,本发明是通过如下步骤实现的对于待处理的每帧音频信号(1)从编码速率集合(Ri,i = 1,...,M,M是编码速率的个数)中选定一种编码速率 Rh(h > 1),在该编码速率下对于编码模式集合(O” i = 1,...,N,N是编码模式的个数)中的每种编码模式,对该帧音频信号分别进行编解码;(2)分别将步骤(1)中每种编码模式下得到的编码输入信号和解码输出信号通过感知加权滤波器得到加权输入信号和加权输出信号;(3)分别计算步骤(2)中每个编码模式下得到的加权输入信号和加权输出信号的平均分段信噪比,选出使平均分段信噪比最大的编码模式,记为Oh ;(4)在步骤(3)中选出来的高速率编码模式Oh下,计算编码输入信号和解码输出信号的平均分段信噪比,记为SH;(5)采用比编码速率Rh低一级的相邻编码速率R1G=h-l)对该帧音频信号进行编解码,并在每种编码模式下,将编码输入信号和解码输出信号分别通过感知加权滤波器后计算平均分段信噪比,选出使平均分段信噪比最大的编码模式,记为;(6)在步骤(5)中选出来的低速率编码模式下,计算编码输入信号和解码输出信号的平均分段信噪比,记为(7)对上述步骤中选出来的高速率编码模式Oh下的Sh和低速率编码模式下的&判断大小,如果& > Sh,则从高速率编码模式Oh切换到低速率编码模式(\,反之则从低速率编码模式切换到高速率编码模式0H。
2.如权利要求1所述的一种相邻高低速率编码模式间切换的变速率音频编码方法,其特征在于步骤(2)中所述的感知加权滤波器的表达式为P
3.如权利要求1所述的一种相邻高低速率编码模式间切换的变速率音频编码方法,其特征在于输出信号釾“)相对于输入信号χ (η)的平均分段信噪比的计算过程为a.将一帧信号划分为Nsf个子帧,计算每个子帧的分段信噪比
全文摘要
本发明涉及一种相邻高低速率编码模式间切换的变速率音频编码方法,属于音频编码领域,特别是适合用于多速率的音频编码器。其技术特点是首先对每帧音频信号在高速率下进行编解码,将该速率下各种编码模式的编码输入信号和解码输出信号通过感知加权滤波器后计算平均分段信噪比,并选出使感知加权平均分段信噪比最大的编码模式,然后在临近高速率的低编码速率下选出使编码输入信号和解码输出信号的感知加权平均分段信噪比最大的编码模式,最后分别对于高、低速率下选出来的编码模式,计算编码输入信号和解码输出信号平均分段信噪比,如果低速率编码模式下的平均分段信噪比相比高速率编码模式下的偏大,则切换到低速率编码模式,反之则切换到高速率编码模式。本发明的方法对每帧音频信号根据输出信号相对输入信号的失真大小,在相邻的高低编码速率下的各编码模式间切换,从而在保持良好编码质量的同时,降低音频信号的平均编码速率,从而提高多速率音频编码器的编码效率。
文档编号G10L19/12GK102254562SQ201110180050
公开日2011年11月23日 申请日期2011年6月29日 优先权日2011年6月29日
发明者孟凯, 杨果, 王晶, 赵胜辉 申请人:北京理工大学

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:液晶监视器的制作方法技术领域:本发明涉及液晶监视器(液晶显示器)。背景技术:以往,作为影像显示装置,大多使用将来自装置外部的影像信号显示到液晶画面上的液晶监视器。液晶监视器一般构成为从外部电源供给驱动所需的电源,即为了对从外部供给

    专利发布时间:2025-05-15阅读:(80)

    专利名称:定影装置以及图像形成装置的制作方法技术领域:本发明涉及复印机、传真装置、激光打印机、多功能打印机等的图像 形成装置,尤其涉及图像形成部的定影装置。背景技术:一直以来,作为复印机和传真装置等的图〗象形成装置,广泛采用电子 照相记录方

    专利发布时间:2025-05-15阅读:(71)

    专利名称:语音合成装置的制作方法技术领域:本发明涉及合成与文本对应的语音后输出的语音合成装置,尤其涉及用于还可自然朗读不完整的文章的语音合成装置。背景技术: 现有技术中,提供了生成与所希望的文本对应的合成音后输出的语音合成装置。其中,作为应

    专利发布时间:2025-05-15阅读:(85)

    专利名称:液晶模组及显示设备的制作方法技术领域:本实用新型涉及显示领域,尤其涉及一种液晶模组及显示设备。背景技术:目前,随着科学技术的不断进步,显示设备(例如:液晶电视或液晶显示屏等)被广泛的应用于人们的日常生活中。如图1所示,现有技术中显

    专利发布时间:2025-05-15阅读:(84)

    专利名称:一种新型轧筝的制作方法技术领域:本实用新型涉及一种新型轧筝。 背景技术:现有的乐器,主要分为弹式乐器和拉式乐器。该弹式乐器发出的声音为停顿式,如钢琴、筝(古筝)、吉他等,该拉式乐器发出的声音为连续式,如二胡、轧筝、小提琴、大提琴

    专利发布时间:2025-05-15阅读:(74)

    专利名称:基于深刻蚀透射式石英光栅的啁啾控制装置的制作方法技术领域:本发明涉及啁啾控制装置,特别是一种基于深刻蚀透射式石英光栅的啁啾控制装置。背景技术:超短超强激光脉冲具有峰值功率高,持续时间短等优点,因此在物理、生物、化学以及微制造和微加

    专利发布时间:2025-05-15阅读:(61)