专利名称:语音编码装置和语音编码方法
技术领域:
本发明涉及语音编码装置和语音编码方法,特别涉及能够删除冗余的声道间参数的语音编码装置和语音编码方法。
背景技术:
在立 体声语音编码方法或多声道语音编码方法中,一般存在两种方法。一种方法是,对不同声道的信号各自独立地进行编码的方法。该方法可容易适用于立体声语音信号或多声道语音信号。但是,该方法中,不能去除声道间的冗余性,因此整体的编码比特率与声道数成比例,比特率高。另一种方法是对立体声语音信号或多声道语音信号进行参数编码的方法。该方法的基本原理如下。也就是说,首先在编码端,将输入信号缩混(downmix)或变换为更少(或相同)数的信号。接着,使用现有的语音编码方法,对进行了缩混或变换的信号进行编码。与此同时,从原信号计算表示声道间的关系的声道间参数,并对声道间参数进行编码而发送到解码端,以在解码端能够生成立体声声像(stereo image)或多声道声像。该方法中,与对语音信号本身进行编码的情况相比,能够以更少的代码量对声道间参数进行编码,因此可实现低比特率化。在参数立体声编码系统或多声道编码系统中,广泛使用主分量分析(PCA)(非专利文献I)、双耳线索编码方法(Binaural Cue Coding, BCC)(非专利文献2)、声道间预测(ICP)(非专利文献3)、以及强度立体声(IS)(非专利文献4)。在这里举出的各方法中,生成某种声道间参数并发送到解码端。例如,在双耳线索编码方法(BCC)中,声道间声级差(ICLD)、声道间时间差(ICTD)和声道间相关性(ICC)相当于声道间参数。另外,在声道间预测中的声道间预测系数、强度立体声中的能量比例系数(energy scale parameter)、以及主分量分析中的旋转角都为声道间参数。在BCC、ICP、IS和PCA中,必须求精度高的声道间参数,因此一般以子带为单位进行声道间参数的计算和编码。图I和图2简单地表示参数多声道编解码的结构。图I和图2中的各标号的含义如下。{xi sb}:分割为多个子带的一系列的多声道信号(这些信号表示频域、时域、或组合了频域和时域的混合域中的信号){yi sb}:在各子带中求得的缩混或变换后的一系列信号(这些信号是与Ixi sb}相同领域的信号)(Pi sJ :在各子带中求出的一系列声道间参数另外,下面以进行缩混为前提进行说明。在图I所示的编码端中,声道间参数生成单元101对输入信号Ixi sb}例如通过BCC、PCA等进行缩混而生成缩混信号{yi sb}和声道间参数{Pi sb}。编码单元102对缩混信号{yi sb}进行编码,另外准备的编码单元103 (声道间参数编码单元)对声道间参数{Pi—sb}进行编码。复用单元104将缩混信号{yi sb}的编码参数和声道间参数(Pi sb}的编码参数进行复用而生成比特流。该比特流被发送到解码端。在图2所示的解码端,分离单元201分离比特流而获得缩混信号的编码参数和声道间参数的编码参数。解码单元202使用缩混信号的编码参数进行解码处理,从而生成解码缩混信号
iy i—J。解码单元203 (声道间参数解码单元)使用声道间参数的编码参数来进行解码处理,从而生成解码声道间参数{P'—sb}。声道间参数适用单元204使用由解码声道间参数{P i sb}表示的空间信息,对解码缩混信号{y i—sb}进行上混(upmix),从而生成解码信号Ix'—sb}。非专利文献I中记载了基于频域中的主分量分析(PCA)的编解码。图3和图4表示非专利文献I中的基于PCA的编码装置和解码装置的结构。各标号的含义如下。{Lsb (f)}:分割为多个子带的左信号{Rsb (f)}:分割为多个子带的右信号{Pcsb (f)}:通过主分量分析对每个子带计算的主分量信号{Asb(f)}:通过主分量分析对每个子带计算的环境信号(ambient signal){ Θ sJ :通过主分量分析对每个子带计算的旋转角{PcARsb}:对每个子带计算出的主分量分析信号与环境信号的能量比在图3所示的编码端,主分量分析单元301将输入左信号{Lsb(f)}和输入右信号{Rsb(f)l变换为主分量信号{Pcsb(f)}和环境信号{Asb(f)}。在该变换过程中,对每个子带计算表示变换程度的旋转角。如下式计算旋转角。
)
权利要求
1.语音编码装置,包括 变换单元,将多个声道的输入信号变换为主分量信号,并且对每个子带计算表示声道间的信号的关系的声道间参数; 第一编码单元,对所述主分量信号进行编码而获得编码主分量信号; 解码单元,对所述编码主分量信号进行解码而获得解码主分量信号; 删除单元,使用所述解码主分量信号,从所述子带的所述声道间参数中删除冗余的参数;以及 第二编码单元,对删除了所述冗余的参数后的声道间参数进行编码。
2.如权利要求I所述的语音编码装置, 所述变换单元通过主分量分析,将所述输入信号变换为所述主分量信号, 所述声道间参数为旋转角。
3.如权利要求I所述的语音编码装置, 所述删除单元将各子带的能量与相邻的子带能量之比和阈值进行比较,在所述能量比小于所述阈值时删除所述声道间参数。
4.如权利要求I所述的语音编码装置, 所述删除单元将各子带的能量和掩蔽曲线的电平进行比较,在所述能量接近或小于所述掩蔽曲线时删除所述声道间参数。
5.语音编码方法,包括 变换步骤,将多个声道的输入信号变换为主分量信号,并且对每个子带计算表示声道间的信号的关系的声道间参数; 第一编码步骤,对所述主分量信号进行编码而获得编码主分量信号; 解码步骤,对所述编码主分量信号进行解码而获得解码主分量信号; 删除步骤,使用所述解码主分量信号,从所述子带的所述声道间参数中删除冗余的参数;以及 第二编码步骤,对删除了所述冗余的参数后的声道间参数进行编码。
全文摘要
公开了能够从编码对象中删除不需要的声道间参数而提高编码效率的语音编码装置。在该语音编码装置中,主分量分析单元(301)将输入左信号{Lsb(f)}和输入右信号{Rsb(f)}变换为主分量信号{Pcsb(f)}和环境信号{Asb(f)},并且对每个子带计算表示变换程度的旋转角;单声道编码单元(303)对主分量信号{Pcsb(f)}进行编码;旋转角编码单元(302)对旋转角{θsb}进行编码;局部单声道解码单元(603)生成解码后的主分量信号,以在编码端能够确认主分量信号的编码质量;冗余参数删除单元(604)通过分析解码主分量信号的编码质量而识别冗余的参数,并从编码对象中删除这些参数;复用单元(306)将{Pcsb(f)}的编码参数和旋转角编码参数进行复用并将比特流发送到解码端。
文档编号G10L19/02GK102714036SQ20108005817
公开日2012年10月3日 申请日期2010年12月27日 优先权日2009年12月28日
发明者Z.刘, 张国成 申请人:松下电器产业株式会社
语音编码装置和语音编码方法
相关推荐
专利名称:一种波长选择开关结构的制作方法技术领域:本发明涉及一种波长光交换器件即波长选择开关(WSS),更确切地说本发明涉及一种基于MEMS技术的WSS结构。可用于全光通信网节点设备中。属于光纤通信中的光器件领域。背景技术:光纤通信正在由目
专利名称:压闭式手电筒的制作方法技术领域:本实用新型涉及一种压闭式手电筒,属于日常生活用品领域,特别是一种照明用具。背景技术:日常生活中所用的手电筒,开关包括翘板式和推板式,这种开关使用起来很不方便,用时需要先找到开关。发明内容本实用新型要
专利名称:自适应音频代码转换的制作方法技术领域:本发明总体上涉及音频视频托管系统,并且更具体地涉及一种用于基于音频流内容特性的音频流的自适应代码转换的音频代码转换系统。背景技术:多媒体内容托管服务诸如YOUTUBE允许用户将视频与它们的对应
专利名称:Led轨道灯的制作方法技术领域:LED轨道灯技术领域[0001]本实用新型涉及一种照明灯具领域,尤其是涉及一种LED轨道灯。背景技术:[0002]LED是一种固态的半导体器件,可以直接把电能转化为可见光,具有体积小、耗电 量低、使
可谱曲的音乐盒的制作方法【专利摘要】本实用新型公开了一种可谱曲的音乐盒,包括底座、滚筒、舌簧片及转轴,该底座为一箱体,该滚筒和舌簧片置于其内;该滚筒包括金属筒体、筒芯及多个音凸,该筒体的侧壁上设有多个插孔;该筒芯包括一贯穿上下底面的轴孔,该
专利名称:一种led灯泡的制作方法技术领域:本实用新型涉及一种LED灯泡,属于LED照明领域。背景技术:LED作为新型高效的节能光源,得到了广泛的应用,其与传统的照明光源如荧光灯、白炽灯等相比具有发光效率高、长久耐用、节能环保等优点,但由于