当前位置:网站首页>专利 >正文

语音编码装置和语音编码方法

专利名称:语音编码装置和语音编码方法
技术领域
本发明涉及语音编码装置和语音编码方法,特别涉及能够删除冗余的声道间参数的语音编码装置和语音编码方法。
背景技术
在立 体声语音编码方法或多声道语音编码方法中,一般存在两种方法。一种方法是,对不同声道的信号各自独立地进行编码的方法。该方法可容易适用于立体声语音信号或多声道语音信号。但是,该方法中,不能去除声道间的冗余性,因此整体的编码比特率与声道数成比例,比特率高。另一种方法是对立体声语音信号或多声道语音信号进行参数编码的方法。该方法的基本原理如下。也就是说,首先在编码端,将输入信号缩混(downmix)或变换为更少(或相同)数的信号。接着,使用现有的语音编码方法,对进行了缩混或变换的信号进行编码。与此同时,从原信号计算表示声道间的关系的声道间参数,并对声道间参数进行编码而发送到解码端,以在解码端能够生成立体声声像(stereo image)或多声道声像。该方法中,与对语音信号本身进行编码的情况相比,能够以更少的代码量对声道间参数进行编码,因此可实现低比特率化。在参数立体声编码系统或多声道编码系统中,广泛使用主分量分析(PCA)(非专利文献I)、双耳线索编码方法(Binaural Cue Coding, BCC)(非专利文献2)、声道间预测(ICP)(非专利文献3)、以及强度立体声(IS)(非专利文献4)。在这里举出的各方法中,生成某种声道间参数并发送到解码端。例如,在双耳线索编码方法(BCC)中,声道间声级差(ICLD)、声道间时间差(ICTD)和声道间相关性(ICC)相当于声道间参数。另外,在声道间预测中的声道间预测系数、强度立体声中的能量比例系数(energy scale parameter)、以及主分量分析中的旋转角都为声道间参数。在BCC、ICP、IS和PCA中,必须求精度高的声道间参数,因此一般以子带为单位进行声道间参数的计算和编码。图I和图2简单地表示参数多声道编解码的结构。图I和图2中的各标号的含义如下。{xi sb}:分割为多个子带的一系列的多声道信号(这些信号表示频域、时域、或组合了频域和时域的混合域中的信号){yi sb}:在各子带中求得的缩混或变换后的一系列信号(这些信号是与Ixi sb}相同领域的信号)(Pi sJ :在各子带中求出的一系列声道间参数另外,下面以进行缩混为前提进行说明。在图I所示的编码端中,声道间参数生成单元101对输入信号Ixi sb}例如通过BCC、PCA等进行缩混而生成缩混信号{yi sb}和声道间参数{Pi sb}。编码单元102对缩混信号{yi sb}进行编码,另外准备的编码单元103 (声道间参数编码单元)对声道间参数{Pi—sb}进行编码。复用单元104将缩混信号{yi sb}的编码参数和声道间参数(Pi sb}的编码参数进行复用而生成比特流。该比特流被发送到解码端。在图2所示的解码端,分离单元201分离比特流而获得缩混信号的编码参数和声道间参数的编码参数。解码单元202使用缩混信号的编码参数进行解码处理,从而生成解码缩混信号
iy i—J。解码单元203 (声道间参数解码单元)使用声道间参数的编码参数来进行解码处理,从而生成解码声道间参数{P'—sb}。声道间参数适用单元204使用由解码声道间参数{P i sb}表示的空间信息,对解码缩混信号{y i—sb}进行上混(upmix),从而生成解码信号Ix'—sb}。非专利文献I中记载了基于频域中的主分量分析(PCA)的编解码。图3和图4表示非专利文献I中的基于PCA的编码装置和解码装置的结构。各标号的含义如下。{Lsb (f)}:分割为多个子带的左信号{Rsb (f)}:分割为多个子带的右信号{Pcsb (f)}:通过主分量分析对每个子带计算的主分量信号{Asb(f)}:通过主分量分析对每个子带计算的环境信号(ambient signal){ Θ sJ :通过主分量分析对每个子带计算的旋转角{PcARsb}:对每个子带计算出的主分量分析信号与环境信号的能量比在图3所示的编码端,主分量分析单元301将输入左信号{Lsb(f)}和输入右信号{Rsb(f)l变换为主分量信号{Pcsb(f)}和环境信号{Asb(f)}。在该变换过程中,对每个子带计算表示变换程度的旋转角。如下式计算旋转角。
)
权利要求
1.语音编码装置,包括 变换单元,将多个声道的输入信号变换为主分量信号,并且对每个子带计算表示声道间的信号的关系的声道间参数; 第一编码单元,对所述主分量信号进行编码而获得编码主分量信号; 解码单元,对所述编码主分量信号进行解码而获得解码主分量信号; 删除单元,使用所述解码主分量信号,从所述子带的所述声道间参数中删除冗余的参数;以及 第二编码单元,对删除了所述冗余的参数后的声道间参数进行编码。
2.如权利要求I所述的语音编码装置, 所述变换单元通过主分量分析,将所述输入信号变换为所述主分量信号, 所述声道间参数为旋转角。
3.如权利要求I所述的语音编码装置, 所述删除单元将各子带的能量与相邻的子带能量之比和阈值进行比较,在所述能量比小于所述阈值时删除所述声道间参数。
4.如权利要求I所述的语音编码装置, 所述删除单元将各子带的能量和掩蔽曲线的电平进行比较,在所述能量接近或小于所述掩蔽曲线时删除所述声道间参数。
5.语音编码方法,包括 变换步骤,将多个声道的输入信号变换为主分量信号,并且对每个子带计算表示声道间的信号的关系的声道间参数; 第一编码步骤,对所述主分量信号进行编码而获得编码主分量信号; 解码步骤,对所述编码主分量信号进行解码而获得解码主分量信号; 删除步骤,使用所述解码主分量信号,从所述子带的所述声道间参数中删除冗余的参数;以及 第二编码步骤,对删除了所述冗余的参数后的声道间参数进行编码。
全文摘要
公开了能够从编码对象中删除不需要的声道间参数而提高编码效率的语音编码装置。在该语音编码装置中,主分量分析单元(301)将输入左信号{Lsb(f)}和输入右信号{Rsb(f)}变换为主分量信号{Pcsb(f)}和环境信号{Asb(f)},并且对每个子带计算表示变换程度的旋转角;单声道编码单元(303)对主分量信号{Pcsb(f)}进行编码;旋转角编码单元(302)对旋转角{θsb}进行编码;局部单声道解码单元(603)生成解码后的主分量信号,以在编码端能够确认主分量信号的编码质量;冗余参数删除单元(604)通过分析解码主分量信号的编码质量而识别冗余的参数,并从编码对象中删除这些参数;复用单元(306)将{Pcsb(f)}的编码参数和旋转角编码参数进行复用并将比特流发送到解码端。
文档编号G10L19/02GK102714036SQ20108005817
公开日2012年10月3日 申请日期2010年12月27日 优先权日2009年12月28日
发明者Z.刘, 张国成 申请人:松下电器产业株式会社

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:用于静电摄影的光敏元件的制作方法技术领域:本发明涉及一种用于静电摄影的光敏元件,特别是一种由能改善静电摄影性能和低分子量有机光电导体构成的光敏元件。迄今,已有大量的有机光电导聚合物可用于静电摄影光敏元件,例如聚乙烯咔唑。这些一般的

    专利发布时间:2025-08-16阅读:(150)

    专利名称:蜂鸣器与开关组件复用的系统的制作方法技术领域:本实用新型涉及一种家用电器的控制系统,特指一种蜂鸣器与开关组件复用的系统。背景技术:家用电器已经成为现代日常生活的必备品。随着现代新型开关组件在家电产品中的应用,使得家用电器功能更具多

    专利发布时间:2025-08-16阅读:(137)

    专利名称:具有喷嘴保护装置的液晶分配设备的制作方法技术领域:本发明涉及一种液晶分配设备,尤其涉及一种用于防止由于排放液晶的喷嘴受损而导致液晶扩散并从液晶分配设备中滴落的液晶分配设备。另外,本发明还涉及一种用于防止液晶在喷嘴周围结块的液晶分配

    专利发布时间:2025-08-16阅读:(95)

    专利名称:一种制备脊形聚合物光波导的方法技术领域:本发明属于聚合物光波导制作技术领域,特别是涉及一种制备脊形聚合物光波导的方法,该方法是一种直接利用光刻技术的脊形聚合物光波导的制作方法。背景技术:传统的光波导材料主要是硅、二氧化硅、化合物半

    专利发布时间:2025-08-16阅读:(112)

    专利名称:铂金通道电加热设计方法技术领域:本发明涉及一种电加热的设计方法,具体涉及一种铂金通道电加热设 计方法。背景技术:液晶显示面板玻璃是平板显示设备,包括扁平玻璃基板或玻璃板。溢 流法是制造液晶显示面板玻璃所用玻璃板的优选方式。因为使用

    专利发布时间:2025-08-16阅读:(163)

    专利名称:显示器及测量该显示器对位组立偏移的方法技术领域:本发明是有关于一种显示器与一种测量该显示器对位组立偏移(Assemble Precision)的方法,且特别是有关于一种液晶显示器与一种测量 该液晶显示器组装时的对位组立偏移的方法。

    专利发布时间:2025-08-16阅读:(97)