语音编码装置和语音编码方法-品牌商务网

专利名称：语音编码装置和语音编码方法
技术领域：
本发明涉及语音编码装置和语音编码方法，特别涉及能够删除冗余的声道间参数的语音编码装置和语音编码方法。
背景技术：
在立体声语音编码方法或多声道语音编码方法中，一般存在两种方法。一种方法是，对不同声道的信号各自独立地进行编码的方法。该方法可容易适用于立体声语音信号或多声道语音信号。但是，该方法中，不能去除声道间的冗余性，因此整体的编码比特率与声道数成比例，比特率高。另一种方法是对立体声语音信号或多声道语音信号进行参数编码的方法。该方法的基本原理如下。也就是说，首先在编码端，将输入信号缩混(downmix)或变换为更少(或相同)数的信号。接着，使用现有的语音编码方法，对进行了缩混或变换的信号进行编码。与此同时，从原信号计算表示声道间的关系的声道间参数，并对声道间参数进行编码而发送到解码端，以在解码端能够生成立体声声像(stereo image)或多声道声像。该方法中，与对语音信号本身进行编码的情况相比，能够以更少的代码量对声道间参数进行编码，因此可实现低比特率化。在参数立体声编码系统或多声道编码系统中，广泛使用主分量分析(PCA)(非专利文献I)、双耳线索编码方法(Binaural Cue Coding, BCC)(非专利文献2)、声道间预测(ICP)(非专利文献3)、以及强度立体声(IS)(非专利文献4)。在这里举出的各方法中，生成某种声道间参数并发送到解码端。例如，在双耳线索编码方法(BCC)中，声道间声级差(ICLD)、声道间时间差(ICTD)和声道间相关性(ICC)相当于声道间参数。另外，在声道间预测中的声道间预测系数、强度立体声中的能量比例系数(energy scale parameter)、以及主分量分析中的旋转角都为声道间参数。在BCC、ICP、IS和PCA中，必须求精度高的声道间参数，因此一般以子带为单位进行声道间参数的计算和编码。图I和图2简单地表示参数多声道编解码的结构。图I和图2中的各标号的含义如下。{xi sb}:分割为多个子带的一系列的多声道信号(这些信号表示频域、时域、或组合了频域和时域的混合域中的信号){yi sb}:在各子带中求得的缩混或变换后的一系列信号(这些信号是与Ixi sb}相同领域的信号)(Pi sJ :在各子带中求出的一系列声道间参数另外，下面以进行缩混为前提进行说明。在图I所示的编码端中，声道间参数生成单元101对输入信号Ixi sb}例如通过BCC、PCA等进行缩混而生成缩混信号{yi sb}和声道间参数{Pi sb}。编码单元102对缩混信号{yi sb}进行编码，另外准备的编码单元103 (声道间参数编码单元)对声道间参数{Pi—sb}进行编码。复用单元104将缩混信号{yi sb}的编码参数和声道间参数(Pi sb}的编码参数进行复用而生成比特流。该比特流被发送到解码端。在图2所示的解码端，分离单元201分离比特流而获得缩混信号的编码参数和声道间参数的编码参数。解码单元202使用缩混信号的编码参数进行解码处理，从而生成解码缩混信号
iy i—J。解码单元203 (声道间参数解码单元)使用声道间参数的编码参数来进行解码处理，从而生成解码声道间参数{P'—sb}。声道间参数适用单元204使用由解码声道间参数{P i sb}表示的空间信息，对解码缩混信号{y i—sb}进行上混(upmix)，从而生成解码信号Ix'—sb}。非专利文献I中记载了基于频域中的主分量分析(PCA)的编解码。图3和图4表示非专利文献I中的基于PCA的编码装置和解码装置的结构。各标号的含义如下。{Lsb (f)}:分割为多个子带的左信号{Rsb (f)}:分割为多个子带的右信号{Pcsb (f)}:通过主分量分析对每个子带计算的主分量信号{Asb(f)}:通过主分量分析对每个子带计算的环境信号(ambient signal){ Θ sJ :通过主分量分析对每个子带计算的旋转角{PcARsb}:对每个子带计算出的主分量分析信号与环境信号的能量比在图3所示的编码端，主分量分析单元301将输入左信号{Lsb(f)}和输入右信号{Rsb(f)l变换为主分量信号{Pcsb(f)}和环境信号{Asb(f)}。在该变换过程中，对每个子带计算表示变换程度的旋转角。如下式计算旋转角。
)
权利要求
1.语音编码装置，包括变换单元，将多个声道的输入信号变换为主分量信号，并且对每个子带计算表示声道间的信号的关系的声道间参数；第一编码单元，对所述主分量信号进行编码而获得编码主分量信号；解码单元，对所述编码主分量信号进行解码而获得解码主分量信号；删除单元，使用所述解码主分量信号，从所述子带的所述声道间参数中删除冗余的参数；以及第二编码单元，对删除了所述冗余的参数后的声道间参数进行编码。
2.如权利要求I所述的语音编码装置，所述变换单元通过主分量分析，将所述输入信号变换为所述主分量信号，所述声道间参数为旋转角。
3.如权利要求I所述的语音编码装置，所述删除单元将各子带的能量与相邻的子带能量之比和阈值进行比较，在所述能量比小于所述阈值时删除所述声道间参数。
4.如权利要求I所述的语音编码装置，所述删除单元将各子带的能量和掩蔽曲线的电平进行比较，在所述能量接近或小于所述掩蔽曲线时删除所述声道间参数。
5.语音编码方法，包括变换步骤，将多个声道的输入信号变换为主分量信号，并且对每个子带计算表示声道间的信号的关系的声道间参数；第一编码步骤，对所述主分量信号进行编码而获得编码主分量信号；解码步骤，对所述编码主分量信号进行解码而获得解码主分量信号；删除步骤，使用所述解码主分量信号，从所述子带的所述声道间参数中删除冗余的参数；以及第二编码步骤，对删除了所述冗余的参数后的声道间参数进行编码。
全文摘要
公开了能够从编码对象中删除不需要的声道间参数而提高编码效率的语音编码装置。在该语音编码装置中，主分量分析单元(301)将输入左信号{Lsb(f)}和输入右信号{Rsb(f)}变换为主分量信号{Pcsb(f)}和环境信号{Asb(f)}，并且对每个子带计算表示变换程度的旋转角；单声道编码单元(303)对主分量信号{Pcsb(f)}进行编码；旋转角编码单元(302)对旋转角{θsb}进行编码；局部单声道解码单元(603)生成解码后的主分量信号，以在编码端能够确认主分量信号的编码质量；冗余参数删除单元(604)通过分析解码主分量信号的编码质量而识别冗余的参数，并从编码对象中删除这些参数；复用单元(306)将{Pcsb(f)}的编码参数和旋转角编码参数进行复用并将比特流发送到解码端。
文档编号G10L19/02GK102714036SQ20108005817
公开日2012年10月3日申请日期2010年12月27日优先权日2009年12月28日
发明者Z.刘, 张国成申请人:松下电器产业株式会社

本文推荐语音编码装置和语音编码方法仅代表作者观点，不代表本网站立场。本站对作者上传的所有内容将尽可能审核来源及出处，但对内容不作任何保证或承诺。请读者仅作参考并自行核实其真实性及合法性。如您发现图文视频内容来源标注有误或侵犯了您的权益请告知，本站将及时予以修改或删除。未经允许不得转载：http://www.pinpai35.com/1656752669.html

当前位置：网站首页>专利 >正文

语音编码装置和语音编码方法

相关推荐