当前位置:网站首页>专利 >正文

语音编码装置和语音编码方法

专利名称:语音编码装置和语音编码方法
技术领域
本发明涉及语音编码装置和语音编码方法,特别涉及能够删除冗余的声道间参数的语音编码装置和语音编码方法。
背景技术
在立 体声语音编码方法或多声道语音编码方法中,一般存在两种方法。一种方法是,对不同声道的信号各自独立地进行编码的方法。该方法可容易适用于立体声语音信号或多声道语音信号。但是,该方法中,不能去除声道间的冗余性,因此整体的编码比特率与声道数成比例,比特率高。另一种方法是对立体声语音信号或多声道语音信号进行参数编码的方法。该方法的基本原理如下。也就是说,首先在编码端,将输入信号缩混(downmix)或变换为更少(或相同)数的信号。接着,使用现有的语音编码方法,对进行了缩混或变换的信号进行编码。与此同时,从原信号计算表示声道间的关系的声道间参数,并对声道间参数进行编码而发送到解码端,以在解码端能够生成立体声声像(stereo image)或多声道声像。该方法中,与对语音信号本身进行编码的情况相比,能够以更少的代码量对声道间参数进行编码,因此可实现低比特率化。在参数立体声编码系统或多声道编码系统中,广泛使用主分量分析(PCA)(非专利文献I)、双耳线索编码方法(Binaural Cue Coding, BCC)(非专利文献2)、声道间预测(ICP)(非专利文献3)、以及强度立体声(IS)(非专利文献4)。在这里举出的各方法中,生成某种声道间参数并发送到解码端。例如,在双耳线索编码方法(BCC)中,声道间声级差(ICLD)、声道间时间差(ICTD)和声道间相关性(ICC)相当于声道间参数。另外,在声道间预测中的声道间预测系数、强度立体声中的能量比例系数(energy scale parameter)、以及主分量分析中的旋转角都为声道间参数。在BCC、ICP、IS和PCA中,必须求精度高的声道间参数,因此一般以子带为单位进行声道间参数的计算和编码。图I和图2简单地表示参数多声道编解码的结构。图I和图2中的各标号的含义如下。{xi sb}:分割为多个子带的一系列的多声道信号(这些信号表示频域、时域、或组合了频域和时域的混合域中的信号){yi sb}:在各子带中求得的缩混或变换后的一系列信号(这些信号是与Ixi sb}相同领域的信号)(Pi sJ :在各子带中求出的一系列声道间参数另外,下面以进行缩混为前提进行说明。在图I所示的编码端中,声道间参数生成单元101对输入信号Ixi sb}例如通过BCC、PCA等进行缩混而生成缩混信号{yi sb}和声道间参数{Pi sb}。编码单元102对缩混信号{yi sb}进行编码,另外准备的编码单元103 (声道间参数编码单元)对声道间参数{Pi—sb}进行编码。复用单元104将缩混信号{yi sb}的编码参数和声道间参数(Pi sb}的编码参数进行复用而生成比特流。该比特流被发送到解码端。在图2所示的解码端,分离单元201分离比特流而获得缩混信号的编码参数和声道间参数的编码参数。解码单元202使用缩混信号的编码参数进行解码处理,从而生成解码缩混信号
iy i—J。解码单元203 (声道间参数解码单元)使用声道间参数的编码参数来进行解码处理,从而生成解码声道间参数{P'—sb}。声道间参数适用单元204使用由解码声道间参数{P i sb}表示的空间信息,对解码缩混信号{y i—sb}进行上混(upmix),从而生成解码信号Ix'—sb}。非专利文献I中记载了基于频域中的主分量分析(PCA)的编解码。图3和图4表示非专利文献I中的基于PCA的编码装置和解码装置的结构。各标号的含义如下。{Lsb (f)}:分割为多个子带的左信号{Rsb (f)}:分割为多个子带的右信号{Pcsb (f)}:通过主分量分析对每个子带计算的主分量信号{Asb(f)}:通过主分量分析对每个子带计算的环境信号(ambient signal){ Θ sJ :通过主分量分析对每个子带计算的旋转角{PcARsb}:对每个子带计算出的主分量分析信号与环境信号的能量比在图3所示的编码端,主分量分析单元301将输入左信号{Lsb(f)}和输入右信号{Rsb(f)l变换为主分量信号{Pcsb(f)}和环境信号{Asb(f)}。在该变换过程中,对每个子带计算表示变换程度的旋转角。如下式计算旋转角。
)
权利要求
1.语音编码装置,包括 变换单元,将多个声道的输入信号变换为主分量信号,并且对每个子带计算表示声道间的信号的关系的声道间参数; 第一编码单元,对所述主分量信号进行编码而获得编码主分量信号; 解码单元,对所述编码主分量信号进行解码而获得解码主分量信号; 删除单元,使用所述解码主分量信号,从所述子带的所述声道间参数中删除冗余的参数;以及 第二编码单元,对删除了所述冗余的参数后的声道间参数进行编码。
2.如权利要求I所述的语音编码装置, 所述变换单元通过主分量分析,将所述输入信号变换为所述主分量信号, 所述声道间参数为旋转角。
3.如权利要求I所述的语音编码装置, 所述删除单元将各子带的能量与相邻的子带能量之比和阈值进行比较,在所述能量比小于所述阈值时删除所述声道间参数。
4.如权利要求I所述的语音编码装置, 所述删除单元将各子带的能量和掩蔽曲线的电平进行比较,在所述能量接近或小于所述掩蔽曲线时删除所述声道间参数。
5.语音编码方法,包括 变换步骤,将多个声道的输入信号变换为主分量信号,并且对每个子带计算表示声道间的信号的关系的声道间参数; 第一编码步骤,对所述主分量信号进行编码而获得编码主分量信号; 解码步骤,对所述编码主分量信号进行解码而获得解码主分量信号; 删除步骤,使用所述解码主分量信号,从所述子带的所述声道间参数中删除冗余的参数;以及 第二编码步骤,对删除了所述冗余的参数后的声道间参数进行编码。
全文摘要
公开了能够从编码对象中删除不需要的声道间参数而提高编码效率的语音编码装置。在该语音编码装置中,主分量分析单元(301)将输入左信号{Lsb(f)}和输入右信号{Rsb(f)}变换为主分量信号{Pcsb(f)}和环境信号{Asb(f)},并且对每个子带计算表示变换程度的旋转角;单声道编码单元(303)对主分量信号{Pcsb(f)}进行编码;旋转角编码单元(302)对旋转角{θsb}进行编码;局部单声道解码单元(603)生成解码后的主分量信号,以在编码端能够确认主分量信号的编码质量;冗余参数删除单元(604)通过分析解码主分量信号的编码质量而识别冗余的参数,并从编码对象中删除这些参数;复用单元(306)将{Pcsb(f)}的编码参数和旋转角编码参数进行复用并将比特流发送到解码端。
文档编号G10L19/02GK102714036SQ20108005817
公开日2012年10月3日 申请日期2010年12月27日 优先权日2009年12月28日
发明者Z.刘, 张国成 申请人:松下电器产业株式会社

喜欢就赞一下

上一篇
下一篇

相关推荐

    基于噪声屏蔽核的说话人识别方法【专利摘要】本发明公开了语音信号处理领域的一种基于噪声屏蔽核的说话人识别方法。该方法包括:步骤1:输入音频数据,对音频数据逐帧提取短时特征;步骤2:采用语音数据的短时特征训练一个含M个高斯混元的GMM模型,记为

    专利发布时间:2025-07-01阅读:(112)

    专利名称:消音室的抽拉板的制作方法技术领域:本实用新型涉及一种消音室,尤其涉及一种消音室的抽拉板。背景技术:消音室目前被广泛应用在机械、电子以及医疗设备等产品上的声学测量,其可作为医疗测听诊断室、语言录音室、车间控制室或者噪声测量室。因此,

    专利发布时间:2025-07-01阅读:(112)

    专利名称:用于印版处理的机器的制作方法技术领域:本发明包括一种用于印版处理的机器,特别涉及这样一种机器,其能够从光聚合物的印版除去未被紫外线照射从而未聚合的部分。美国专利n.4952961披露了一种用于印版处理的机器,其包括多个具有大致圆柱

    专利发布时间:2025-07-01阅读:(103)

    专利名称:色衬显微镜的制作方法技术领域:本实用新型涉及的是光学仪器,特别是一种采用了假彩色编码技术和空间滤波技术的使图像具有彩色、浮雕感和高衬度的显微镜。早在1896年,就有人设想把假彩色编码技术应用于显微镜,其特征是在成像光路中采用编码技

    专利发布时间:2025-07-01阅读:(93)

    专利名称:面光源装置的制作方法技术领域:本实用新型涉及一种面光源装置,尤其是涉及面光源装置中导光板的组 装和定位,以确保导光板电源输出具有良好效果。背景技术:目前液晶显示装置中,作为显示用的液晶面板本身无法产生光源,而需 要由与它相匹配的光

    专利发布时间:2025-07-01阅读:(111)

    专利名称:自调透光度的遮光装置的制作方法技术领域:本发明涉及一种可根据光源的光强度变化自动调整透光度的护目器材。它由保护玻璃,液晶器件,强光信号提取及信号处理,控制电路构成。本发明适用于作为焊工面罩的观察窗或有弧光等其它强光工作场合的护目器

    专利发布时间:2025-07-01阅读:(88)