当前位置:网站首页>专利 >正文

多通道音频解码方法及其设备的制作方法

专利名称:多通道音频解码方法及其设备的制作方法
技术领域
本发明的示例性实施例涉及一种与MPEG-I音频层3(MP3)解码器兼容的多通道音频系统,更具体地说,涉及一种与MP3解码器兼容并具有低复杂度的多通道音频解码方法和设备。
背景技术
最近,与MPEG-I音频层3 (MP3)音频兼容的多通道解码器被广泛地使用。MP3解码器通过对音频比特流进行解码来恢复立体声音频信号。多通道解码器通过使用附加信息来将已由MP3解码器恢复的立体声音频信号恢复为多通道音频信号。此外,MP3解码器和多通道解码器包括多个系数变换器,每个系数变换器包括正交镜像滤波器(QMF)分析器和QMF合成器。

发明内容
技术问题对于与MP3音频兼容的多通道解码器,大多数系数变换器导致复杂性。因此,需要开发用于改善与MP3音频兼容的多通道解码器的复杂度的解决方案。技术方案本发明的示例性实施例提供了一种与MPEG-I音频层3(MP3)解码器兼容并具有低复杂度的多通道音频解码方法及其设备。有益效果根据示例性实施例,可通过使用连续变换单元而不是使用根据现有技术的第一 PQMF合成单元、PQMF分析单元和第二 PQMF合成单元,来改善信号的变换的复杂度。


通过参照附图详细地描述本发明的示例性实施例,本发明的以上和其它特征将变得更加清楚,其中图1 (A)是普通多通道编码设备的框图;图1 (B)是MPEG-I音频层3 (MP3)编码器的详细框图;图2(A)至图2(D)是展示MP3编码器中的子频带的下采样操作的频域的概况;图3是与普通MP3解码器兼容的多通道解码设备的示图;图4是根据本发明的示例性实施例的与MP3解码器兼容的多通道解码设备的示图;图5是图4中的连续变换单元中的输入信号和输出信号之间的关系的示图;图6是图4中的连续变换单元的详细示图;图7(A)是由图4中的连续变换单元执行的操作的详细流程图7⑶是与参照图7 (A)描述的将频带划分为多个域相关的图解;图8是根据本发明的示例性实施例的与MP3解码器兼容的多通道音频信号解码方法的流程图。最佳实施方式根据本发明的一方面,提供了一种多通道音频解码方法,包括以下操作从具有预定格式的比特流解码多个频带的滤波器组系数;针对所述多个频带中的每一个,对所述多个频带的解码的滤波器组系数执行频率变换;根据预定的相位补偿值对所述多个频带中的每一个的相位进行补偿,并在频域上对所述多个频带中的每一个的频率变换的系数进行连续频带合成;从频带合成的频率变换的系数解码多通道音频信号。连续频带合成的操作可包括以下操作设置相位补偿值和相位响应值;将所述多个频带划分为偶数频带和奇数频带,并将划分的多个频带中的每一个划分为多个域;基于相位补偿值和相位响应值,计算所述多个域中的每一个的相移值,并根据计算的相移值对所述多个频带中的每一个的相位进行补偿;对经过相位补偿的偶数频带和奇数频带的频率变换的系数进行连续合成。根据本发明的另一方面,提供了一种多通道音频解码设备,包括=MPEG-I音频层 3(MP3)解码核心单元,用于从MP3比特流解码多个频带的滤波器组系数;快速傅立叶变换 (FFT)单元,用于针对所述多个频带中的每一个,对由MP3解码核心单元进行解码的所述多个频带的滤波器组系数执行FFT ;连续变换单元,用于根据预定的相位补偿值对由FFT单元执行FFT的所述多个频带中的每一个的相位进行移位,并在频域上对所述多个频带中的每一个的FFT系数进行连续频带合成;多通道解码核心单元,用于从由连续变换单元进行频带合成的FFT系数解码多通道音频信号。连续变换单元可包括带域划分单元,用于将所述多个频带划分为偶数频带和奇数频带,并将多个划分的频带中的每一个划分为预定数量的域;带域相位补偿单元,用于基于预定的相位补偿值和预定的相位响应值,计算通过由带域划分单元进行划分而获得的多个域中的每一个的相移值,并根据计算的相移值对所述多个频带中的每一个的相位进行补偿;频带合成单元,用于对由带域相位补偿单元进行相位补偿的偶数频带和奇数频带的 FFT系数进行连续合成。
具体实施例方式以下,将通过参照附图解释本发明的示例性实施例来详细描述本发明。图I(A)是普通多通道编码设备的框图。图I(B)是图KA)的MPEG-I音频层3 (MP3) 编码器120中的伪正交镜像滤波器(PQMF)分析单元121的框图。多通道编码器110将多通道信号下混合为双通道音频信号,并对用于多通道信号的恢复的附加信息进行编码。MP3编码器120通过使用从多通道编码器110输入的双通道音频信号和附加信息, 来对立体声比特流进行编码。此外,如图1 (B)中所示,MP3编码器120包括PQMF分析单元121以对双通道音频
信号进行编码。PQMF分析单元121包括带通滤波单元122和下采样器123。
带通滤波单元122将时间轴上的双通道音频信号变换为由多个子频带组成的音
频信号。下采样器123将从带通滤波单元122输出的音频信号变换为被下采样的音频信号。图2(A)至图2(D)是展示MP3编码器120中的子频带的下采样操作的频域的概况。图2(A)示出5个子频带的下采样滤波器的特征,图2(B)示出针对第二子频带的下采样滤波器的输出频谱,图2(C)示出针对第二子频带的被下采样并被插值的频谱,图 2(D)示出已通过低通滤波器的第二子频带的频谱。参照图2 (C),与原始信号相应的第k频带Gk210的信号受到信号Fk230的第k复制信号220和第k+Ι复制信号240的影响。参照图2 (D),已通过低通滤波器的子频带250和260在它们的边界包括混叠分量 270和280。在子频带之间的边界的混叠分量270和280使信号的相位移位。因此,本发明的一个或多个示例性实施例对信号的相移进行补偿以去除在子频带之间的边界的混叠分量270和280,其中,通过下采样产生混叠分量270和280。图3是与普通MP3解码器兼容的多通道解码设备的示图。图3中的与普通MP3兼容的多通道解码设备被划分为MP3解码器和多通道解码器。MP3解码器包括MP3解码核心单元310和第一 PQMF合成单元330,多通道解码器包括 PQMF分析单元340、第一快速傅立叶变换(FFT)单元351至第N快速傅立叶变换(FFT)单元354、多通道解码核心单元360、第一快速傅立叶逆变换(IFFT)单元371至第N快速傅立叶逆变换(IFFT)单元374以及第二 PQMF合成单元380 (这里,N是大于或等于1的整数)。首先,将描述MP3解码器。MP3解码核心单元310从输入的MP3比特流提取多个频带的改进离散余弦变换 (MDCT)系数和附加信息,并从所述多个频带的MDCT系数产生所述多个频带的滤波器组 (filter bank)值(第一至第N滤波器组值)。第一 PQMF合成单元330合成由MP3解码核心单元310产生的所述多个频带的滤波器组值(第一至第N滤波器组值),从而产生时域上的音频流。接下来,将描述多通道解码器。PQMF分析单元340将从MP3解码器输入的时域上的音频流划分为频域上的多个子频带。第一 FFT单元351至第NFFT单元354针对每个子频带,对所述多个子频带的音频信号执行FFT,其中,从PQMF分析单元340输出所述多个子频带的音频信号。多通道解码核心单元360通过使用从MP3解码核心单元310提取的附加信息,对多通道子频带的由第一 FFT单元351至第NFFT单元354执行FFT的FFT系数执行解码。第一 IFFT单元371至第NIFFT单元374将由多通道解码核心单元360解码的多通道子频带的FFT系数恢复为时域上的子频带的音频信号。第二 PQMF合成单元380通过合成子频带的音频信号来产生多通道音频信号,其中,由第一 IFFT单元371至第NIFFT单元374恢复所述音频信号。根据本发明的一个或多个示例性实施例,由具有低复杂度的变换器来代替图3中的具有高复杂度的第一 PQMF合成单元330、PQMF分析单元340和第二 PQMF合成单元380。
图4是根据本发明的示例性实施例的与MP3解码器兼容的多通道解码设备的示图。图4中的多通道解码设备包括MP3解码核心单元410、FFT单元430、连续变换单元440、多通道解码核心单元450和IFFT单元460。MP3解码核心单元410从输入的MP3比特流提取MDCT系数和附加信息,从MDCT系数提取多个子频带的滤波器组值(第一至第N滤波器组值)。这里,所述多个子频带的滤波器组值可使用逆MDCT (IMDCT)系数。FFT单元430通过使用第一 FFT单元431至第NFFT单元434,针对每个子频带,对所述多个子频带的滤波器组值(第一至第N滤波器组值)执行FFT,其中,从MP3解码核心单元410输出滤波器组值。此时,可执行另一频率系数变换(诸如离散傅立叶变换(DFT)) 而非FFT。连续变换单元440针对由于在子频带的边界的混叠分量引起的相移,对子频带的 FFT系数进行补偿,其中,针对子频带中的每一个对FFT系数执行FFT。随后,连续变换单元 440在频域中对经过相位补偿的子频带进行连续频带合成。多通道解码核心单元450通过使用由MP3解码核心单元410提取的附加信息,将由连续变换单元440进行频带合成的FFT系数上混合为多通道FFT系数。例如,多通道解码核心单元450将经过频带合成的音频信号上混合为由6个多通道组成的多通道音频信号,其中,所述6个多通道是左前通道、右前通道、左后通道、右后通道、中央通道和低频增强(LFE)通道。IFFT单元460将由多通道解码核心单元450解码的多通道FFT系数恢复为时域上的多通道音频信号。根据示例性实施例,可通过使用连续变换单元440而不是使用根据现有技术的第一 PQMF合成单元330、PQMF分析单元340和第二 PQMF合成单元380,来改善信号的变换的
复杂度。图5是图4中的连续变换单元440中的输入信号和输出信号之间的关系的示图。参照图5,连续变换单元440可通过使用FFT单元430的第一 FFT单元431至第 NFFT单元434连续合成多个子频带的FFT系数,产生执行大点数FFT (large point FFT) 的效果,其中,对子频带中的音频信号执行小点数FFT(small point FFT)。例如,在IHz至 22kHz之间的频带被划分为32个子频带之后,32个FFT单元431至434中的每一个执行 128点FFT。连续变换单元440采用32个带宽为大约为1. 3kHz的子频带的FFT系数,最终产生与对与所述32个子频带相应的IHz至22kHz之间的整个频带执行4096点FFT的情况相同的结果。图6是图4中的连续变换单元440的详细示图。图4中的连续变换单元440包括带域(band domain)划分单元610、带域相位补偿单元620和频带合成单元630。带域划分单元610将多个频带划分为偶数频带和奇数频带,并将被划分的频带中的每一个划分为多个域。带域相位补偿单元620基于预定的相位补偿值和预定的相位响应值,计算带域划分单元610的所述多个域的相移值,并通过使用所述多个域的相移值来对所述多个域的频
7带的每个相位进行补偿。频带合成单元630对由带域相位补偿单元620进行相位补偿的偶数频带和奇数频带的FFT系数进行连续合成。图7(A)是由图4中的连续变换单元440执行的操作的详细流程图。首先,由用户或根据测试值适当地确定第一相位补偿值、第二相位补偿值、幅度响应值和相位响应值(操作712)。这里,第一相位补偿值是涉及对从原始信号复制的信号的相移进行补偿的值,第二相位补偿值是涉及将根据Z变换的信号相位值变换为根据FFT的信号相位值的值。此外,由MP3的PQMF的低通原型滤波器应用幅度响应值和相位响应值。首先,多个频带的FFT系数被输入(操作714)。例如,32个频带的FFT系数被输入。随后,所述32个频带被划分为偶数频带和奇数频带(操作716)。除了第32频带,偶数频带中的每一个被划分为多个域(操作722)。例如,假设每个频带被划分为三个域。随后,如图7(B)中所示,第一域①被设置为频带中的第1/4FFT系数至第1/2FFT系数,第二域②被设置为频带中的第1/2FFT系数至最后一个FFT系数,第三域③被设置为频带中的第一 FFT系数至第1/4FFT系数。随后,基于第一相位补偿值、第二相位补偿值和相位响应值执行对每个域的相移的相位补偿(操作724)。例如,通过使用等式1、2和3来确定第一域①、第二域②和第三域 ③的相移值。这里,M指示每个频带的长度。[等式1]第一域的相移=第一相位补偿值X (M/4 1) +第二相位补偿值X (每个频带的索引-1)/2+相位响应值-π[等式2]第二域的相移=第一相位补偿值X (0 M/2) +第二相位补偿值X (每个频带的索引-1)/2+相位响应值+ π[等式3]第三域的相移=第一相位补偿值X (Μ/2 Μ/4) +第二相位补偿值X (每个频带的索引-1)/2+相位响应值-π随后,按照其域已经过根据操作712至724的相位补偿的偶数频带的顺序来重构偶数频带,并且将预定的幅度响应值与每个域的FFT窗(bin)相乘(操作726)。也就是说, 通过使用第一域①、第二域②和第三域③的相移值来对每个频带的相位进行补偿。随后,使用与第一域①和第二域②相应的FFT系数,对第32频带执行操作724和 726 (操作728)。这里,通过使用与1 M/4域相应的幅度响应值和相位响应值来对第32 频带的相位进行补偿。同时,除了第一频带,奇数频带中的每一个被划分为三个域(操作732)。例如,第一域①被设置为频带中的第3/4FFT系数至最后一个FFT系数,第二域被设置为频带中的第一 FFT系数至第1/2FFT系数,第三域被设置为频带中的第1/2FFT系数至第3/4FFT系数。随后,基于第一相位补偿值、第二相位补偿值和相位响应值来执行对每个域的相移的相位补偿(操作734)。例如,通过使用等式4、5和6来确定第一域、第二域和第三域的相移值。这里,M指示每个频带的长度。
[等式4]第一域的相移=第一相位补偿值X (M/4 1) +第二相位补偿值X (每个频带的索引-1)/2+相位响应值[等式5]第二域的相移=第一相位补偿值X (0 M/2) +第二相位补偿值X (每个频带的索引-1)/2+相位响应值[等式6]第三域的相移=第一相位补偿值X(M/2 M/4) +第二相位补偿值X(每个频带的索引-1)/2+相位响应值随后,按照其域已经过根据操作732和734的相位补偿的奇数频带的顺序来重构偶数频带,并且将预定的幅度响应值与每个域的FFT窗相乘(操作736)。也就是说,通过使用第一域、第二域和第三域的相移值来对每个频带的相位进行补偿。 随后,使用与第二域和第三域相应的FFT系数,对第1频带执行操作734和736 (操作738)。这里,通过使用与M/4 M域相应的幅度响应值和相位响应值来对第1频带的相位进行补偿。因此,根据本发明的示例性实施例,为了去除由如图2(D)中所示的下采样而产生的混叠分量330,针对每个域对相移进行补偿。最后,被划分为偶数频带和奇数频带的32个频带在频域上被连续合成(操作 740)。图8是根据本发明的示例性实施例的与MP3解码器兼容的多通道音频信号解码方法的流程图。首先,对具有预定格式的比特流进行解码以提取多个子频带的滤波器组值(多个子频带的IMDCT系数)(操作810)。具有预定格式的比特流可以是MP3比特流。通过执行FFT,针对每个频带将所述多个子频带的滤波器组值变换为FFT系数(操作 820)。随后,通过使用相位补偿值和相位响应值,对每个频带的FFT系数的相位进行移位,从而由于在多个频带的边界的混叠分量引起的相移被补偿(操作830)。在频域对多个信号相位被补偿的频带的FFT系数进行连续频带合成(操作840)。随后,对频带合成的FFT系数执行多通道音频解码以提取多通道FFT系数(操作 850)。更具体地,通过使用从MP3比特流解码的附加信息,将频带合成的频率变换的系数上混合为多通道频率变换的系数,从多通道频率变换的系数恢复时域上的多通道音频信号。随后,执行逆FFT以将多通道FFT系数变换为时域上的多通道音频信号(操作 860)。虽然已参照本发明的示例性实施例具体示出并描述了本发明,但是本领域的普通技术人员将理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可对其进行形式和细节上的各种改变。产业上的可利用性
本发明还可被实现为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可存储随后可由计算机系统读取的数据的任何数据存储装置。计算机可读记录介质的示例包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置等。计算机可读记录介质还可被分布在联网的计算机系统上,从而计算机可读代码以分布式方式被存储和执行。此外,本发明所属的技术领域的程序员可容易地解释用于完成本发明的功能程序、代码和代码片段。
权利要求
1.一种多通道音频解码方法,包括从预定格式的比特流解码多个频带的滤波器组系数;对所述多个频带的解码的滤波器组系数执行频率变换,以输出所述多个频带的频率变换的系数;根据预定的相位补偿值对所述多个频带的相位进行补偿,并在频域上对所述多个频带的频率变换的系数进行连续频带合成;从连续频带合成的频率变换的系数解码多通道音频信号。
2.如权利要求1所述的多通道音频解码方法,其中,预定格式的比特流是MPEG-I音频层3(MP3)比特流。
3.如权利要求1所述的多通道音频解码方法,其中,连续频带合成的步骤包括对所述多个频带的快速傅立叶变换(FFT)系数执行大点数FFT,其中,对音频信号执行小点数FFT。
4.如权利要求1所述的多通道音频解码方法,其中,所述多个频带的滤波器组系数是逆改进离散余弦变换(IMDCT)系数。
5.如权利要求1所述的多通道音频解码方法,其中,对相位进行补偿的步骤包括去除在所述多个频带的边界的混叠分量,其中,通过经由MP3解码器的伪正交镜像滤波器 (PQMF)对所述多个频带的音频信号进行下采样,产生混叠分量。
6.如权利要求1所述的多通道音频解码方法,其中,连续频带合成的步骤包括设置相位补偿值和相位响应值;将所述多个频带划分为偶数频带和奇数频带,并将划分的多个频带中的每一个划分为多个域;基于相位补偿值和相位响应值,计算所述多个域的相移值,并根据计算的相移值对所述多个频带的相位进行补偿;对经过相位补偿的多个频带进行连续合成。
7.如权利要求6所述的多通道音频解码方法,还包括将预定的幅度响应值与所述多个经过相位补偿的多个频带相乘。
8.如权利要求6所述的多通道音频解码方法,其中,相位补偿值包括第一相位补偿值,被设置为对从原始信号复制的信号的相移进行补偿;第二相位补偿值,涉及将根据Z变换的信号相位值变换为根据快速傅立叶变换(FFT)的信号相位值。
9.如权利要求6所述的多通道音频解码方法,其中,连续合成的步骤包括按照所述多个经过相位补偿的频带的多个域的顺序重构所述多个频带,并对重构的多个频带进行合成。
10.如权利要求6所述的多通道音频解码方法,其中,对相位进行补偿的步骤包括针对偶数频带、奇数频带和所述多个域,获得不同的相移值。
11.如权利要求1所述的多通道音频解码方法,其中,对多通道音频信号进行解码的步骤包括通过使用从具有预定格式的比特流解码的附加信息,将连续频带合成的频率变换的系数上混合为多通道频率变换的系数,并从多通道频率变换的系数恢复时域中的多通道音频信号。
12.—种多通道音频解码设备,包括MPEG-I音频层3(MP;3)解码核心单元,从MP3比特流解码多个频带的滤波器组系数;快速傅立叶变换(FFT)单元,对所述多个频带的解码的滤波器组系数执行FFT;连续变换单元,根据预定的相位补偿值对由FFT单元执行FFT的多个频带的相位进行移位,并在频域中对所述多个频带的FFT系数进行连续频带合成;多通道解码核心单元,从由连续变换单元进行连续频带合成的FFT系数解码多通道音频信号。
13.如权利要求12所述的多通道音频解码设备,其中,连续变换单元包括带域划分单元,将所述多个频带划分为偶数频带和奇数频带,并将多个划分的频带划分为预定数量的域;带域相位补偿单元,基于预定的相位补偿值和预定的相位响应值,计算所述多个域的相移值,并根据计算的相移值对所述多个频带的相位进行补偿;频带合成单元,对由带域相位补偿单元进行相位补偿的偶数频带和奇数频带的FFT系数进行连续合成。
14.一种其上记录有用于执行多通道音频解码的方法的程序的计算机可读记录介质, 所述方法包括从预定格式的比特流解码多个频带的滤波器组系数;对所述多个频带的解码的滤波器组系数执行频率变换,以输出所述多个频带的频率变换的系数;根据预定的相位补偿值对所述多个频带的相位进行补偿,并在频域中对所述多个频带的频率变换的系数进行连续频带合成;从连续频带合成的频率变换的系数解码多通道音频信号。
15.一种多通道音频解码方法,包括对比特流进行解码以输出多个频带的系数;将所述多个频带的系数变换到频域,并输出所述多个频带的频率系数;根据第一值对所述多个频带的频率系数的相位进行补偿,并对所述多个带的频率系数进行连续频带合成;对所述多个频带的经过连续频带合成的频率系数进行解码,以输出多通道音频信号。
全文摘要
提供了一种多通道音频解码方法及其设备,所述方法包括从具有预定格式的比特流解码多个频带的滤波器组系数;针对所述多个频带中的每一个,对所述多个频带的解码的滤波器组系数执行频率变换;根据预定的相位补偿值对所述多个频带中的每一个的相位进行补偿,并在频域上对所述多个经过相位补偿的频带中的每一个的频率变换的系数进行连续频带合成;从频带合成的频率变换的系数解码多通道音频信号。
文档编号G10L19/00GK102483943SQ201080037100
公开日2012年5月30日 申请日期2010年7月29日 优先权日2009年8月18日
发明者文瀚吉, 郑钟勋, 金贤郁 申请人:三星电子株式会社

喜欢就赞一下

上一篇
下一篇

相关推荐

    基于各子带特征参数值的清浊音判决装置及其判决方法【专利摘要】本发明公开了一种基于各子带特征参数值的清浊音判决装置,包括语音信号分帧模块、离散高通滤波模块、提取编码的特征参数模块、分割K个频带模块、统计特征参数的特性值模块和清浊音判决模块;本

    专利发布时间:2025-05-15阅读:(69)

    多路麦克风伴唱评分系统及其方法【专利摘要】本发明提供的一种多路麦克风伴唱评分系统,包括多个麦克风,每个麦克风分别进行收音以产生相应的输入音频;音效模块,用来接收每个麦克风的输入音频以进行模拟/数字信号转换;处理单元,用来驱动所述音效处理单元

    专利发布时间:2025-05-15阅读:(85)

    专利名称:Led发光t8日光灯管电源组装构造的制作方法技术领域:本实用新型公开一种LED发光Τ8日光灯管电源组装构造,按国际专利分类表(IPC)划分属于LED灯具制造技术领域,尤其是涉及一种Τ8日光灯管内LED电源安装改进结构。背景技术:现

    专利发布时间:2025-05-15阅读:(78)

    专利名称:一种具有磁寻址磁擦除特性的电子纸张材料的制备方法技术领域:本发明属于功能高分子材料液晶显示领域,涉及液晶材料,磁性纳米材料, 特别涉及到磁性纳米粒子在液晶中可以由磁场控制移动以及胆甾相液晶对入射 光具有选择性反射,用于制备零能耗的

    专利发布时间:2025-05-15阅读:(81)

    提高口语评测性能的方法及系统的制作方法【专利摘要】本发明公开了一种提高口语评测性能的方法及系统,该方法包括:接收待评测的用户语音数据,所述语音数据包括:朗读题语音数据和半开放题型语音数据;根据所述朗读题语音数据对各朗读题进行评分;从评分结果

    专利发布时间:2025-05-15阅读:(79)

    音频编码中的帧元素长度传输的制作方法【专利摘要】通过如下布置可以更高效地传输将成为可用于跳过的帧元素:在配置块内分开传输默认有效载荷长度信息,其中在帧元素内的长度信息转而被细分成默认有效载荷长度标记,如果该默认有效载荷长度标记没有被设定则其

    专利发布时间:2025-05-15阅读:(79)