切换模式的音频带宽扩展装置与方法
【专利摘要】本发明涉及一种切换模式的音频带宽扩展编解码装置与方法,将输入的带宽信号进行语音信号、音频信号的分类并根据分类进行变换域带宽扩展编码或线性预测带宽扩展编码的选择,对高频信号或低频信号进行编码;根据不同的编码方式选择解码方式,合成高频信号。本发明综合考虑了语音和音频信号的类型差异,针对不同信号采用不同的带宽扩展策略。与AVS-P10编码器相比,主观听力MOS分略有提升,客观质量信噪比提升明显。
【专利说明】切换模式的音频带宽扩展装置与方法
【技术领域】
[0001] 本发明涉及音频编码【技术领域】,尤其涉及切换模式的音频带宽扩展编解码装置与 方法。
【背景技术】
[0002] 相对于音频信号的高频信息,人耳对音频信号的低频信息更敏感。大多低比特率 音频编码为提高编码效率,高频信息几乎被截去,而只对低频信息编码,因此重建的音频 信号丧失了明亮度与自然度,导致整体音频质量下降。为了还原音频信号的带宽,提高音 频解码质量,带宽扩展技术被引入到音频解码器中以恢复截去的高频信息。但现有带宽扩 展技术对于音频类型的考虑不周,导致高频信息重建音质欠缺。
【发明内容】
[0003] 本发明的目的在于为克服现有技术的缺陷,而提供一种切换模式的音频带宽扩展 编解码装置与方法,以提高音频带宽扩展中高频信息的重建音质。
[0004] 为实现上述目的,本发明采用以下技术方案:一种切换模式的音频带宽扩展编解 码的方法,包括具体以下的步骤:
[0005] S1、输入的带宽信号由分析滤波得到高频信号和低频信号;
[0006] S2、将输入的带宽信号进行语音信号、音频信号的分类并根据分类进行编码模式 的选择,若为音频信号,模式位输出1,执行步骤S3 ;若为语音信号,模式位输出0,执行步骤 S4;
[0007] S3、若步骤S2的模式位为1,进行变换域带宽扩展编码,将高频信号和低频信号依 次快速傅立叶变换、子带划分、增益计算、增益编码,最后输出码流;
[0008] S4、若步骤S2的模式位为0,进行线性预测带宽扩展编码,对分频得到的高频信号 进行LPC分析、LPC编码、合成滤波冲击响应;对分频得到的低频信号进行残差提取、快速傅 立叶变换;所述冲击响应信号与进行残差提取、快速傅立叶变换后的低频信号进行相乘运 算,该运算结果与经过快速傅立叶变换后的高频信号进行增益计算,最后对增益编码并输 出到码流;
[0009] S5、根据步骤S2的语音信号、音频信号的分类进行解码模式的选择,步骤S2的模 式位为1时执行步骤S6,步骤S2模式位为0时则执行步骤S7 ;
[0010] S6、将步骤S3所输出的码流解码,通过低频解码后的低频信号与解码后的高频增 益参数进行相乘得到合成后的高频信号;
[0011] S7、将步骤S4所输出的码流解码,对解码后的低频信号进行快速傅立叶变换,对 高频LPC系数解码,同时生成高频冲击响应,对增益解码及平滑处理得到增益因子,将解码 后快速傅立叶变换的低频信号与高频冲击响应信号进行相乘运算得到基础信号,将基础信 号与增益因子进行相乘运算得到生成的高频信号;
[0012] S8、将步骤S6得到的高频信号与解码后的低频信号通过合成滤波器合成解码信 号或将步骤S7得到的高频信号与解码后的低频信号通过合成滤波器合成解码信号。
[0013] 所述步骤S2对输入信号进行残差能量计算并预设一个阈值,若残差能量大于预 设的阈值,分类为音频信号,模式位输出1 ;反之,若残差能量小于预设的阈值,分类为语音 信号,模式位输出〇。
[0014] 所述步骤S2预设的阀值为0. 18。
[0015] 一种切换模式的音频带宽扩展编解码装置,包括编码单元和解码单元,所述编码 单元包括分析滤波模块、编码模式选择模块、变换域带宽扩展编码模块、线性预测带宽扩展 编码模块;所述解码单元由解码模式选择模块、变换域带宽扩展解码模块、线性预测带宽扩 展解码模块、高频信号合成滤波模块;
[0016] 所述分析滤波模块,用于将输入的带宽信号分频成高频信号与低频信号;
[0017] 所述编码模式选择模块,用于将输入的带宽信号进行语音信号、音频信号的分类 并根据分类进行编码模式的选择;
[0018] 所述变换域带宽扩展编码模块,用于将高频信号和低频信号依次快速傅立叶变 换、子带划分、增益计算、增益编码,最后输出码流;
[0019] 所述线性预测带宽扩展编码模块,用于对分频得到的高频信号进行LPC分析、LPC 编码、合成滤波冲击响应;对分频得到的低频信号进行残差提取、快速傅立叶变换;所述冲 击响应信号与进行残差提取、快速傅立叶变换后的低频信号进行相乘运算,该运算结果与 经过快速傅立叶变换后的高频信号进行增益计算,最后对增益编码并输出到码流;
[0020] 所述解码模式选择模块,用于根据编码模式选择模块确定的编码模式进行解码模 式模式的选择;
[0021] 所述变换域带宽扩展解码模块,用于接收由变换域带宽扩展编码模块输入的码 流,并将通过低频解码后的低频信号与解码后的高频增益参数进行相乘得到合成后的高频 信号;
[0022] 所述线性预测带宽扩展解码模块,用于接收由线性预测带宽扩展编码模块输入的 码流,并对解码后的低频信号进行快速傅立叶变换,对高频LPC系数解码,同时生成高频冲 击响应,对增益解码及平滑处理得到增益因子,将解码后快速傅立叶变换的低频信号与高 频冲击响应信号进行相乘运算得到基础信号,将基础信号与增益因子进行相乘运算得到生 成的高频信号;
[0023] 所述合成滤波模块,用于将变换域带宽扩展解码模块得到的高频信号与解码后的 低频信号合成解码信号或者用于将线性预测带宽扩展解码模块得到的高频信号与解码后 的低频信号合成解码信号。
[0024] 所述编码模式选择模块依据带宽输入信号计算预测残差能量并预设一个阈值,若 残差能量大于预设的阈值,分类为音频信号,模式位输出1,选择变换域带宽扩展编码;反 之,若残差能量小于预设的阈值,分类为语音信号,模式位输出〇,选择线性预测带宽扩展编 码。
[0025] 所述编码模式选择模块预设的阀值为0. 18。
[0026] 所述解码模式选择模块在编码模式选择模块输出位为1时则选择变换域带宽扩 展解码模式,输出位为〇时则进行线性预测带宽扩展解码模式。
[0027] 本发明与现有技术相比的有益效果是:本发明综合考虑了语音和音频信号的类型 差异,针对不同信号采用不同的带宽扩展策略。与AVS-P10编码器相比,主观听力MOS分略 有提升,客观质量信噪比提升明显。
[0028] 下面结合附图和具体实施例对本发明作进一步描述。
【专利附图】
【附图说明】
[0029] 图1是本发明实施例的编解码方法流程图;
[0030] 图2是本发明实施例的变换域带宽扩展编码流程图;
[0031] 图3是本发明实施例的线性预测带宽扩展编码流程图;
[0032] 图4是本发明实施例的变换域带宽扩展解码流程图;
[0033] 图5是本发明实施例的线性预测带宽扩展解码流程图;
[0034] 图6是本发明实施例的编解码结构框图;
【具体实施方式】
[0035] 为了更充分理解本发明的技术内容,下面结合具体实施例对本发明的技术方案进 一步介绍和说明。
[0036] 如图1所示,一种切换模式的音频带宽扩展编解码的方法,包括具体以下的步骤: [0037] 编码工作部分
[0038] 在步骤S1中,输入的带宽信号由分析滤波得到高频信号和低频信号。
[0039] 在步骤S2中,将输入的带宽信号进行语音信号、音频信号的分类并根据分类进行 编码模式的选择,若为音频信号,模式位输出1,执行步骤S3 ;若为语音信号,模式位输出0, 执行步骤S4。
[0040] 在步骤S3中,若步骤S2的模式位为1,进行变换域带宽扩展编码,将高频信号和低 频信号依次快速傅立叶变换、子带划分、增益计算、增益编码,最后输出码流。
[0041] 在步骤S4中,若步骤S2的模式位为0,进行线性预测带宽扩展编码,对分频得到的 高频信号进行LPC分析、LPC编码、合成滤波冲击响应;对分频得到的低频信号进行残差提 取、快速傅立叶变换;所述冲击响应信号与进行残差提取、快速傅立叶变换后的低频信号进 行相乘运算,该运算结果与经过快速傅立叶变换后的高频信号进行增益计算,最后对增益 编码并输出到码流。
[0042] 解码工作部分
[0043] 在步骤S5中,根据步骤S2的语音信号、音频信号的分类进行解码模式的选择,步 骤S2的模式位为1时执行步骤S6,步骤S2模式位为0时则执行步骤S7。
[0044] 在步骤S6中,将步骤S3所输出的码流解码,通过低频解码后的低频信号与解码后 的高频增益参数进行相乘得到合成后的高频信号。
[0045] 在步骤S7中,将步骤S4所输出的码流解码,对解码后的低频信号进行快速傅立 叶变换,对高频LPC系数解码,同时生成高频冲击响应,对增益解码及平滑处理得到增益 因子,将解码后快速傅立叶变换的低频信号与高频冲击响应信号进行相乘运算得到基础信 号,将基础信号与增益因子进行相乘运算得到生成的高频信号。
[0046] 在步骤S8中,将步骤S6得到的高频信号与解码后的低频信号通过合成滤波器合 成解码信号或将步骤S7得到的高频信号与解码后的低频信号通过合成滤波器合成解码信 号。
[0047] 优选的,在步骤S2对输入信号进行残差能量计算并预设一个阈值,若残差能量大 于预设的阈值,分类为音频信号,模式位输出1 ;反之,若残差能量小于预设的阈值,分类为 语音信号,模式位输出〇。
[0048] 根据统计特性,步骤S2预设的阀值为0. 18。
[0049] 如图6所示,一种切换模式的音频带宽扩展编解码装置,包括编码单元和解码单 元,编码单元包括分析滤波模块1、编码模式选择模块2、变换域带宽扩展编码模块3、线性 预测带宽扩展编码模块4 ;解码单元由解码模式选择模块5、变换域带宽扩展解码模块6、线 性预测带宽扩展解码模块7、高频信号合成滤波模块8 ;
[0050] 分析滤波模块1,用于将输入的带宽信号分频成高频信号与低频信号;
[0051] 编码模式选择模块2,用于将输入的带宽信号进行语音信号、音频信号的分类并根 据分类进行编码模式的选择;
[0052] 变换域带宽扩展编码模块3,用于将高频信号和低频信号依次快速傅立叶变换、子 带划分、增益计算、增益编码,最后输出码流;
[0053] 线性预测带宽扩展编码模块4,用于对分频得到的高频信号进行LPC分析、LPC编 码、合成滤波冲击响应;对分频得到的低频信号进行残差提取、快速傅立叶变换;所述冲击 响应信号与进行残差提取、快速傅立叶变换后的低频信号进行相乘运算,该运算结果与经 过快速傅立叶变换后的高频信号进行增益计算,最后对增益编码并输出到码流;
[0054] 解码模式选择模块5,用于根据编码模式选择模块确定的编码模式进行解码模式 模式的选择;
[0055] 变换域带宽扩展解码模块6,用于接收由变换域带宽扩展编码模块3输入的码流, 并将通过低频解码后的低频信号与解码后的高频增益参数进行相乘得到合成后的高频信 号;
[0056] 线性预测带宽扩展解码模块7,用于接收由线性预测带宽扩展编码模块4输入的 码流,并对解码后的低频信号进行快速傅立叶变换,对高频LPC系数解码,同时生成高频冲 击响应,对增益解码及平滑处理得到增益因子,将解码后快速傅立叶变换的低频信号与高 频冲击响应信号进行相乘运算得到基础信号,将基础信号与增益因子进行相乘运算得到生 成的高频信号;
[0057] 合成滤波模块8,用于将变换域带宽扩展解码模块得到的高频信号与解码后的低 频信号合成解码信号或者用于将线性预测带宽扩展解码模块得到的高频信号与解码后的 低频信号合成解码信号。
[0058] 优选的,编码模式选择模块2依据带宽输入信号计算预测残差能量并预设一个阈 值,若残差能量大于预设的阈值,分类为音频信号,模式位输出1,选择变换域带宽扩展编码 3 ;反之,若残差能量小于预设的阈值,分类为语音信号,模式位输出0,选择线性预测带宽 扩展编码4。
[0059] 优选的,根据统计特性,编码模式选择模块预设的阀值为0. 18。
[0060] 优选的,解码模式选择模块5在编码模式选择模块2输出位为1时则选择变换域 带宽扩展解码模式6,输出位为0时则进行线性预测带宽扩展解码模式7。
[0061] 下面以具体的实施例对本发明的工作原理进行进一步阐述:
[0062] 编码部分:
[0063] 在步骤S1中:输入的带宽信号S (η)由分析滤波得到高频信号HB和低频信号LB ;
[0064] 在步骤S2中:利用Lwinsnn-Dm'hi'n i弟椎算法计算信号S(n)的LPC系数a;., / = 计算预测残差
【权利要求】
1. 一种切换模式的音频带宽扩展编解码的方法,其特征在于,包括具体以下的步骤: 51、 输入的带宽信号由分析滤波得到高频信号和低频信号; 52、 将输入的带宽信号进行语音信号、音频信号的分类并根据分类进行编码模式的选 择,若为音频信号,模式位输出1,执行步骤S3 ;若为语音信号,模式位输出0,执行步骤S4 ; 53、 若步骤S2的模式位为1,进行变换域带宽扩展编码,将高频信号和低频信号依次快 速傅立叶变换、子带划分、增益计算、增益编码,最后输出码流; 54、 若步骤S2的模式位为0,进行线性预测带宽扩展编码,对分频得到的高频信号进行 LPC分析、LPC编码、合成滤波冲击响应;对分频得到的低频信号进行残差提取、快速傅立叶 变换;所述冲击响应信号与进行残差提取、快速傅立叶变换后的低频信号进行相乘运算,该 运算结果与经过快速傅立叶变换后的高频信号进行增益计算,最后对增益编码并输出到码 流; 55、 根据步骤S2的语音信号、音频信号的分类进行解码模式的选择,步骤S2的模式位 为1时执行步骤S6,步骤S2模式位为0时则执行步骤S7 ; 56、 将步骤S3所输出的码流解码,通过低频解码后的低频信号与解码后的高频增益参 数进行相乘得到合成后的高频信号; 57、 将步骤S4所输出的码流解码,对解码后的低频信号进行快速傅立叶变换,对高频 LPC系数解码,同时生成高频冲击响应,对增益解码及平滑处理得到增益因子,将解码后快 速傅立叶变换的低频信号与高频冲击响应信号进行相乘运算得到基础信号,将基础信号与 增益因子进行相乘运算得到生成的高频信号; 58、 将步骤S6得到的高频信号与解码后的低频信号通过合成滤波器合成解码信号或 将步骤S7得到的高频信号与解码后的低频信号通过合成滤波器合成解码信号。
2. 根据权利要求1所述切换模式的音频带宽扩展编解码的方法,其特征在于,所述步 骤S2对输入信号进行残差能量计算并预设一个阈值,若残差能量大于预设的阈值,分类为 音频信号,模式位输出1 ;反之,若残差能量小于预设的阈值,分类为语音信号,模式位输出 0〇
3. 根据权利要求2所述切换模式的音频带宽扩展编解码的方法,其特征在于,所述步 骤S2预设的阀值为0. 18。
4. 一种切换模式的音频带宽扩展编解码装置,包括编码单元和解码单元,其特征在于, 所述编码单元包括分析滤波模块、编码模式选择模块、变换域带宽扩展编码模块、线性预测 带宽扩展编码模块;所述解码单元由解码模式选择模块、变换域带宽扩展解码模块、线性预 测带宽扩展解码模块、高频信号合成滤波模块; 所述分析滤波模块,用于将输入的带宽信号分频成高频信号与低频信号; 所述编码模式选择模块,用于将输入的带宽信号进行语音信号、音频信号的分类并根 据分类进行编码模式的选择; 所述变换域带宽扩展编码模块,用于将高频信号和低频信号依次快速傅立叶变换、子 带划分、增益计算、增益编码,最后输出码流; 所述线性预测带宽扩展编码模块,用于对分频得到的高频信号进行LPC分析、LPC编 码、合成滤波冲击响应;对分频得到的低频信号进行残差提取、快速傅立叶变换;所述冲击 响应信号与进行残差提取、快速傅立叶变换后的低频信号进行相乘运算,该运算结果与经 过快速傅立叶变换后的高频信号进行增益计算,最后对增益编码并输出到码流; 所述解码模式选择模块,用于根据编码模式选择模块确定的编码模式进行解码模式模 式的选择; 所述变换域带宽扩展解码模块,用于接收由变换域带宽扩展编码模块输入的码流, 并将通过低频解码后的低频信号与解码后的高频增益参数进行相乘得到合成后的高频信 号; 所述线性预测带宽扩展解码模块,用于接收由线性预测带宽扩展编码模块输入的码 流,并对解码后的低频信号进行快速傅立叶变换,对高频LPC系数解码,同时生成高频冲击 响应,对增益解码及平滑处理得到增益因子,将解码后快速傅立叶变换的低频信号与高频 冲击响应信号进行相乘运算得到基础信号,将基础信号与增益因子进行相乘运算得到生成 的高频信号; 所述合成滤波模块,用于将变换域带宽扩展解码模块得到的高频信号与解码后的低频 信号合成解码信号或者用于将线性预测带宽扩展解码模块得到的高频信号与解码后的低 频信号合成解码信号。
5. 根据权利要求4所述切换模式的音频带宽扩展编解码装置,其特征在于,所述编码 模式选择模块依据带宽输入信号计算预测残差能量并预设一个阈值,若残差能量大于预设 的阈值,分类为音频信号,模式位输出1,选择变换域带宽扩展编码;反之,若残差能量小于 预设的阈值,分类为语音信号,模式位输出〇,选择线性预测带宽扩展编码。
6. 根据权利要求2所述切换模式的音频带宽扩展编解码装置,其特征在于,所述编码 模式选择模块预设的阀值为〇. 18。
7. 根据权利要求2所述切换模式的音频带宽扩展编解码装置,其特征在于,所述解码 模式选择模块在编码模式选择模块输出位为1时则选择变换域带宽扩展解码模式,输出位 为0时则进行线性预测带宽扩展解码模式。
【文档编号】G10L19/00GK104269173SQ201410524839
【公开日】2015年1月7日 申请日期:2014年9月30日 优先权日:2014年9月30日
【发明者】胡瑞敏, 张茂胜, 姚雪春, 王晓晨, 姜林, 涂卫平, 王松, 杨乘 申请人:武汉大学深圳研究院
切换模式的音频带宽扩展装置与方法
相关推荐
专利名称:带照明功能的叠层电池的制作方法技术领域::本实用新型涉及叠层电池,尤其是一种带照明功能的叠层电池。技术背景:目前,叠层电池功能单一,仅作为一种低压直流电源,不具备照明功能。发明内容:为了给叠层电池增加照明功能,本实用新型提供了带照
专利名称:说话人声音的后台学习的制作方法技术领域:本发明涉及说话人的自动识别,通过接收测试话语;确定大量说话人模型中对于测试话语来说最可能的一个;将与最可能的语音模型关联的说话人确定为测试话语的说话人。说话人识别正变得越来越重要。传统的说话
专利名称:低辐射中空镶嵌玻璃的制作方法技术领域:本发明涉及一种低辐射中空镶嵌玻璃,特别是一种建筑物、车船之类的交通工具上所用的低辐射中空镶嵌玻璃,属于建筑物及交通工具上的门窗构件。例如中国专利公告号为CN2507668Y介绍了一种中空镶嵌玻
一种台灯的制作方法【专利摘要】本发明提出了一种灯内罩,包括灯座、灯罩和光源,灯罩内设置有灯内罩,灯内罩包括灯内罩本体,灯内罩本体内表面设置有反光面,反光面为反光板,反光布或直接由反光材料涂覆而成,灯内罩本体内表面的横截面为台阶式的横截面,台
专利名称:语音识别评价装置和语音识别评价方法技术领域:本发明涉及对识别声音用的语音识别装置的性能实施评价的语音识别评价装置、语音识别评价方法和语音识别评价程序。背景技术: 在语音识别装置的开发过程中,对语音识别装置是否能够发挥所期待的性能进
专利名称:一种自适应调频半主动噪声控制装置的制作方法技术领域:本发明涉及的是一种封闭空间(舱室)噪声控制技术,特别是一种基于点积 控制算法的自适应调频半主动噪声控制装置。(二) 背景技术:室内或舱室噪声作为一个重要的环境污染,越来越受到人们