专利名称:一种适用于文件播出系统的音频响度一致性控制方法
技术领域:
本发明涉及一种适用于文件播出系统的音频响度一致性控制方法,该方法将对播 出文件中的响度控制信息与素材文件分离开,既保证了响度控制的质量,又解决了重新生 成文件所带来的低效问题,而且素材的内容没有进行过二次处理,保证了素材的原始效果。
背景技术:
目前播出系统中,由于音频校准电平不统一、动态处理不当等各种原因,存在不同 电视台之间、不同频道之间,甚至是同一频道不同的节目之间、节目与广告之间声音响度不 同的问题,导致观众在收看电视节目过程中,在切换频道或者节目、广告切换过程中需要不 断调整电视机输出音量的不便。要想做到不同的节目之间都能让观众得到一个满意的相对 声音响度,需要解决测量与调整两方面的问题。有的电视台对提交的节目提出了一些音频 的参数指标,希望能够得到响度一致的节目,但是由于这些指标并不能真正反映音频的真 实响度,因此控制效果并不理想;有一些设备厂商有自己的响度解决方案,这样能够比较好 地对不同节目进行响度控制,但是受限于的特殊的音频格式,以及在传输过程中需要携带 特殊的元数据信息,因此并不能适应所有情况。再加上电视台节目的来源比较广泛,有自产 的,也有外购、收录的,情况比较复杂,要求送到播出部门的待播节目的响度一致是非常困 难的。如何能够达到响度一致是目前各家电视台都非常关心的问题,现有的解决方法主 要包括响度的整体调整和实时调整;前者按照不同音频的平均响度进行整体调整,调整后 不同音频的平均响度均与目标响度保持一致;后者对音频作部分调整,对音频中响度小的 部分进行提升,响度大的部分进行衰减。但这两种方式都有各自优缺点整体调整可保持节 目的动态范围,但该调整把平均响度作为描述音频的唯一信息,对不同类型的节目作统一 处理可能导致调整后不同节目听起来声音并不相同;实时调整可以使节目内(节目间)响 度趋于一致,但会破坏音频的动态范围,音频声音效果将大打折扣。
发明内容
本发明的目的是提出一种适用于文件播出系统的音频响度一致性控制方法,该方 法对不同类型音频引入动态指标,将响度控制信息与源素材文件分离开,既保证了响度控 制的质量,又解决了重新生成文件所带来的低效问题,而且源素材的内容没有进行过二次 处理,保证了素材的原始效果。为了实现上述目的,本发明的技术方案是,一种适用于文件播出系统的音频响度 一致性控制方法,在素材文件中分离出在播出前对待播出节目文件中的音频数据进行扫描 分析,获取待播出节目文件的响度特征,根据响度控制目标确定响度调整值,将带有响度调 整值的响度控制信息连同待播出节目文件一同送入播出服务器,在播出服务器中作最终的 响度调整并播出,对响度文件调整值的分析提取使用了 ITU-BS. 1770标准中的响度计算, 控制方法步骤包括a.提取待播出文件中的音频数据,对音频数据从头至尾以50至1000毫秒的窗口宽度进行划分,提取所有窗口的平均响度值和该音频文件的最大峰值电平;
b.将大于平均响度值、并出现次数最多的响度值作为响度特征值;
c.导入响度调整目标值并确定响度调整值;
d.将响度调整值与原始音频的每个采样点的电平值相加,得到的结果为最终的调整音频。所述窗口宽度最佳是200毫秒。所述窗口相互交叠,交叠的宽度是1/10窗口宽度至1/2窗口宽度。所述交叠的宽度最佳是1/4窗口宽度。所述确定响度调整值的步骤是首先由响度调整目标值减去响度特征值后得到一 个响度调整初始值L’a(U ;再通过计算方法Latu = min(L'adJ, - Vpeak)确定响度调整值,其中 Vpeak是该待播文件最大响度峰值电平。本发明对现有技术的贡献是响度一致性的控制效果好;不会改变节目动态范 围,对原有的艺术效果没有破坏;对播出设备的改造要求小;对播出设备的调节能力要求 低。下面结合实施例和附图对本发明做一详细描述。
图1为播出系统流程框图; 图2为本发明控制方法流程图; 图3为多声道响度算法方框图4为头部声学效应的前置滤波器响应图; 图5为二阶滤波器的信号流程图; 图6为RLB加权曲线图; 图7为实时响度曲线和计算示意图。
具体实施例方式一种适用于文件播出系统的音频响度一致性控制方法实施例,参见图1至图7 ;如 图1所示,该方法是在一个播出系统中实现,其播出系统包括响度控制服务器1,近线存储 2和播出服务器3,响度控制服务器从近线存储中的素材文件中分离出音频数据进行扫描 分析,获取待播文件的响度特征,根据响度控制目标确定响度调整值,将带有响度调整值的 响度文件送回到近线服务器,连同源素材文件一同送入播出服务器,在播出服务器中作最 终的响度调整并播出,对响度调整值的分析提取中利用ITU-BS. 1770标准中的响度计算方 法,对待播出文件中的音频信息以响度特征值为核心进行调整,如图2所示,所述控制方法 步骤包括
a.提取待播出节目文件中的音频数据,对音频数据进行响度扫描分析,即对音频文件 从头至尾以50至1000毫秒的窗口宽度进行划分,提取所有窗口的平均响度值和该音频文 件的最大峰值电平;其中,所述窗口宽度最佳是200毫秒;
b.确定响度特征值,即将大于平均响度值、并出现次数最多的响度值作为响度特征值;
C.导入 响度调整目标值并确定响度调整值;
d.确定最终调整音频;即将响度调整值与原始音频的每个采样点的电平值相加,得到 的结果为最终的调整音频。为了提高分析的准确性,所述窗口相互交叠,交叠的宽度是1/10窗口宽度至1/2 窗口宽度;交叠的宽度最佳是1/4窗口宽度。其中,所述确定响度调整值的步骤是首先由响度调整目标值减去响度特征值后 得到一个响度调整初始值L’ adJ ;在通过计算方法Latu = min(L' adJ, - Vpeak)确定响度调整 值,其中Vpeak是待播出节目文件最大响度峰值电平。下面对上述方案进行具体的描述
本实施例使用的音频节目响度计算方法,采用的是ITU-R BS. 1770-1建议书中所阐释 的方法。该方法规定了多声道响度测量算法,图3所示的是该算法各个组成部件的方框图; 方框图显示了五个主要通道的输入,左边Xy中间Xc、右边Xk、左边环绕Xls和右边环绕XRS, 分别经过前置滤波器、RLB滤波器,从RLB滤波器输出\、Yc, YE, Yls, Yks、到均方,从均方输 出\、Zc, ZE, Zls, Zes到G^ Gc, Ge, Gls, Ges汇总到Σ输出,这样允许监听包含一至五个通道的 节目。对于少于五个通道的节目,一些输入将不会使用。该测量法中不包括低频效应(LFE) 通道。算法的第一步是在Leq(RLB)测量之前,对信号进行前置滤波,图4示了前置滤波 用于说明头部的声学效应,这里把头部模拟为一个固定的球体。前置滤波器定义为如图5所示的滤波器,滤波器系数见表1。K + L5351248595869 | .. 3 . --1^19065^29318241 Ih-2.矽1矽61卯4<1638 |
. 0^73248077421585 + h,U 98 92S 10852S5 |表1模拟球形头部的前置滤波器的滤波器系数
算法的第二步是应用RLB加权曲线,该曲线由如图6所示的一个简单的高通滤波器组成。RLB加权曲线定义为如图5所示的一个2阶滤波器,其系数见表2。
_............................................_....................................................................................................................................................................................................4—;....................................................................................1.0.................................................................................
! ‘;· I ....1.顿 M.M7454S339S . h, |.....2,(1.
i u. 0 9')CK) 225036621Ih !LO;
i............................................................................................................................................................................................................................χ..........................................i.....................................................................................................................................................................................i
表2 RLB加权曲线的滤波器系数
随着前置滤波器和RLB滤波的应用,于是测量间隔T内的均方能量计量如下
1 rT
Z1 =§ ζ ν,; Λ
其中,71是经过模拟头部效应的前置滤波器和RLB加权曲线滤波以后的输入信号。(i=L,R,C,Ls, Rs, N,这里N为通道的数量)。一旦计算出每一个通道的加权均方电平Zi,最后一步就是求N个通道的和,如下所 示响度计算公式
权利要求
1.一种适用于文件播出系统的音频响度一致性控制方法在播出前对待播出节目文 件中的音频数据进行扫描分析,获取待播出节目文件的响度特征,根据响度控制目标确定 响度调整值,对响度调整值的分析提取使用了 ITU-BS. 1770标准中的响度计算,其特征在 于,将带有响度调整值的响度控制信息连同待播出节目文件一同送入播出服务器,在播出 服务器中作最终的响度调整并播出,所述控制方法步骤包括a.提取待播出文件中的音频数据,对音频数据从头至尾以50至1000毫秒的窗口宽度 进行划分,提取所有窗口的平均响度值和该音频文件的最大峰值电平和整体平均响度;b.将大于整体平均响度值、并出现次数最多的响度值作为响度特征值;c.导入响度调整目标值并确定响度调整值;d.将响度调整值与原始音频的每个采样点的电平值相加,得到的结果为最终的调整音频。
2.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法,其特 征在于,所述窗口宽度是200毫秒。
3.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法,其特 征在于,所述窗口相互交叠,交叠的宽度是1/10窗口宽度至1/2窗口宽度。
4.根据权利要求3所述的一种适用于文件播出系统的音频响度一致性控制方法,其特 征在于,所述交叠的宽度是1/4窗口宽度。
5.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法,其特 征在于,所述确定响度调整值的步骤是首先由响度调整目标值减去响度特征值后得到一 个响度调整初始值L’ adJ ;再通过计算方法Latu = min(L’ adJ, -Vpeak)确定响度调整值,其中 Vpeak是该待播文件最大响度峰值电平。
全文摘要
本发明涉及一种适用于文件播出系统的音频响度一致性控制方法,该方法将在播出前对待播出节目文件中的音频进行扫描分析,获取待播文件的响度特征,根据响度控制目标确定响度调整值。具体包括对待播音频文件从头至尾以一定的窗口宽度进行划分,提取所有窗口的平均响度值和该音频文件的最大峰值电平以及总体平均响度;将大于总体平均响度值并出现次数最多的响度值作为响度特征值;导入响度调整目标值、并确定响度调整值;将响度调整值与原始音频的每个采样点的电平值相加,得到的结果为最终的调整音频。本发明对现有技术的贡献是响度一致性的控制效果好;不会改变节目动态范围,对原有的艺术效果没有破坏;既保证了响度控制的质量,又解决了重新生成文件所带来的低效问题。
文档编号G10L19/00GK102044249SQ20101058222
公开日2011年5月4日 申请日期2010年12月10日 优先权日2010年12月10日
发明者姚威, 李岩, 骆新 申请人:北京中科大洋科技发展股份有限公司
一种适用于文件播出系统的音频响度一致性控制方法
相关推荐
专利名称:内插滤波器和备有该滤波器的接收机的制作方法技术领域:本发明涉及用于以逐行移动的取样方式取样的图象信号的内插滤波器和具有这种滤波器的接收机。欧洲专利申请EP-A0,146,713号公开了这种形式的内插滤波器。在该申请所述的缪司(MU
专利名称:红外感应led日光灯的制作方法技术领域:红外感应LED日光灯技术领域[0001]本实用新型涉及一种红外感应LED日光灯。背景技术:[0002]目前常规照明设备多采用开关控制灯的开启与熄灭,夜晚需要人为的将灯打开或 熄灭,尤其像在停
专利名称:发光材料的涂覆方法技术领域:本发明涉及用保护层涂覆发光材料的方法。本发明还涉及用保护层涂层的发光材料,并涉及装有发光屏的放电灯,该发光屏含此发光材料。由EP 0476207 A2已知第一段所提到的方法。此文献描述了使用化学气相沉2
专利名称:一种紧凑的光模块的制作方法技术领域:本发明涉及光纤通信领域,尤其涉及一种紧凑的光模块。 背景技术:现有技术中的光模块一般由底座、上盖、激光头卡、印刷电路板、十字盘头螺钉、十字沉头螺钉、拉钩、推块、压簧、齿形弹片等零件组成。光模块底
专利名称:用于帧擦除恢复的系统、方法和设备的制作方法技术领域:本发明涉及语音信号的处理。背景技术:通过数字技术来传输音频(例如话音和音乐)已变得较为普遍,尤其是在长距离电 话、例如IP话音(还称为VoIP,其中IP表示因特网协议)等包交换式