一种适用于文件播出系统的音频响度一致性控制方法-品牌商务网

专利名称：一种适用于文件播出系统的音频响度一致性控制方法
技术领域：
本发明涉及一种适用于文件播出系统的音频响度一致性控制方法，该方法将对播出文件中的响度控制信息与素材文件分离开，既保证了响度控制的质量，又解决了重新生成文件所带来的低效问题，而且素材的内容没有进行过二次处理，保证了素材的原始效果。
背景技术：
目前播出系统中，由于音频校准电平不统一、动态处理不当等各种原因，存在不同电视台之间、不同频道之间，甚至是同一频道不同的节目之间、节目与广告之间声音响度不同的问题，导致观众在收看电视节目过程中，在切换频道或者节目、广告切换过程中需要不断调整电视机输出音量的不便。要想做到不同的节目之间都能让观众得到一个满意的相对声音响度，需要解决测量与调整两方面的问题。有的电视台对提交的节目提出了一些音频的参数指标，希望能够得到响度一致的节目，但是由于这些指标并不能真正反映音频的真实响度，因此控制效果并不理想；有一些设备厂商有自己的响度解决方案，这样能够比较好地对不同节目进行响度控制，但是受限于的特殊的音频格式，以及在传输过程中需要携带特殊的元数据信息，因此并不能适应所有情况。再加上电视台节目的来源比较广泛，有自产的，也有外购、收录的，情况比较复杂，要求送到播出部门的待播节目的响度一致是非常困难的。如何能够达到响度一致是目前各家电视台都非常关心的问题，现有的解决方法主要包括响度的整体调整和实时调整；前者按照不同音频的平均响度进行整体调整，调整后不同音频的平均响度均与目标响度保持一致；后者对音频作部分调整，对音频中响度小的部分进行提升，响度大的部分进行衰减。但这两种方式都有各自优缺点整体调整可保持节目的动态范围，但该调整把平均响度作为描述音频的唯一信息，对不同类型的节目作统一处理可能导致调整后不同节目听起来声音并不相同；实时调整可以使节目内(节目间)响度趋于一致，但会破坏音频的动态范围，音频声音效果将大打折扣。

发明内容
本发明的目的是提出一种适用于文件播出系统的音频响度一致性控制方法，该方法对不同类型音频引入动态指标，将响度控制信息与源素材文件分离开，既保证了响度控制的质量，又解决了重新生成文件所带来的低效问题，而且源素材的内容没有进行过二次处理，保证了素材的原始效果。为了实现上述目的，本发明的技术方案是，一种适用于文件播出系统的音频响度一致性控制方法，在素材文件中分离出在播出前对待播出节目文件中的音频数据进行扫描分析，获取待播出节目文件的响度特征，根据响度控制目标确定响度调整值，将带有响度调整值的响度控制信息连同待播出节目文件一同送入播出服务器，在播出服务器中作最终的响度调整并播出，对响度文件调整值的分析提取使用了 ITU-BS. 1770标准中的响度计算，控制方法步骤包括a.提取待播出文件中的音频数据，对音频数据从头至尾以50至1000毫秒的窗口宽度进行划分，提取所有窗口的平均响度值和该音频文件的最大峰值电平；
b.将大于平均响度值、并出现次数最多的响度值作为响度特征值；
c.导入响度调整目标值并确定响度调整值；
d.将响度调整值与原始音频的每个采样点的电平值相加，得到的结果为最终的调整音频。所述窗口宽度最佳是200毫秒。所述窗口相互交叠，交叠的宽度是1/10窗口宽度至1/2窗口宽度。所述交叠的宽度最佳是1/4窗口宽度。所述确定响度调整值的步骤是首先由响度调整目标值减去响度特征值后得到一个响度调整初始值L’a(U ；再通过计算方法Latu = min(L'adJ, - Vpeak)确定响度调整值，其中 Vpeak是该待播文件最大响度峰值电平。本发明对现有技术的贡献是响度一致性的控制效果好；不会改变节目动态范围，对原有的艺术效果没有破坏；对播出设备的改造要求小；对播出设备的调节能力要求低。下面结合实施例和附图对本发明做一详细描述。

图1为播出系统流程框图；图2为本发明控制方法流程图；图3为多声道响度算法方框图4为头部声学效应的前置滤波器响应图；图5为二阶滤波器的信号流程图；图6为RLB加权曲线图；图7为实时响度曲线和计算示意图。
具体实施例方式一种适用于文件播出系统的音频响度一致性控制方法实施例，参见图1至图7 ；如图1所示，该方法是在一个播出系统中实现，其播出系统包括响度控制服务器1，近线存储 2和播出服务器3，响度控制服务器从近线存储中的素材文件中分离出音频数据进行扫描分析，获取待播文件的响度特征，根据响度控制目标确定响度调整值，将带有响度调整值的响度文件送回到近线服务器，连同源素材文件一同送入播出服务器，在播出服务器中作最终的响度调整并播出，对响度调整值的分析提取中利用ITU-BS. 1770标准中的响度计算方法，对待播出文件中的音频信息以响度特征值为核心进行调整，如图2所示，所述控制方法步骤包括
a.提取待播出节目文件中的音频数据，对音频数据进行响度扫描分析，即对音频文件从头至尾以50至1000毫秒的窗口宽度进行划分，提取所有窗口的平均响度值和该音频文件的最大峰值电平；其中，所述窗口宽度最佳是200毫秒；
b.确定响度特征值，即将大于平均响度值、并出现次数最多的响度值作为响度特征值；
C.导入响度调整目标值并确定响度调整值；
d.确定最终调整音频；即将响度调整值与原始音频的每个采样点的电平值相加，得到的结果为最终的调整音频。为了提高分析的准确性，所述窗口相互交叠，交叠的宽度是1/10窗口宽度至1/2 窗口宽度；交叠的宽度最佳是1/4窗口宽度。其中，所述确定响度调整值的步骤是首先由响度调整目标值减去响度特征值后得到一个响度调整初始值L’ adJ ；在通过计算方法Latu = min(L' adJ, - Vpeak)确定响度调整值，其中Vpeak是待播出节目文件最大响度峰值电平。下面对上述方案进行具体的描述
本实施例使用的音频节目响度计算方法，采用的是ITU-R BS. 1770-1建议书中所阐释的方法。该方法规定了多声道响度测量算法，图3所示的是该算法各个组成部件的方框图；方框图显示了五个主要通道的输入，左边Xy中间Xc、右边Xk、左边环绕Xls和右边环绕XRS，分别经过前置滤波器、RLB滤波器，从RLB滤波器输出\、Yc, YE, Yls, Yks、到均方，从均方输出\、Zc, ZE, Zls, Zes到G^ Gc, Ge, Gls, Ges汇总到Σ输出，这样允许监听包含一至五个通道的节目。对于少于五个通道的节目，一些输入将不会使用。该测量法中不包括低频效应(LFE) 通道。算法的第一步是在Leq(RLB)测量之前，对信号进行前置滤波，图4示了前置滤波用于说明头部的声学效应，这里把头部模拟为一个固定的球体。前置滤波器定义为如图5所示的滤波器，滤波器系数见表1。K + L5351248595869 | .. 3 . --1^19065^29318241 Ih-2.矽1矽61卯4<1638 |
. 0^73248077421585 + h,U 98 92S 10852S5 |表1模拟球形头部的前置滤波器的滤波器系数
算法的第二步是应用RLB加权曲线，该曲线由如图6所示的一个简单的高通滤波器组成。RLB加权曲线定义为如图5所示的一个2阶滤波器，其系数见表2。
_............................................_....................................................................................................................................................................................................4—；....................................................................................1.0.................................................................................
！ ‘；· I ....1.顿 M.M7454S339S . h, |.....2,(1.
i u. 0 9')CK) 225036621Ih ！LO；
i............................................................................................................................................................................................................................χ..........................................i.....................................................................................................................................................................................i
表2 RLB加权曲线的滤波器系数
随着前置滤波器和RLB滤波的应用，于是测量间隔T内的均方能量计量如下
1 rT
Z1 =§ ζ ν,； Λ
其中，71是经过模拟头部效应的前置滤波器和RLB加权曲线滤波以后的输入信号。(i=L，R，C，Ls, Rs, N，这里N为通道的数量)。一旦计算出每一个通道的加权均方电平Zi,最后一步就是求N个通道的和，如下所示响度计算公式
权利要求
1.一种适用于文件播出系统的音频响度一致性控制方法在播出前对待播出节目文件中的音频数据进行扫描分析，获取待播出节目文件的响度特征，根据响度控制目标确定响度调整值，对响度调整值的分析提取使用了 ITU-BS. 1770标准中的响度计算，其特征在于，将带有响度调整值的响度控制信息连同待播出节目文件一同送入播出服务器，在播出服务器中作最终的响度调整并播出，所述控制方法步骤包括a.提取待播出文件中的音频数据，对音频数据从头至尾以50至1000毫秒的窗口宽度进行划分，提取所有窗口的平均响度值和该音频文件的最大峰值电平和整体平均响度；b.将大于整体平均响度值、并出现次数最多的响度值作为响度特征值；c.导入响度调整目标值并确定响度调整值；d.将响度调整值与原始音频的每个采样点的电平值相加，得到的结果为最终的调整音频。
2.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法，其特征在于，所述窗口宽度是200毫秒。
3.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法，其特征在于，所述窗口相互交叠，交叠的宽度是1/10窗口宽度至1/2窗口宽度。
4.根据权利要求3所述的一种适用于文件播出系统的音频响度一致性控制方法，其特征在于，所述交叠的宽度是1/4窗口宽度。
5.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法，其特征在于，所述确定响度调整值的步骤是首先由响度调整目标值减去响度特征值后得到一个响度调整初始值L’ adJ ；再通过计算方法Latu = min(L’ adJ, -Vpeak)确定响度调整值，其中 Vpeak是该待播文件最大响度峰值电平。
全文摘要
本发明涉及一种适用于文件播出系统的音频响度一致性控制方法，该方法将在播出前对待播出节目文件中的音频进行扫描分析，获取待播文件的响度特征，根据响度控制目标确定响度调整值。具体包括对待播音频文件从头至尾以一定的窗口宽度进行划分，提取所有窗口的平均响度值和该音频文件的最大峰值电平以及总体平均响度；将大于总体平均响度值并出现次数最多的响度值作为响度特征值；导入响度调整目标值、并确定响度调整值；将响度调整值与原始音频的每个采样点的电平值相加，得到的结果为最终的调整音频。本发明对现有技术的贡献是响度一致性的控制效果好；不会改变节目动态范围，对原有的艺术效果没有破坏；既保证了响度控制的质量，又解决了重新生成文件所带来的低效问题。
文档编号G10L19/00GK102044249SQ20101058222
公开日2011年5月4日申请日期2010年12月10日优先权日2010年12月10日
发明者姚威, 李岩, 骆新申请人:北京中科大洋科技发展股份有限公司

本文推荐一种适用于文件播出系统的音频响度一致性控制方法仅代表作者观点，不代表本网站立场。本站对作者上传的所有内容将尽可能审核来源及出处，但对内容不作任何保证或承诺。请读者仅作参考并自行核实其真实性及合法性。如您发现图文视频内容来源标注有误或侵犯了您的权益请告知，本站将及时予以修改或删除。未经允许不得转载：http://www.pinpai35.com/1656382606.html

当前位置：网站首页>专利 >正文

一种适用于文件播出系统的音频响度一致性控制方法

相关推荐