当前位置:网站首页>专利 >正文

基于掩蔽的增益控制的制作方法

专利名称:基于掩蔽的增益控制的制作方法
技术领域
本说明书涉及利用人类听觉系统的掩蔽行为来减小对不期望的信号干扰的感知的信号处理,以及一种用于产生声学隔离区域以减小噪声和信号干扰的系统。
背景技术
自从可听信号已经从录音被广播和再生,已经提供了各式各样的内容以供听众选择。例如,在交通工具中行进的乘客可能各自具有不同的喜爱的广播电台或录音(例如,光盘等)。然而,一次只能选择单个台站用于从交通工具的无线电进行广播。类似地,不同的乘客可能想要利用交通工具的音频设备(例如,光盘播放器)收听不同类型和流派的录音材料(例如,来自光盘或存储器设备的音乐)。然而,一次只有单个选择(例如,光盘音轨) 可以被回放。此外,对所回放的选择的感知可能会由于来自交通工具内部和外部两者的噪声源的干扰而恶化。例如,随同发动机噪声和乘客语音,随着交通工具行进通过嘈杂环境 (例如,城市中心区),相对响亮的噪声可能淹没所选择的广播电台或录音回放并使乘客产生不愉快的收听体验。

发明内容
在一个方面中,一种用于掩蔽干扰音频信号的方法包括识别提供给第一声学区域的信号的第一频带以调整与信号的第二频带相关联的掩蔽阈值。该方法还包括向信号的第一频带应用增益以将第二频带中的掩蔽阈值提高到干扰信号以上。实现可以包括以下特征中的一个或多个。识别信号的第一频带可以包括从一组频带中选择具有最大电平的频带。第一和第二频带可以在巴克(Bark)域中。调整信号的第一频带可以包括将掩蔽阈值与干扰信号的电平相比较。应用于第一信号的增益可以是转换速率受限的。为了向第一频带应用增益,该方法可以包括平滑该增益以保持峰增益值。为保持峰值,该方法可以包括扩展峰值。干扰信号可以包括各种类型的信号,诸如提供给第二声学区域的信号、噪声信号的估计值或者其他类型的信号。在另一方面中,一种用于掩蔽干扰音频信号的方法包括在第一位置上再生具有电平的第一信号。第一信号还与第一频率范围相关联。该方法还包括根据与第一位置上的第一信号相关联的频率确定掩蔽阈值。进一步,该方法包括识别第一位置上存在的第二信号的电平。将第二信号与不同于第一频率范围的第二频率范围相关联。该方法还包括将第一位置上存在的第二信号的电平与掩蔽阈值相比较。该方法还包括调整第一信号电平以将掩蔽阈值提高到第二频率范围内的第二信号的电平以上。实现可以包括以下特征中的一个或多个。第一和第二频率范围可以在巴克域或其他类似的域中表示。对第一信号的调整可以是转换速率受限的。调整第一信号电平可以包括应用增益。应用这种增益可以包括平滑该增益以保持峰增益值。保持峰值可以包括扩展峰值。第二信号可以包括各种类型的信号,诸如提供给第二位置的信号、噪声信号的估计值或者其他类似的信号。该方法还可以包括根据频率调整第二信号电平以在第二频率范围的至少一部分之上将第二信号电平降低到掩蔽阈值以下,以便减小第一位置上的第二信号的可听性。在又一方面中,一种方法包括根据频率在第一位置上再生具有电平的第一信号。 第一信号还具有第一频率范围。该方法还包括根据与第一位置上的第一信号相关联的频率确定掩蔽阈值。此外,该方法包括根据第一位置上存在的第二信号的频率识别电平。第二信号具有第二频率范围。该方法还包括将第一位置上存在的第二信号的电平与掩蔽阈值相比较。进一步,该方法包括根据频率调整第二信号电平以在第二频率范围的至少一部分之上将第二信号电平降低到掩蔽阈值以下,以便减小第一位置上的第二信号的可听性。实现可以包括以下特征中的一个或多个。第一和第二频率范围可以在巴克域或其他类似的域中表示。为调整第二信号的电平,该方法可以包括减小增益。第二信号可以包括各种类型的信号,诸如提供给第二位置的信号。在另一方面中,一种方法包括接收多个数据点,其中每个数据点与值相关联。该方法还包括限定具有窗口长度的平均窗,以及从数据点值识别至少一个峰值。该方法还包括向邻近于与识别出的峰值相关联的数据点的数据点分配识别出的峰值以产生经调整的多个数据点。邻近的数据点和与识别出的峰值相关联的数据点的组合长度等同于窗口长度。 该方法还包括通过使用平均窗来对经调整的多个数据点求平均以产生该多个数据点的经平滑的版本。实现可以包括以下特征中的一个或多个。与识别出的峰值相关联的数据点可以位于分配了峰值的邻近的数据点的中心处。求平均可以包括使平均窗沿着经调整的多个数据点步进。这些和其他方面和特征以及它们的各种组合可以表达为方法、设备、系统、用于执行功能的装置、程序产品以及以其他方式表达。


图1是汽车的俯视图。图2图示了客舱内的声学隔离区域。图3-图5是图示了对声学信号的掩蔽的图表。图6是音频处理设备的框图。图7包括干扰估计器的框图。图8是掩蔽阈值的图表。图9是声学信号输入电平相对于输出电平的图表。图10是增益相对于频率的图表。图11是掩蔽估计器的操作的流程图。图12是干扰估计器的操作的流程图。图13是增益设置器的操作的流程图。
具体实施例方式参考图1,汽车100包括音频再生系统102,音频再生系统102能够减小来自声学隔离区域的干扰。这种区域使得汽车100的乘客可以个别地选择不同的用于回放的音频内容而不干扰其他区域中的回放或者被其他区域中的回放干扰。然而,声学信号的外溢可能发生并干扰回放。通过减少外溢,系统102改善了音频再生,同时减小了干扰。尽管系统 102被图示为实现在汽车100中,但类似的系统可以实现在其他类型的交通工具(例如,飞机、公共汽车等)和/或环境(例如,住宅、营业场所、餐馆、运动场地等)中,其中多个人可能希望个别地选择和收听类似的或不同的音频内容。随同解决来自其他隔离区域的音频内容外溢,音频再生系统102可以解决来自其他类型的音频源的外溢。例如,汽车客舱外部的噪声,诸如发动机噪声、风噪声等,可以由再生系统102来解决。如图中所表示,系统102包括音频处理设备104,音频处理设备104处理用于再生的音频信号。特别地,音频处理设备104监控和减少外溢以辅助保持汽车100内的声学隔离区域。在某些布置中,音频处理设备104的功能性可以并入到音频设备,诸如放大器等(例如,无线电、CD播放器、DVD播放器、数字音频播放器、免提式电话系统、导航系统、交通工具资讯娱乐系统等)。系统102中还可以包括附加的音频设备,例如分布到整个客舱的扬声器 106 (a)-(f)可以用于再生音频信号和用于产生声学隔离区域。例如,扬声器(a)-(f)连同其他扬声器和设备(根据需要)可以用于如下系统,该系统诸如在序列号为11/780,463的美国专利申请“System and Method for Directionally Radiating Sound”中所描述的系统,通过引用的方式包含其全部内容。其他换能器,诸如一个或多个麦克风(例如,内置式 (in-dash)麦克风108),可以由系统102用来收集音频信号,例如用于由该系统处理。附加的扬声器还可以包括在系统102中并且位于整个交通工具中。麦克风可以位于顶蓬、支柱、 座椅靠背或头枕或者其他便于感测交通工具内或接近交通工具的声音的位置。此外,内置式控制面板110提供了如下用户接口,该用户接口用于启动系统操作、交换信息(诸如使得用户可以控制设置)以及提供用于监控系统的操作的可视显示。在这一实现中,内置式控制面板110包括控制旋钮112以使得可以实现用于控制音量调整等的用户输入。为减少外溢和控制辐射到这些区域中的声能,各种信号可以被收集和用于音频再生系统102的处理操作。例如,来自一个或多个音频源的信号和所选择的音频内容的信号可以用于形成和维持隔离区域。可能对乘客听到音频的能力造成干扰的环境信息(例如, 汽车内部中存在的环境噪声)可以被感测(例如,由内置式麦克风108)和使用以减少区域外溢。作为对内置式麦克风108(或并入到汽车中的多个麦克风)的替代,音频系统102可以使用放置在汽车100的内部中的一个或多个其他的麦克风。例如,蜂窝电话114的麦克风(或其他类型的手持设备)可以用于收集环境噪声。通过经由内置式控制面板110无线地或硬连线地连接蜂窝电话114,可以通过电缆(未示出)、蓝牙连接或者其他类似的连接技术为音频处理设备104提供环境噪声信号。还可以从其他技术和方法估计环境噪声,诸如基于发动机操作(例如,发动机RPM)、交通工具速度或者其他相似的参数来推断噪声电平。还可以使用窗户、天窗等的状态(例如,开启或关闭)来提供对环境噪声的估计。位置和时刻可以用于噪声电平估计,例如,全球定位系统可以用于定位汽车100的位置(例如, 在城市中)以及与时钟(例如,噪声在白天期间更大)一起用于估计。参考图2,汽车100的客舱的一部分图示了希望在声学上彼此隔离的区域。在这一特定示例中,四个区域200、202、204、206由再生系统102监控,并且每个区域以汽车的一个唯一的座椅为中心(例如,区域200以司机的座椅为中心,区域202以前排乘客座椅为中心等)。对于其中每个区域被创建为声学上隔离的情形,位于一个区域中的乘客将能够选择和收听音频内容而不会扰乱在一个或多个其他区域中回放的音频内容或者被在一个或多个其他区域中回放的音频内容扰乱。在一个示例中,再生系统102操作为减少区域间外溢 (正如在序列号为11/780,463的美国专利申请中所描述的那样)以改善声学隔离。再生系统102还可以操作为减少所感知的区域之间的干扰。进一步,可以监控区域200-206以减少所感知的来自其他类型的可听信号的干扰。例如,可以基本上减少所感知的来自汽车 100的内部(例如,发动机噪声)和外部(例如,街道噪声)的信号的干扰以及选择用于回放的音频内容的相关联的干扰。通常,通过利用区域内(即期望的)信号来掩蔽区域之外的信号(即不期望信号) 来减小所感知的干扰。通常,完全去除区域到区域的外溢可能不能实现,并且某些可听扰动可能是可辨别的。然而,当正在向多个区域提供不同的音频内容(例如,向区域200提供一个广播电台并且向区域202提供另一个广播电台)并且实现了利用听觉掩蔽的信号处理时,溢出会更不显著。尽管在这一特定布置中图示了四个区域,但再生系统102可以针对附加的或更少的区域监控和减少外溢(真实物理声音泄漏和所感知的干扰两者)。随同区域的数目,区域大小也可以是可调整的。例如,可以将前排座椅区域200、202组合以形成单一区域,并且可以将后排座椅区域204、206组合以形成单一区域,从而在汽车100中产生具有增加的大小的两个区域。参考图3,图表300以图形方式图示了在人类听觉系统中当对接收信号进行响应时的听觉掩蔽。这种掩蔽可以由再生系统102利用以减少两个或更多区域之中的所感知的外溢。一般地,在特定区域(例如,区域200)中所选择的用于回放的音频信号(例如,来自广播电台、CD音轨等)刺激听觉系统。当存在所选择的信号时,依赖于呈递给听觉系统的其他信号与第一信号的关系,该其他信号可以或可以不被感知。换言之,第一信号可以掩蔽其他信号。一般而言,响亮的声音可以掩蔽在频率上与响亮的声音相对比较接近的其他较安静声音。可以与第一信号相关联地确定掩蔽阈值,其描述了第一信号与所存在的其他信号之间的感知关系。呈递给听觉系统的在掩蔽阈值之下的第二信号不会被感知,而超过掩蔽阈值的第二信号可以被感知。在图表300中,横轴302 (例如,X轴)代表对数标度上的频率,并且纵轴304 (例如,Y轴)代表也在对数标度上的信号电平(例如,分贝标度)。为图示听觉系统中存在的掩蔽,在一定频率处(在横轴302上)表示出音调信号306,其在纵轴304上具有对应的信号电平。当向听觉系统呈递了音调信号306时,可以在一定频率范围之上在听觉系统中产生掩蔽阈值308。例如,响应于音调信号306 (在频率&处),掩蔽阈值308扩展到音调信号 306的频率以上(例如,到频率&)和以下(例如,到频率&)。如图所示,掩蔽阈值308并不关于音调信号频率fo对称,并且随着增加频率比降低频率扩展更多(即f2-fc) > fo-fi), 正如听觉系统所指令的那样。当向听众呈递了第二声学信号(例如,声学信号从另一区域溢出),其包括在掩蔽阈值曲线频率范围内(即频率&与&之间)的频率时,第二声学信号的电平与掩蔽阈值 308之间的关系确定了第二信号对于听众而言是否是可听的。具有掩蔽阈值曲线308以下的电平的信号对于听众而言可能不是可听的,而具有超过掩蔽阈值曲线308的电平的信号可能是可听的。例如,音调信号310由音调信号306掩蔽,这是因为音调信号310的电平在掩蔽阈值308以下。作为替代,音调信号312不被掩蔽,这是因为音调信号312的电平在掩蔽阈值308以上。因此,音调信号312是可听的,而音调信号310不在音调信号306之上被听到。参考图4,图表400图示了(在特定时间瞬间处)所选择的信号的频率响应402以及与信号相关联的听觉系统的对应掩蔽阈值404。例如,可以将数值模型发展为代表典型的听觉系统。根据模型,可以针对音频信号(例如,区域内的所选择的音频信号)确定听觉系统响应(例如,掩蔽阈值404)。尽管掩蔽阈值404遵循频率响应402的一般形状,但阈值并不等同于由于听觉系统的行为(其在听觉系统模型中表示)而引起的频率响应。类似于图3中所图示的方案,呈递给听觉系统的、具有超过掩蔽阈值404的电平的第二(即干扰) 信号可能是可听的,而呈递给听觉系统的、具有阈值以下的电平的信号可能不是可辨别的 (并且被视为被掩蔽的)。例如,由于音调信号响应406的电平在掩蔽阈值404以下(在音调信号406的频率处),因此音调信号406被掩蔽(不可由听觉系统辨别)。作为替代, 音调信号408的电平超过掩蔽阈值404的电平(在音调信号的频率&处)并且对于听众而言是可听的。相应地,可以随时间将调整应用到区域内的所选择的音频信号以减少干扰信号超过与所选择的信号相关联的掩蔽阈值的实例的数目。在某些布置中,如果干扰信号已知并且可由音频系统控制,则可以随时间将调整应用于干扰信号以减少干扰信号超过与所选择的信号相关联的掩蔽阈值的实例的数目。在某些布置中,可以在一定时间段之上调整区域内的所选择的信号和干扰信号两者以减少干扰信号超过与所选择的信号相关联的掩蔽阈值的实例的数目。可以实现一种或多种技术来调整信号以减少干扰信号的可听性。可以增加(例如,应用增益)期望信号(例如,由频率响应402代表的区域内的所选择的信号)的电平以相应地提高其在适当频率(例如,频率f2)处(在此处干扰信号具有能量)的电平。在不考虑掩蔽的情况下,可以将信号402的增益增加量(β ),以将其电平提高到干扰信号408在频率4处的电平以上。在某些情况下,可以将信号402的增益提高等于(β)加上偏移量 (例如,ldB、2dB或更高的偏移量)的量,以确保信号402完全地掩蔽干扰信号。作为替代, 可以增加所选择的信号的电平(例如,应用增益)以相应地提高其在频率f2处(在此处干扰信号408具有能量)的相关联的掩蔽阈值。只需要将掩蔽阈值增加量(α)以将其提高到干扰信号408的电平以上。可以增加所选择的信号在频率&处的增益以将其相关联的掩蔽阈值提高到干扰信号408的电平以上。在某些情况下,这可以通过将信号402的增益调整小于(β)但大于(α)的量来进行。如果信号402具有存在于频率&处的比在邻近的频率中相对更少的能量,则可能需要在频率&处向信号402应用大于(α)的增益以将掩蔽阈值提高到干扰信号408的电平以上,并且频率f2处的掩蔽阈值主要是存在于这些附近的频率处的能量的结果。作为替代,可以在不同于f2的频率处调整所选择的信号的增益以将其掩蔽阈值移位量(α),该量(α)是将其提高到干扰信号在频率&处的电平以上所需要的。在这一情况下,与将所选择的信号的电平增加到干扰信号在&处的电平以上相比,在不同于f2的频率处需要更少的增益来将所选择的信号的掩蔽阈值提高到干扰信号在f2处的电平以上。相应地,通过针对信号掩蔽调整掩蔽阈值404,所选择的信号的频谱含量的变化可能更少。这在图5中示出并且在下面更详细地描述。参考图5,图表500图示了提高掩蔽阈值404从而使得音调信号响应406、408两者在相应的频率&和4处的阈值之下。在这一图示中,调整信号频率响应402的一部分以将掩蔽阈值404定位在干扰信号的响应以上。通过应用增益,例如掩蔽阈值404的电平大于音调信号响应408 (在频率f2处)的电平。可以识别期望信号的频谱的一部分,其可以控制掩蔽阈值的电平(在发生干扰的频率处)。例如,可以识别和调整信号频率响应402的一个或多个部分以便将掩蔽阈值404 定位在适当的电平处(在频率&处)。在这一情况下,将信号频率响应402的峰值502识别为控制掩蔽阈值404(在频率f2处)。通过向频率响应402的峰值502应用相对较小的增益调整(在频率&处),将掩蔽阈值404的适当的部分504提高到音调信号408以上的电平(在频率f2处)。因此,通过选择性地识别和调整频率响应402的一个或多个适当的部分,可以调整掩蔽阈值404以便掩蔽干扰信号。参考图6,框图600代表音频处理设备104的如下部分,其监控一个或多个声学隔离区域(例如,区域200-206)并减小来自其他位置(例如,邻近区域、外部噪声源等)的不期望信号(例如,外溢信号)的效应。例如,听觉系统响应于被呈递所选择的用于在感兴趣区域(例如,区域200)中回放的信号而展现出能够掩蔽不期望信号的掩蔽阈值。这样,将在感兴趣区域(例如,区域200)中产生的音频信号(在图中称为区域内信号)被提供给音频处理设备104的音频输入级602。所选择的用于在其他区域(例如,区域202、204、206)中回放的音频信号(称为干扰信号)也被提供给音频输入级602。在某些布置中,可以由音频输入级602收集其他类型的信号,例如可以收集交通工具内部或外部的噪声信号。进一步, 尽管下面描述的框图600的处理涉及单一区域中的操作,但是应当理解冗余可以向多个区域提供类似的功能性。在这一实现中,区域内信号和干扰信号两者在时域中被提供给音频输入级602,并且被分别提供给域变换器604、606,以便被分段为重叠的块并被变换到频域中(或者其他域,诸如时-频域或任何其他可能有用的域)。例如,一种或多种变换(例如,快速傅里叶变换、小波等)和分段技术(例如,开窗等)以及其他处理方法(例如,补零、重叠等)可以由域变换器604、606使用。将已变换的干扰信号提供给干扰估计器608,干扰估计器608 估计由每个相应的干扰信号提供的干扰(例如,音频溢出)的量。例如,关注区域200(在图2中示出),估计存在于其他区域202、204和206的每个中的、溢出到区域200中的信号的量。为产生这种估计,可以实现一种或多种信号处理技术,诸如确定每对区域之间的传递函数(例如,S参数S12、S21等)。例如,可以确定区域200与区域202之间、区域200与区域204之间以及区域200与区域206之间的传递函数。一旦传递函数已知,就可以利用传递函数在时域中卷积(或在频域中相乘)所选择的用于在每个干扰区域(区域202、204和 206)中呈递的信号以估计溢出到区域200中的干扰信号。一旦确定,就可以使用叠加(或其他类似的技术)来组合来自多个区域的结果。还可以计算附加的量值,诸如统计和高阶传递函数,以表征潜在的区域外溢。参考图7,一种或多种技术和方法可以由干扰估计器608(在图6中示出)使用以量化来自其他区域或噪声源的干扰。例如,在一种实现中,干扰估计器700可以包括区域间传递函数处理器702,区域间传递函数处理器702提供对区域之间的可听外溢的量的估计。 干扰估计器700中还可以包括转换速率限制器704,例如如下所述,以减少隔离区域之间的信号的交叉调制。在另一实现中,干扰估计器706可以估计一个或多个位置(例如,客舱外部的区域等)处存在的噪声电平以便调整一个或多个掩蔽阈值以减少噪声效应。干扰估计器706中还可以包括转换速率限制器720以减少干扰噪声对期望信号的调制。例如,噪声估计器708(包括在干扰估计器706内)可以使用一个或多个自适应滤波器(例如,最小均方(LMS)滤波器等)以便估计噪声电平,正如在美国专利5,434,922和5,615,270中所描述的那样,在此通过引用的方式包含其内容。可以(经由音频输入级60 将由一个或多个麦克风(例如,内置式108)收集的噪声电平提供给干扰估计器706以便估计噪声电平以调整掩蔽阈值。在某些实现中,可以使用干扰估计器700、706两者的功能性从而使得可以基于多种类型的噪声信号(例如,存在于区域中、区域外部等)以及提供给一个或多个区域用于回放的可听信号来确定掩蔽阈值。转换速率限制器704、720将转换速率应用到干扰估计器700、706的输出以减少可听且令人不快的调制。这样,在被允许衰落之前,在预定的时间段内保持干扰信号的峰值。 例如,转换速率限制器704、720可以在允许信号电平以预定速率(例如,每秒3dB到6dB) 衰落之前的0. 1到1. 0秒保持峰值干扰信号电平。参考图表710,迹线712代表针对单一频带(或巴克频带,如下所述)的作为时间的函数的干扰信号,其被提供给转换速率限制器 704,并且迹线714代表转换速率受限的干扰信号。正如迹线714所表示,在以预定速率衰落之前的近似恒定的时间段内保持每个峰值。对于其中随着时间推进而出现另一峰值的实例,信号电平不受阻碍地增加。通过包括转换速率限制器704、720,显著地阻止了干扰信号的间歇结构表现为区域内信号内的可听伪声(例如,调制)。进一步,可以以迅速的方式调整增益而不会过度驱动区域内信号,同时又减少区域之间的信号的交叉调制。在一种实现中,在干扰估计器将干扰信号划分到多个频率(或巴克)带中的情况下,根据如上所述的方法并行地处理多个频带。返回图6,框图600包括掩蔽阈值估计器610以估计与区域内信号相关联的一个或多个掩蔽阈值。在这一实现中,区域内频域信号由变换器606接收并被缩放以反射听觉系统响应(例如,基于人类听觉感知模型来变换频域信号的频率仓)。例如,可以将信号转换为巴克标度,巴克标度基于人类听觉系统定义了带宽。在一种实现中,可以通过使用以下等式从以Hz为单位的频率计算巴克值
r r \(f r \2 fBark =13-arctan
ηζ
+ 3.5-arctan
Jjh_
7500
\l/
11
/Iv等式(1)是巴克标度的一种特定定义,然而,可以使用其他等式和数学函数来定义另一标度。进一步,可以使用其他方法和技术来将信号从一个域(例如,频域)变换到另一个域(例如,巴克域)。随同掩蔽阈值估计器610,在提供给增益设置器612之前,将从干扰估计器608提供的信号变换到巴克标度。在一种实现中,掩蔽阈值估计器610和干扰估计器608两者将0到24,OOOHz的频率范围转换为范围近似为0到25巴克的巴克标度。进一步,通过将每个巴克频带划分为预定数目的区段(例如,三个区段),按比例地增加了巴克频带的数目(例如,增加到75个巴克子频带)。随同将频域信号变换到巴克标度上,掩蔽阈值估计器610基于针对每个巴克频带的区域内信号电平而确定掩蔽阈值。掩蔽阈值估计器610针对每个巴克频带识别最有可能承担阈值的区域内信号的巴克频带。这可以理解如下。当信号具有存在于第一频率(例如巴克)带中的能量时,其具有在该巴克频带中的相关联的掩蔽阈值。掩蔽阈值还扩展到附近的巴克频带。阈值的电平以某一斜率(按照听觉系统的特征来确定)在存在能量的第一巴克频带的任一侧上下滑。这在图3的曲线308 中针对单一音调示出,但对于巴克频带而言是类似的。斜率按照人类听觉系统的特征来确定,并且已经在实验上确定为在每倍频程_24dB到_60dB的量级上。一般而言,在频率中的斜率下降比在频率中的斜率上升陡峭得多。在一种实现中,使用了 48dB/倍频程(在频率中上升)和_60dB/倍频程(在频率中下降)的斜率。在其他实现中,还可以并入有其他斜率值。依赖于附近频带中的信号中存在的能量的电平和斜率,第一巴克频带中的掩蔽阈值可以通过第一巴克频带中的能量来控制,或者其可以通过其他附近巴克频带中的能量来控制。当掩蔽阈值估计器610确定用于区域内信号402的掩蔽阈值时,其保持对哪个巴克频带主要承担信号的每个巴克频带中的掩蔽阈值的跟踪。对于信号402,掩蔽阈值估计器610 叠加针对所有单个巴克频带的掩蔽阈值曲线,并且选取每个频带中的最大值曲线作为该频带中的掩蔽阈值。也就是说,其将类似于图3的曲线308的针对每个巴克频带的曲线重叠 (按照每个巴克频带中的能量的量来缩放)并且选出每个频带中的最高的一个。然后,掩蔽阈值估计器610保持对哪个巴克频带承担了每个巴克频带中的阈值的跟踪。掩蔽阈值估计器610还可以从所确定的阈值减去偏移量。偏移量是任意的,但可以是ldB、2dB,一般地是小于6dB的任何量,或者某些其他的量。目的是确保阈值被设置为低于它在其他情况下的值,从而使得当向所选择的信号应用了增益以将其掩蔽阈值提高到干扰信号的电平以上时,应用比在其他情况下将应用的稍多的增益,而不需要偏移量。这减少了干扰信号在所选择的信号以上保持可听的几率。如上所述,为控制调整,掩蔽阈值估计器610识别特定的巴克频带,该巴克频带可以等同(或不同)于正在被调整的频带。当然,可以使用其他技术和方法来识别一个或多个频带以便控制阈值调整。参考图8,图表800代表转换为巴克域信号804的频域信号802的一部分(来自域变换器606)。所显示的巴克范围部分具有10与18之间的值,并且每个频带被分段为三个子频带(以产生30到M的巴克范围,正如在横轴上所表示的那样)。对于信号802的每个巴克域值,掩蔽阈值估计器610计算由信号迹线806代表的掩蔽阈值。此外,掩蔽阈值估计器610识别主要控制针对每个所计算的掩蔽阈值的调整的特定巴克频带。参考图表,在每个频带之上放置整数以识别主要承担掩蔽阈值的巴克频带,该巴克频带是应当调整为最强烈地影响掩蔽阈值的巴克频带。例如,通过调整巴克频带32(正如在频带32-34之上标记的数字“32”的三个实例所指示)来控制对巴克频带32、33和34中的掩蔽阈值的调整。可以实现一种或多种技术来选择特定的巴克频带以便控制对其他巴克频带或同一巴克频带的调整。例如,可以将特定频带分组并且具有最大掩蔽阈值的群组成员可以用于调整群组成员。参考图,群组可以由巴克频带32-34形成,并且具有最大阈值的群组成员可以由掩蔽阈值估计器610识别。在这一情况下,巴克频带32与最大掩蔽阈值相关联并且被选择为控制群组成员调整。可以针对这种确定来调整各种参数,例如,群组可以包括更多或更少的成员。可以实现与确定最大值分立的或与确定最大值结合的其他方法,以便识别特定的巴克频带。例如,在识别特定的巴克频带时,可以实现多值搜索、值估计、滞后以及其他类型的数学运算。返回图6,在接收到来自掩蔽阈值估计器610的掩蔽阈值和来自干扰估计器608的对干扰信号的估计后,增益设置器612确定适当的增益以应用于区域内信号从而使得所选择的区域内信号的掩蔽阈值超出干扰信号(例如,来自其他区域的外溢信号、噪声等)。一般而言,增益设置器612将掩蔽阈值(来自区域内信号)与干扰信号相比较(在巴克频带基础上)以确定是否保证信号调整。如果需要,则识别一个或多个增益以便应用于与控制一个或多个巴克频带相关联的信号部分(例如,如果干扰信号在巴克频带33中具有将高于与未修改的区域内信号相关联的掩蔽阈值的电平,则向与巴克频带32相关联的信号部分应用增益以便调整巴克频带33中的掩蔽阈值)。参考图9,图表900图示了将增益应用于区域内信号(在特定的巴克频带处)以调整一个或多个巴克频带处的掩蔽阈值。图表900包括代表区域内信号的电平的横轴和代表输出信号电平(在应用了增益后)的纵轴。一般地,输入区域内信号和输出信号具有最小的和最大的电平。最大输出电平可以是用户选择的(例如,由最大音量设置提供),而最小输出电平可以根据所估计的干扰信号的电平加上用以掩蔽干扰信号的偏移值来确定。这样,向区域内信号范围902应用了一个或多个适当的增益,区域内信号范围902由最小区域内信号电平和等同于干扰信号电平加上偏移量的区域内信号电平限定。这样,按照调整的需要向信号电平应用适当的增益以超过干扰电平。返回图6,随同确定调整掩蔽阈值所需的增益和识别用于控制调整的适当的巴克频带,增益设置器612还在频域中确定适当的增益值。这样,在巴克域中识别的增益被转换到频域中。例如,可以使用等式(1)来定义函数,以将增益从巴克域转换到频域中。随同提供到频域中的转换,可以由增益设置器612提供其他操作以便准备用于应用于区域内信号的增益。例如(如下所述),在应用之前,可以对增益值进行平滑。参考图10,图表1000图示了一组增益,该组增益由增益设置器612确定以产生针对特定的时间瞬间的掩蔽阈值。在已从巴克域转换到频域的情况下,实线1002代表跨一定范围的频率(100Hz到20,000Hz)的增益,正如在横轴上所表示的那样。在这一图示中,在巴克域中导出的增益被转换到对应的频率仓中。参考等式(1),在更低的频率处,巴克域中的一个频带可以等同于频域中的一个仓。然而,在更高的频率处,一个巴克频带可以包含数百个频率仓。这样,增益(正如以使用对数频率轴的迹线1002所表示的那样)表现为利用频率进行压缩并且在频域中是相对间断和块状的。在已转换到时域的情况下,这种增益函数通常产生具有扩展的时间周期并且对混叠敏感的冲激响应。为减小冲激响应的长度并及时集中信号能量,使用一种或多种技术和方法来向增益(以迹线1002表示)应用平滑函数。然而,为正确地掩蔽干扰信号,需要保持峰值增益电平。这样,实现了保持增益峰值的平滑技术。在一种示例性技术中,选择平滑函数,该平滑函数对预定长度的窗口内的增益值求平均。保存平均增益值,并且在频率中上滑窗口以重复处理并计算移动平均同时又沿着频率轴步进。为保持增益峰值,每个峰值被检测并被加宽等同于窗口宽度的量。这样,当在窗口内对加宽的峰值求平均时,峰值被保持。例如, 对于定义为1/6倍频程的平均窗,每个增益峰值在该峰值的每一侧上被加宽1/12倍频程。 还可以实现其他窗口大小。虚线迹线1004代表经平滑的增益并且图示了峰值保持。尽管对于非峰值而言经平滑的增益值(例如,以箭头1006突出显示)可能相对更高,但保证每个峰值跨频率范围而被保持,并且保证产生适当的掩蔽阈值。通过应用这种平滑函数,可以减少混叠,并且 (时域中的这种增益的)对应的冲激响应一般更加紧凑。返回图6,在适当的增益值由增益设置器612确定并被变换到线性频域中(并且经平滑)后,向区域内信号应用增益值。在这一特定的实现中,放大器级614被提供来自增益设置器612的增益值并且在频域中将该增益应用于区域内信号。域变换器616接收增益级 614的输出并将其变换回时域中。此外,在这一实现中,域变换器616解决分段(由域变换器606执行)以产生基本上连续的信号。音频输出级618被提供来自域变换器616的时域信号并且准备用于回放的信号。例如,可以由音频输出级618调节信号(例如,应用增益) 以便将音频内容传送给一个或多个扬声器(例如,扬声器106 (a)-(f))。参考图11,流程图1100代表掩蔽阈值估计器610的某些操作。如上所述,掩蔽阈值估计器610可以由该音频处理设备104执行,例如,指令可以由与音频处理设备相关联的处理器(例如,微处理器)执行。这种指令可以存储在存储设备(例如,硬盘驱动器、CD-ROM 等)中并提供给处理器(或多个处理器)用于执行。随同交通工具内安装的设备,音频处理设备可安装在其他位置(例如,住宅、办公室等)。进一步,计算设备,诸如计算机系统,可以用于执行掩蔽阈值估计器610的操作。电路(例如,数字逻辑)还可以被个别地或与一个或多个处理设备结合使用以提供掩蔽阈值估计器610的操作。掩蔽阈值估计器610的操作包括接收(1102)频域信号和计算(1104)信号的巴克域表示。根据信号的巴克域表示,掩蔽阈值估计器610计算(1106)掩蔽阈值,例如,可以针对每个巴克频带计算可调掩蔽阈值。可以从所计算的一个或多个频带中的阈值减去偏移量。掩蔽阈值估计器记住承担了每个巴克频带中的掩蔽阈值的巴克频带。为调整巴克频带中的掩蔽阈值,掩蔽阈值估计器610确定(1108)用于控制调整的一个或多个适当的巴克频带(最多地承担掩蔽的一个或多个频带)。在某些示例中,可以形成巴克频带群组,并且将具有(群组内的)最大信号电平的特定频带分配用于调整群组的每个巴克频带成员。参考图12,流程图1200包括干扰估计器608的某些操作。正如参考图7所述,干扰估计器中可以包括转换速率限制器704、720以减少出现在区域内信号内的干扰信号的调制伪声。类似于该掩蔽阈值估计器610,可以从提供给一个或多个处理器(例如,微处理器)的指令、定制电路、其他类似的处理技术、或者方法的组合来执行干扰估计器608的操作。为提供转换速率限制,干扰阈值估计器608的操作可以包括接收(120 干扰信号 (例如,从两个区域之间的传递函数获得的频率或巴克域信号,或者从麦克风测量获得的频率或巴克域信号)并确定(1204)是否检测到了峰值。峰值检测在本领域中是公知的,并且在此将不会进一步详细描述用于执行峰值检测的方法。在一种布置中,通过监控和比较单个信号电平来提供峰值检测。如果检测到了峰值,则操作包括在预定时段(例如,0.1秒、 1.0秒等)内保持(1206)峰值。如果尚未检测到峰值或者在保持所检测的峰值后,操作包括确定(1208)当前是否正在保持峰值。如果峰值保持时段不是激活的(例如,尚未检测到峰值),则干扰估计器608允许信号衰落(1210)。如果当前正在保持峰值,则操作返回到确定是否检测到另一峰值。参考图13,流程图1300包括增益设置器612的某些操作。正如参考图7所述,随同选择增益值和将值从巴克域转换到频域,增益设置器612向所导出的增益应用平滑函数以保持峰值。类似于掩蔽阈值估计器610和干扰估计器608,可以从提供给一个或多个处理器(例如,微处理器)的指令、定制电路、或者使用其他类似的处理技术或处理技术的组合来执行增益设置器612的操作。
为识别适当的增益,该增益设置器612的操作包括将区域内信号(或者多个区域内信号)与一个或多个干扰信号相比较(130 。该比较可以在各种信号的巴克频带表示上进行。基于该确定,增益设置器612确定(1304)调整掩蔽阈值所需的一个或多个增益以及用于应用增益的适当的巴克频带。增益设置器的操作还包括依赖于巴克域是如何定义的 (例如,等式(1))来将识别出的增益从巴克域转换(1306)到频域。一旦放置在线性频率标度上,操作就包括向增益应用(1308)平滑函数。例如,可以应用峰值保持平滑函数从而使得保持峰增益值以保证产生适当的掩蔽信号。根据一种实现,为执行流程图1100、1200和1300中所描述的操作,掩蔽阈值估计器610、干扰估计器608和增益设置器612可以个别地或组合地执行先前所描述的任何计算机实现的方法。例如,音频处理设备104可以包括用于执行与掩蔽阈值估计器610、干扰估计器608和增益设置器612相关联的指令的计算设备(例如,计算机系统)。该计算设备可以包括处理器、存储器、存储设备以及一个或多个输入/输出设备。每个组件可以使用系统总线或其他类似的结构来互连。该处理器可以能够处理用于在计算设备内执行的指令。在一种实现中,该处理器是单线程处理器。在另一实现中,该处理器是多线程处理器。该处理器能够处理存储在存储器中或存储设备上的指令以显示用于输入/输出设备上的用户接口的图形信息。存储器存储计算设备内的信息。在一种实现中,存储器是计算机可读介质。在一种实现中,存储器是易失性存储器单元。在另一实现中,存储器是非易失性存储器单元。存储设备能够提供用于该计算设备的大容量存储。在一种实现中,存储设备是计算机可读介质。在各种不同的实现中,存储设备可以是软盘设备、硬盘设备、光盘设备或者磁带设备。输入/输出设备提供用于计算设备的输入/输出操作。在一种实现中,输入/输出设备包括键盘和/或指示设备。在另一实现中,输入/输出设备包括用于显示图形用户界面的显示单元。所描述的特征(例如,掩蔽阈值估计器610、干扰估计器608和增益设置器612, 在流程图1100、1200和1300中所描述的操作)可以实现在数字电子电路(例如,处理器) 中,或者计算机硬件、固件、软件中,或者其组合中。该装置可以实现在具体体现在信息载体中(例如,机器可读存储设备中)的、用于由可编程处理器执行的计算机程序产品中;并且方法步骤可以由可编程处理器执行,该可编程处理器执行指令程序以通过对输入数据进行操作和生成输出来执行所描述的实现的功能。所描述的特征可以有利地在可编程系统上可执行的一个或多个计算机程序中实现,该可编程系统包括耦合为从数据存储系统、至少一个输入设备和至少一个输出设备接收数据和指令以及向数据存储系统、至少一个输入设备和至少一个输出设备传送数据和指令的至少一个可编程处理器。计算机程序是如下一组指令,其可以直接地或间接地在计算机中使用以执行特定的活动或引起特定的结果。计算机程序可以以任何形式的编程语言(包括汇编语言或解释语言)来编写,并且它可以以任何形式部署,包括作为独立程序或作为模块、组件、子例程或者适合用于计算环境中的其他单元部署。举例而言,用于执行指令程序合适的处理器包括通用和专用微处理器二者以及任何种类的计算机的唯一处理器或多个处理器之一。一般地,处理器将接收来自只读存储器或随机存取存储器或两者的指令和数据。计算机的必要元件是用于执行指令的处理器以及用于存储指令和数据的一个或多个存储器。一般地,计算机还将包括用于存储数据文件的一个或多个大容量存储设备或者可操作地耦合为与一个或多个大容量存储设备通信;这种设备包括磁盘,诸如内部硬盘和可移除盘;磁光盘;以及光盘。适合于具体体现计算机程序指令和数据的存储设备包括所有形式的非易失性存储器,举例而言,包括半导体存储器设备,诸如EPROM、EEI3ROM和闪速存储器设备;磁盘,诸如内部硬盘和可移除盘;磁光盘;以及 ⑶-ROM和DVD-ROM盘。处理器和存储器可以以ASIC (专用集成电路)作为补充或者并入在 ASIC 中。为提供与用户的交互,这些特征可以实现在如下计算机上,该计算机具有用于向用户显示信息的显示设备(诸如CRT (阴极射线管)或LCD (液晶显示)监视器)以及键盘和指示设备(诸如用户可用以向计算机提供输入的鼠标或跟踪球)。这些特征可以实现在如下计算机系统中,该计算机系统包括后端组件,诸如数据服务器,或者包括中间件组件,诸如应用服务器或因特网服务器,或者包括前端组件,诸如具有图形用户界面或因特网浏览器的客户端计算机,或者其任何组合。系统的组件可以以任何形式或介质的数字数据通信(诸如通信网络)来连接。通信网络的示例包括例如LAN、 WAN以及形成因特网的计算机和网络。计算机系统可以包括客户端和服务器。客户端和服务器一般彼此相距遥远并且通常通过网络(诸如所描述的一种网络)来交互。客户端和服务器的关系凭借运行在相应的计算机上并且彼此具有客户端-服务器关系的计算机程序来提升。其他实施例在所附权利要求书的范围内。在此所描述的技术可以以不同的顺序执行并且仍然实现所希望的结果。
权利要求
1.一种用于掩蔽干扰音频信号的方法,包括识别提供给第一声学区域的期望信号的第一频带以调整与所述期望信号的第二频带相关联的掩蔽阈值;以及向所述期望信号的第一频带应用增益以将所述第二频带中的所述掩蔽阈值提高到包含所述第二频带中的能量的干扰信号的电平以上。
2.根据权利要求1的方法,其中识别所述期望信号的所述第一频带包括从一组频带中选择具有最大电平的频带。
3.根据权利要求1的方法,其中所述第一和第二频带在巴克域中。
4.根据权利要求1的方法,其中调整所述信号的第一部分包括将所述掩蔽阈值与所述干扰信号的所述电平相比较。
5.根据权利要求4的方法,其中所应用的增益是转换速率受限的。
6.根据权利要求1的方法,其中应用所述增益包括平滑所述增益以保持峰增益值。
7.根据权利要求6的方法,其中保持所述峰值包括扩展所述峰值。
8.根据权利要求1的方法,其中所述干扰信号包括提供给第二声学区域的信号。
9.根据权利要求1的方法,其中所述干扰信号包括噪声信号的估计值。
10.一种用于掩蔽干扰音频信号的方法,包括在第一位置上再生具有电平的第一信号,所述第一信号还具有第一频率范围, 根据与所述第一位置上的所述第一信号相关联的频率确定掩蔽阈值, 识别所述第一位置上存在的第二信号的电平,所述第二信号具有不同于所述第一频率范围的第二频率范围,将所述第一位置上存在的所述第二信号的所述电平与所述掩蔽阈值相比较,以及调整所述第一信号电平以将所述掩蔽阈值提高到所述第二频率范围内的所述第二信号的所述电平以上。
11.根据权利要求10的方法,其中所述第一和第二频率范围在巴克域中表示。
12.根据权利要求10的方法,其中所调整的所述第一信号的电平是转换速率受限的。
13.根据权利要求10的方法,其中调整所述第一信号电平包括应用增益。
14.根据权利要求13的方法,其中应用所述增益包括平滑所述增益以保持峰增益值。
15.根据权利要求14的方法,其中保持所述峰值包括扩展所述峰值。
16.根据权利要求10的方法,其中所述第二信号包括提供给第二位置的信号。
17.根据权利要求10的方法,其中所述第二信号代表噪声信号的估计值。
18.根据权利要求10的方法,进一步包括根据频率调整所述第二信号电平以在所述第二频率范围的至少一部分之上将所述第二信号电平降低到所述掩蔽阈值以下,以便减小所述第一位置上的所述第二信号的可听性。
19.一种用于减小干扰信号的可听性的方法,包括根据频率在第一位置上再生具有电平的第一信号,所述第一信号还具有第一频率范围,根据与所述第一位置上的所述第一信号相关联的频率确定掩蔽阈值, 根据所述第一位置上存在的第二信号的频率识别电平,所述第二信号具有第二频率范围,将所述第一位置上存在的所述第二信号的所述电平与所述掩蔽阈值相比较,以及根据频率调整所述第二信号电平以将所述第二信号电平降低到在所述第二频率范围的至少一部分之上的所述掩蔽阈值以下,以便减小所述第一位置上的所述第二信号的可听性。
20.根据权利要求19的方法,其中所述第一和第二频率范围在巴克域中表示。
21.根据权利要求19的方法,其中调整所述第二信号电平包括减小增益。
22.根据权利要求19的方法,其中所述第二信号包括提供给第二位置的信号。
全文摘要
收听环境中可能存在的干扰信号通过如下方式来掩蔽,再生收听环境中的期望信号,确定与期望信号相关联的掩蔽阈值,识别环境中可能存在的干扰信号,将干扰信号与掩蔽阈值相比较,以及随时间调整期望信号以将其掩蔽阈值提高到干扰信号的电平以上。
文档编号G10K11/175GK102257559SQ200980150864
公开日2011年11月23日 申请日期2009年12月2日 优先权日2008年12月23日
发明者K·哈通, R·卡策尔 申请人:伯斯有限公司

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:半导体光源和发光装置的制作方法技术领域:本实用新型涉及光学技术领域,特别是涉及半导体光源和发光装置。背景技术:目前,半导体光源以其长寿命和绿色环保等特点越来越受到人们的重视。半导体光源分为发光二极管(LED, light emit

    专利发布时间:2025-05-15阅读:(72)

    专利名称:一种木吉他鼓身的面板的制作方法技术领域:本发明涉及一种乐器的零部件,具体是一种木吉他鼓身的面板。背景技术:木吉他是通过鼓身把琴弦振动的声音振幅放大、并从鼓身上的音孔发出吉他原声。木吉他的鼓身结构由面板、底板、围边、趸木、音梁和内衬

    专利发布时间:2025-05-15阅读:(98)

    一种离子均匀注入的宽带束扫描方法【专利摘要】本发明公开了一种离子均匀注入的带束扫描方法,属于半导体制造领域。离子均匀注入的带束扫描系统包括:计算机(实时系统)、运动控制器、直线电机、多线圈调节磁铁、多极调节磁极、移动法拉第、角度法拉第,离子

    专利发布时间:2025-05-15阅读:(89)

    专利名称:光控音乐杯的制作方法技术领域:本实用新型系属日常生活用品,它是一种光控音乐杯。目前,国内所闻的有音乐茶杯、音乐酒杯,它们分别是以热传导或以水为导体来触发杯体内的音乐电路。从其结构而言,它们分别依靠热敏元件和杯中电极之间的参数变化作

    专利发布时间:2025-05-15阅读:(81)

    专利名称:Tft-lcd阵列基板结构及其制造方法技术领域:本发明涉及一种薄膜晶体管液晶显示器及其制造方法,尤其是一种薄膜 晶体管液晶显示器阵列基板结构及其制造方法。背景技术:薄膜晶体管液晶显示器(Thin Film Transistor L

    专利发布时间:2025-05-15阅读:(88)

    专利名称:文件摄影装置的制作方法技术领域:本实用新型涉及一种文件摄影装置,且特别是涉及一种包含一折叠支撑 部的文件摄影装置。背景技术:在现代,手写或手绘的文件及图画,常因需要而必须将这些文件或图画 输入电脑以进行数字化。在进行数字化的方式中

    专利发布时间:2025-05-15阅读:(69)