专利名称:对象声音分析装置、对象声音分析方法及对象声音分析程序的制作方法
技术领域:
本发明涉及对具有与对象声音相同的基本周期且不同于对象声音 的声音和对象声音进行区分来分析在评价声音中是否包含对象声音的 装置、方法及程序。特别涉及通过确定评价声音中的对象声音的基本周 期存在的时间或频带来分析在评价声音中是否包含对象声音的装置、方 法及程序。
背景技术:
分析基本周期的技术在混合声音分离、声音识别、声音合成等的广 泛的领域中利用,承担重要的作用。例如,在混合声音分离中,有利用 声音的基本周期即音高(pitch)从包含非周期性的噪声的混合声音中 提取声音的技术。另外,有利用音乐声的基本周期按乐器分离管弦乐演 奏的技术。并且,在声音合成中,有将声音的基本周期即音高作为一个 参数提取出来做成合成声音的技术。在分析基本周期的第一种现有技术中,利用通过听觉滤波器或傅立 叶变换做成的时间一频率结构(频谱)计算自相关,从而提取基本周期 (例如参照非专利文献l)。在第一种现有技术中,对以预定的时间间隔输入的信号进行傅立叶 变换,计算时间频率结构(频谱)。并且,在预定的频率中,沿时间轴 方向计算功率谱的自相关来提取基本周期。图35A和图35B是说明利用时间一频率结构求出基本周期的方法的图。图35A表示某个频率的功率谱。纵轴表示功率谱的大小,横轴表示 采样号。图35B表示图35A所示的功率谱的自相关。纵轴表示自相关,横 轴表示基本周期的候补。在此,说明求出自相关的方法和求出基本周期的方法。若将某个频率的某时刻(采样号) (数学式l)的功率谱设为 (数学式2)竭,则自相关 (数学式3)称)通过数学式4来计算。 (数学式4)并且,在数学式4中, (数学式5)是基本周期的候补, (数学式6)是分析区域内的采样数量。 基本频率 (数学式7) 如数学式8所示,作为具有最大的自相关(数学式3)的基本周期的候补 求出。(数学式8)5 = argr maxi (r)在图35B的例子中,基本周期为110采样(与其对应的时间)。 在分析基本周期的第二种现有技术中,利用通过小波变换而做成的某个频率的功率谱的时间结构,通过求出功率谱的大小为预定阈值以上 的时间间隔来提取基本周期(例如参照专利文献l).在第二种现有技术中,对以某个时间间隔输入的信号进行小波变换 而做成功率谱(power spectrum)的时间结构。例如,输入的信号 (数学式9)柳的二进制小波变换值 (数学式IO),利用以二进制数列进行量子化的音阶(scale)参数 (数学式ll)及移位参数(数学式12) &,通过数学式13来计算。 (数学式13) <formula>formula see original document page 9</formula>在此,分析的频带由音阶参数(数学式ll)确定。并且,移位参数(数学式12)对应于采样号。 并且,在数学式13中, (数学式14)<formula>formula see original document page 9</formula>是小波函数,(数学式15)<formula>formula see original document page 9</formula>是小波函数(数学式14)的复数共轭。 图36表示以与音阶参数 (数学式16)对应的频率对声音信号进行小波变换时的功率谱的时间结构。纵轴表示功率谱(数学式13),横轴表示采样号(数学式12)。如图36所示,若对声音信号进行小波变换,则功率谱的时间结构为 在某个采样号中具有较大的值的形状。在该现有技术中,设定有用于检测功率谱的峰值的阈值 (数学式17)AO,比较功率谱的大小和阈值(数学式17)来确定阈值以上的峰值。并且, 将超过阈值的峰值的时间间隔设为基本周期 (数学式18)
。在图36的例子中基本周期为110采样(与其对应的时间)。在分析基本周期的第三种现有技术中,在设定为声道调音等价滤波 器的反滤波特性的滤波器中,利用通过原声音而得到的残差波形图形求 出基本周期(音高)。这时,求出在某个时间间隔残差波形图形和在有 声音的合成时使用的l音高波形图形(基本波形图形)间的互相关,将 互相关的峰值的时间间隔设为基本周期(音高)(例如参照专利文献2)。 图37A 图37C表示残差波形图形和互相关的关系。 提取出通过反滤波示于图37的残差波形图形。接着,求出示于图37B 的有声音的合成时使用的l音高波形图形和残差波形图形间的互相关。 在图37中,示出残差波形图形和l音高波形图形间的互相关的时间结构。该时间结构将l音高波形图形以某个时间间隔相对于残差波形图形进行 时移求出互相关,对每个时间沿横轴排列了该互相关。在图37的例子中, 基本周期为2ms。非专利文献l: Malcolm Slaney,夕卜1名,"A Perceptual Pitch Detector" , 1990年,ICASSP(International Conference on Acoustics, Speech, and Signal Processing) , IEEE (第3章)。专利文献l:(日本)特开2004 — 126855号公报(第1项、第3图、 第4图)。专利文献2:(日本)特开昭63 — 5398号公报(第1项、第3图) 但是,在第一种现有技术中,对于具有与对象声音相同的基本周期 且不同于对象声音的声音,也输出与对象声音相同的基本周期的值,所 以存在难以对具有与对象声音相同的基本周期且不同于对象声音的声 音和对象声音进行区分来分析基本周期的问题。例如,难以区分基本周 期(音高)类似的2名男性的声音来分析基本周期。因此,难以分析在 评价声音中是否包含对象声音。并且,在第二种现有技术中,对于具有与对象声音相同的基本周期 且不同于对象声音的声音,也输出与对象声音相同的基本周期的值,所 以存在难以对具有与对象声音相同的基本周期且不同于对象声音的声
音和对象声音进行区分来分析基本周期的问题。因此,难以分析在评价声音中是否包含对象声音。例如,在区分基本周期类似的2名男性的声 音来分析基本周期时,功率谱的最大值因声音的大小而变动,所以在不 作为对象的人的功率谱的最大值大于作为对象的人的功率谱的最大值 时,难以设定阈值。并且,在第三种现有技术中,对于具有与对象声音相同的基本周期 且不同于对象声音的声音,也输出与对象声音相同的基本周期的值,所 以很难对具有与对象声音相同的基本周期且不同于对象声音的声音和 对象声音进行区分来分析基本周期。因此,难以分析在评价声音中是否 包含对象声音。发明内容本发明是鉴于这种问题点而做出的,其目的在于提供一种对象声音 分析装置,区分"对象声音"和"具有与对象声音相同的基本周期且不 同于对象声音的声音",可以分析在评价声音中是否包含对象声音。特 别是,其目的在于提供一种确定评价声音中的对象声音的基本周期存在 的时间或频带的对象声音分析装置。为了实现上述目的,本发明的对象声音分析装置,分析在评价声音中是否包含对象声音,具备对象声音准备单元,准备为了分析基本周 期而使用的分析波形、即对象声音;评价声音准备单元,准备被分析基 本周期的被分析波形、即评价声音;分析单元,使上述对象声音相对于 上述评价声音进行时移,依次计算对应的时刻的上述评价声音和上述对 象声音的差分值,计算该差分值为预定阈值以下的时刻的重复间隔,基 于该重复间隔的周期和上述对象声音的基本周期,来判断在上述评价声 音中是否存在上述对象声音。由此,计算评价声音和对象声音的差分值,基于在预定阈值以下的 差分值的重复间隔的周期和对象声音的基本周期,判断在评价声音中是 否存在对象声音,所以能够将具有与对象声音相同的基本周期且不同于
对象声音的声音和对象声音进行区分来分析有无对象声音。这是因为, 在评价声音是对象声时是,差分值的最小值近似地为零,在评价声音具 有与对象声音相同的基本周期且不同于对象声音的声音时,差分值的最 小值为离开零的较大的值。优选,上述对象声音准备单元准备通过对上述对象声音进行频率分 析而得到的对象声音频率图形;上述评价声音准备单元准备通过对上述 评价声音进行频率分析而得到的评价声音频率图形;上述分析单元一边 将上述对象声音频率图形相对于上述评价声音频率图形进行时移, 一边 依次计算对应的时刻的上述评价声音频率图形和上述对象声音频率图 形的差分值,计算上述差分值为预定阈值以下的时刻的重复间隔,基于 该重复间隔的周期和上述对象声音的基本周期,来判断在上述评价声音 中是否存在上述对象声音。由此,计算评价声音频率图形和对象声音频率图形的差分值,基于 为预定阈值以下的差分值的重复间隔的周期和上述对象声音的基本周 期,判断在上述评价声音中是否存在上述对象声音,所以能够将具有与 对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区 分,来分析对象声音的有无。在此,利用对评价声音进行了频率分析的 评价声音频率图形和对对象声音进行了频率分析的对象声音频率图形, 所以能够对每个频带分析有无对象声音。例如,在分析对象声音和噪声 混合的评价声音时,可以选择没有噪声的频带来分析有无对象声音。更好是,上述对象声音分析装置还具备设定与上述对象声音关联的 声音信息的声音信息设定单元;上述对象声音准备单元基于设定的上述 声音信息准备上述对象声音或上述对象声音频率图形。由此,对象声音准备单元基于声音信息设定单元设定的声音信息准 备对象声音,所以能够控制对象声音准备单元准备的对象声音。并且, 对象声音准备单元基于与声音信息设定单元设定的对象声音有关的声 音信息来准备对象声音频率图形,所以能够控制对象声音准备单元准备 的对象声音频率图形。由此,使用者能够使用声音信息设定单元设定对
象声音。 '更好是,上述声音信息设定单元接收对象声音的输入,将所输入的 上述对象声音作为上述声音信息;上述对象声音准备单元将所输入的上 述对象声音作为准备的上述对象声音,或者,通过进一步对该对象声音 进行频率分析来准备上述对象声音频率图形。由此,对象声音准备单元将声音信息设定单元输入的对象声音作为 准备的对象声音,所以对象声音准备单元不需要事先存储成为对象声音 的候补的多个声音,能够减小存储容量。并且,对象声音准备单元利用 声音信息设定单元输入的对象声音做成对象声音频率图形,所以对象声 音准备单元不需要存储与对象声音的候补对应的多个对象声音频率图 形,能够减小存储容量。更好是,上述对象声音准备单元存储有多个对象声音的候补或上述 多个对象声音频率图形的候补;上述声音信息设定单元接收选择信号, 该选择信号用于选择上述多个对象声音的候补及上述多个对象声音频 率图形的某一个;上述对象声音准备单元将根据上述选择信号选择的对 象声音的候补或对象声音频率图形的候补,作为准备的上述对象声音或 准备的上述对象声音频率图形。由此,由于能够利用对象声音准备单元存储的对象声音的候补来准 备对象声音,所以不需要输入对象声音。由此,在不能输入对象声音的 情况下,也可以分析有无对象声音。例如,在分析噪声下有无男性的声 音时,在噪声下不能接收到安静的环境下的男性的声音,但是,利用对 象声音准备单元存储的安静的环镜下的男性的声音,能够分析有无男性 的声音。并且,能够省略输入对象声音的时间,所以可以进行实时处理。并且,由于能够利用对象声音准备单元存储的对象声音频率图形的 候补来准备对象声音频率图形,所以不需要输入对象声音并进行频率分 析而做成对象声音频率图形。由此,在不能输入对象声音的情况下,也 可以分析对象声音。例如,在分析噪声下有无男性的声音时,在噪声下 不能接收到安静的环境下的男性的声音,但是,利用对对象声音准备单
元存储的安静的环镜下的男性的声音进行频率分析而做成的对象声音 频率图形,能够分析有无男性的声音。并且,能够省略输入对象声音的 时间和对输入的对象声音进行频率分析的时间,所以可以进行实时处 理。更好是,上述对象声音分析装置还具备阈值设定单元,该阈值设定 单元将上述对象声音相对于多个评价声音的每一个进行时移的同时,依 次计算对应的时刻的上述评价声音和上述对象声音的差分值,来计算上 述差分值的最小值,并基于与上述多个评价声音对应的多个上述最小值 中的最大值,设定上述预定阈值。由此,能够设定多个评价声音共同的阈值。例如,即使是相同的摩 托车(或自行车)声音,将在噪声下收集的摩托车声音和不是噪声的环 境下收集的摩托车声音分别作为评价声音时,能够设定两种摩托车声音 共同的阈值。因此,可以对多个对象声音设定适当的阈值,能够对多个 对象声音分析有无对象声音。并且,通过适当地控制阈值,能够减少有 无对象声音的分析错误。更好是,上述对象声音准备单元准备对象声音频率图形,该对象声 音频率图形通过上述对象声音和由预定的频率成分构成的非周期性分析波形间的互相关来计算、且包含振幅谱及相位谱中的至少一个;上述 评价声音准备单元准备评价声音频率图形,该评价声音频率图形通过评 价声音和上述分析波形间的互相关来计算、且包含振幅谱及相位谱的至 少一个。由此,分析使用非周期性分析波形做成的对象声音频率图形及评价 声音频率图形来分析对象声音的基本周期,所以,显现出对象声音及评 价声音的周期性的特征。因此,能够分析有无对象声音。例如,在比对 象声音的基本周期还高的频带的对象声音频率图形中也出现对象声音 的基本周期,所以即使在与对象声音的基本周期相对应的频带中附加噪 声,也能够分析有无对象声音。并且,在所有频带中,在对象声音频率 图形中出现对象声音的基本周期,所以能够对每个频带分析基本周期,
用于对象声音提取。更好是,上述对象声音准备单元准备对象声音频率图形,该对象声 音频率图形通过上述对象声音和构成由预定的频率成分构成的分析波 形的一部分并具有预定的时间分辨率的多个局部分析波形间的各个互 相关来计算、且包含振幅谱及相位谱的至少一个;上述评价声音准备单 元准备评价声音频率图形,该评价声音频率图形通过上述评价声音和上 述多个局部分析波形间的各个互相关来计算、且包含振幅谱及相位谱的 至少一个;上述分析单元将使用上述多个局部分析波形准备的上述对象 声音频率图形和使用上述多个局部分析波形准备的上述评价声音频率 图形,各作为一组数据使用,来分析上述对象声音的基本周期。由此,将使用多个局部分析波形准备的对象频率图形和使用多个局 部分析波形准备的评价声音频率图形,各作为一组数据是用,来分析基 本周期,所以使用分析波形中的频率分辨率的时间性频率结构的变化, 能够正好细化频率分辨率来分析基本周期。例如,可以使用在混合声音 中噪声少的狭窄的频带来分析基本周期。由此,能够通过混合声音(评 价声音)中的对象声音的有无来准确地判断。更好是,上述对象声音分析装置还具备频率设定单元,该频率设定 单元设定在上述分析单元中使用的对象声音频率图形及评价声音频率 图形的频带;上述分析单元使用由上述频率设定单元设定的上述频带的 上述对象声音频率图形及上述评价声音频率图形,分析上述对象声音的 基本周期。由此,可以利用频率设定单元来控制分析单元中使用的对象声音频 率图形及评价声音频率图形的频带。由此,能够变更分析的频带或变更 分析的频带的带宽。例如,从混合了对象声音和噪声的评价声音中分析 有无对象声音时,能够选择没有噪声的频带来分析基本周期。并且,本发明不仅可以作为具有这种特征性的单元的对象声音分析 装置实现,还可以作为将包含在对象声音分析装置中的特征性的单元作 为步骤的对象声音分析方法实现,还可以作为使计算机具有包含在对象
声音分析装置中的特征性的单元的程序实现。并且,这种程序当然可以通过CD —ROM (Compact Disc —Read Only Memory)等记录介质或因特 网等通信网络流通。本发明的效果如下如上所述,将对象声音相对于评价声音进行时移的同时,计算评价 声音和对象声音的差分值时,基于为预定阈值以下的重复时间间隔的周 期和对象声音的基本周期,判断在评价声音中是否存在对象声音,从而 能够区分"对象声音"和"具有与对象声音相同的基本周期且不同于 对象声音的声音",分析在评价声音中是否包含对象声音。并且,突发 性地在评价声音中存在波形图形类似于对象声音的噪声时,也能够准确 地分析是突发性的噪声等还是对象声音。
图1A是表示本发明的对象声音分析方法的概念图。 图1B是表示本发明的对象声音分析方法的概念图。 图1C是表示本发明的对象声音分析方法的概念图。 图ID是表示本发明的对象声音分析方法的概念图。 图IE是表示本发明的对象声音分析方法的概念图。 图IF是表示本发明的对象声音分析方法的概念图。 图1G是表示本发明的对象声音分析方法的概念图。 图2是表示第一实施方式的对象声音分析装置的整体结构的框图。 图3是表示车辆检测系统的动作顺序的流程图。 图4是表示摩托车声音的一例的图。 图5A是表示摩托车声音中的对象声音的一例的图。 图5B是表示摩托车声音中的对象声音的一例的图。 图5C是表示摩托车声音中的对象声音的一例的图。 图6A是表示利用评价声音和对象声音来计算差分值的方法的一例 的图。 图6B是表示利用评价声音和对象声音来计算差分值的方法的一例 的图。图6C是表示利用评价声音和对象声音来计算差分值的方法的一例 的图。图7A是表示利用评价声音和对象声音来计算差分值的方法的其它 一例的图。图7B是表示利用评价声音和对象声音来计算差分值的方法的其它 一例的图。图7C是表示利用评价声音和对象声音来计算差分值的方法的其它 一例的图。图8A是表示基于与对象声音间的图形匹配的方法的一例的图。 图8B是表示基于与对象声音间的图形匹配的方法的一例的图。 图8C是表示基于与对象声音间的图形匹配的方法的一例的图。 图9是表示第一实施方式的第一变形例的对象声音分析装置的整体 结构的框图。图10是表示车辆检测系统的其它动作顺序的流程图。 图ll是表示汽车的发动机声音的一例的图。 图12是表示警报器声音的一例的图。 图13是表示对象声音准备部的一例的图。 图14A是利用触摸屏选择对象声音的一例的图。 图14B是利用触摸屏选择对象声音的一例的图。 图15是表示第一实施方式的第二变形例的对象声音分析装置的整 体结构的框图。图16A是表示阈值的设定方法的一例的图。 图16B是表示阈值的设定方法的一例的图。 图16C是表示阈值的设定方法的一例的图。 图16D是表示阈值的设定方法的一例的图。 图16E是表示阈值的设定方法的一例的图。
图17是表示车辆检测系统的再一其它动作顺序的流程图。图18A是表示阈值的输入方法的一例的图。图18B是表示阈值的输入方法的一例的图。图19A是分析基本周期的方法的一例的图。图19B是分析基本周期的方法的一例的图。图19C是分析基本周期的方法的一例的图。图20是表示第二实施方式的对象声音分析装置的整体结构的框图。 图21A是表示A君的声音的一例的图。图21B是表示包括A君的3人的声音的混合声音的一例的图。 图22是表示助听系统的动作顺序的流程图。 图23是表示做成频率图形的方法的一例的图。 图24A是表示利用评价声音频率图形和对象声音频率图形来计算差分值的方法的一例的图。图24B是表示利用评价声音频率图形和对象声音频率图形来计算差分值的方法的一例的图。图24C是表示利用评价声音频率图形和对象声音频率图形来计算差分值的方法的一例的图。图25A是表示利用评价声音频率图形和对象声音频率图形来计算差分值的方法的其它一例的图。图25B是表示利用评价声音频率图形和对象声音频率图形来计算差分值的方法的其它一例的图。图25C是表示利用评价声音频率图形和对象声音频率图形来计算差分值的方法的其它一例的图。图26是表示第二实施方式的变形例的对象分析装置的整体结构的框图。图27是表示助听系统的其它动作顺序的流程图。图28是表示非周期性的分析波形图形的一例的图。图29是表示分析波形图形和局部分析波形图形的关系的图。
图30是表示分析波形图形和局部分析波形图形的其它关系的图。 图31是表示评价声频率图形和对象声音的频率图形的一例的图。 图32是表示分析波形图形和局部分析波形图形的再一其它关系的图。图33是表示第三实施方式的对象声音分析装置的整体结构的框图。 图34是表示车辆检测系统的动作顺序的流程图。 图35A是说明现有技术的利用时间一频率结构并利用自相关来分析基本周期的方法的图。图35B是说明现有技术的利用时间一频率结构并利用自相关来分析基本周期的方法的图。图36是说明利用现有技术的时间一频率结构的振幅值成为预定阈 值以上的峰值的时间间隔来分析基本周期的方法的图。图37A是说明利用现有技术的与残差波形图形有关的互相关来分析基本周期的方法的图。图37B是说明利用现有技术的与残差波形图形有关的互相关来分析基本周期的方法的图。图37C是说明利用现有技术的与残差波形图形有关的互相关来分析基本周期的方法的图。 符号说明100、 3002 车辆检测系统;101、 1701 基本周期分析部;102、 701、 1702、 2301 对象声音准备部;103、 1703评价声音准备部;104、 1704、 3001分析部;105警告声音输出部;700、 2300声音信息设定部;1100阈值设定部;1700助听系统;1705声音提取部;3000 频率设定部;SIOO、 S1700 评价声音;S101 对象声音;S102检测 信号;S103警告声音;S104、 S1705 阈值;S105、 S1706 基本周期; S700、S2300 声音信息;S1100A选择信号;S1100B 阈值信息;S1100C 声音信息;S1701评价声音频率图形;S1702对象声音频率图形; S1703区域信息;S1704提取声音;S3000频带信息;S3001A频
带信息A; S3001B频带信息B; S3001C频带信息C具体实施方式
首先,说明本发明的对象声音分析方法的概念。 图1A 图1G表示本发明的对象声音分析方法的示意图。 首先,说明评价声音是对象声音的情况。将图1C所示的对象声音 (这里使用了基本波形图形)相对于图1A所示的评价声音A (图1C 所示的对象声音的3个周期的波形图形)进行时移的同时,并依次计 算对应的时刻的评价声音A和对象声音的差分值。图1D表示计算出差 分值的结果。评价声音A与对象声音相同,因此存在差分值的最小值 成为零的部分。并且,差分值成为零的时间间隔与对象声音的基本周 期一致。因此,在评价声音中存在对象声音的情况下,可知差分值成 为零的时间间隔的周期与对象声音的基本周期一致。并且,假设重复 时间间隔为预定阈值以下的差分值的重复时间间隔。在该例子中,阈 值设为稍大于零的值。如图1D所示,稍大于零的阈值以下的差分值的 重复间隔与差分值成为零的时间间隔相同。接着,说明评价声音是具有相同的基本周期且不同于对象声音的 声音的情况。将图1C所示的对象声音相对于图1B所示的评价声音B (具有与图1C所示的对象声音相同的基本周期且不同于对象声音的声 音的3个周期的波形图形)进行时移的同时,依次计算对应的时刻的 评价声音B和对象声音的差分值。图1E表示计算出差分值的结果。包 含在评价声音B中的声音的基本周期与对象声音的基本周期相同,但 是波形图形与对象声音的波形图形不同,所以差分值的最小值不成为 零而具有较大的值。这时,评价声音B是具有与对象声音相同的基本 周期的波形图形,所以差分值的最小值的时间间隔与对象声音的基本 周期相同。因此,导入阈值并基于在预定阈值以下的差分值的重复时 间间隔来分析在评价声音中是否存在对象声音。该阈值是与图1D所示 的阈值相同的值(稍大于零的值)。如图1E所示,由于在评价声音中
不存在与对象声音相同的波形图形,所以差分值不成为零,不存在阈值以下的差分值的重复。因此,采用本方法,可以判断评价声音B不 同于对象声音。如以上说明,计算评价声音和对象声音的差分值,基于在预定阈值 以下的差分值的重复间隔来分析在评价声音中是否存在对象声音。艮口, 重复时间间隔的周期与对象声音的基本周期大致相等的情况下,判断为 在评价声音中存在对象声音,在重复时间间隔的周期与对象声音的基本 周期大致不相等的情况下,分析为在评价声音中不存在对象声音。通过 该构成,能够将具有与对象声音相同的基本周期且不同于对象声音的声 音和对象声音进行区分,分析在评价声音中是否存在对象声音。此外,基于重复间隔分析在评价声音中是否存在对象声音,从而即 使突发性地在评价声音中有类似于对象声音的波形图形的杂音等,也能 够准确地分析是突发性的杂音还是对象声音(详细情况在第一实施方式 中后述)。若对象声音的基本波形图形没有摇摆,本发明中导入的阈值可设定 为稍大于零的值。并且,当在对象声音的基本波形图形中存在摇摆的情 况下,考虑对象声音的基本波形图形的摇摆宽度的同时,设定为比由差 分值的最小值的摇摆引起的变动的最大值稍大的值。并且,可以通过反 馈分析错误的结果来调节。并且,处理多个对象声音的情况下,可以对 每个对象声音设定值。在此,为了与本发明比较,图1F及图1G示意地表示第三现有技术 的情况的结果。在图3的现有技术中,根据在设定为声道调音等价滤波 器的反滤波特性的滤波器中通过原声音而得到的残差波形图形(对应于 评价声音)、和在有声音的合成中使用的1音高波形图形(对应于对象 声音)间的互相关的时间间隔,来确定基本周期。图1F表示将图1C所 示的对象声音相对于图1A所示的评价声音A进行时移的同时,依次计 算对应的时刻的评价声音A和对象声音间的互相关的结果的一例。图1G 表示将图1C所示的对象声音相对于图1B所示的评价声音B进行时移的
同时,计算对应的时刻的评价声音A和对象声音间的互相关的结果的一 例。在第三现有技术中,不同于本发明的差分值而利用互相关,所以有 时对于与对象声音不同的声音也取较大的值。因此,难以导入阈值。这 是因为,与差分值不同,相关值是判断符号是否一致的值,在计算相关 值的2个波形图形的符号一致的部分的波形图形的值较大的情况下,不 管2个波形图形是否相同而取较大值。这样,在利用相关值的现有技术 中难以导入阈值。并且,本发明人知道考虑了在将用对象声音(对象声 音频率图形)及对应的评价声音(评价声音频率图形)的大小对互相关 进行归一化的归一化互相关导入之后利用阈值的技术,但是由于欠缺声 音(频率图形)的大小的信息,所以对于比对象声音(对象声音频率图 形)大很多或小很多的对象声音以外的声音(频率图形),若形状相似 就会错误判断为对象声音,故难以利用。特别是,在对象声音(对象声 音频率图形)如正弦波那样是单纯的形状,分析振幅非常小的杂音区间 的评价声音(评价声音频率图形)时,还增加量子化错误的影响并增加 分析错误。并且,按频带来分割对象声音并进行分析时,频带之间的对 象声音频率图形的大小关系(对象声音的频谱结构)变得重要,所以需 要频率图形的大小的信息。与此相比,本发明的差分值能够利用声音大 小的信息,所以能够解决上述课题。以下参照
本发明的实施方式。 (第一实施方式)图2表示本发明的第一实施方式的对象声音分析装置的整体结构的 框图。在此,示出本发明的对象声音分析装置组装到车辆检测系统的一 例。在本实施方式中,将通过分析摩托车声音的基本周期判断在使用者 的周边存在摩托车声音来对使用者通知摩托车接近的情况为例进行说 明。车辆检测系统100是检测评价声音S100是否是摩托车声音并在摩 托车声音的情况下输出警告声音S103的系统,具备基本周期分析部101 和警告声音输出部105。
基本周期分析部101是分析评价声音S100的基本周期的处理部, 具备对象声音准备部102、评价声音准备部103、和分析部104。在对象声音准备部102中存储有对象声音S101和对象声音S101的 基本周期S105。在分析部104中存储有阈值S104。对象声音准备部102 向分析部104输出对象声音S101和基本周期S105。评价声音准备部103 输入评价声音SIOO而向分析部104输出。分析部104将对象声音S101 相对于评价声音SIOO进行时移的同时,依次计算对应的时刻的评价声 音SIOO和对象声音SlOl的差分值,基于在阈值S104以下的差分值的 重复时间间隔的周期和对象声音SIOI的基本周期S105,分析在评价声 音SIOO中是否存在对象声音SlOl,利用基本周期S105在评价声音SIOO 中存在对象声音SlOl的情况下向警告声音输出部105输出检测信号 S102。对象声音准备部102是准备为了分析基本周期而使用的分析波形图 形、即对象声音的对象声音准备单元的一例。评价声音备部103是准备被分析基本周期的被分析波形图形、即评 价声音的评价声音准备单元的一例。分析部104是如下分析单元的一例使上述对象声音相对于上述评 价声音进行时移的同时,依次计算对应的时刻的上述评价声音和上述对 象声音的差分值,计算上述差分值成为预定阈值以下的时刻的重复间 隔,基于该重复间隔的周期和上述对象声音的基本周期,来判断在上述 评价声音中是否存在上述对象声音。在输入了检测信号S102时,警告声音输出部105向使用者提示警 告声音S103。接着,说明如上那样构成的车辆检测系统100的动作。 图3是表示车辆检测系统100的动作顺序的流程图。 在该例子中,车辆检测系统100出厂之前,在对象声音准备部102 中存储有摩托车声音作为对象声音SIOI (步骤200),进而存储有作为 对象声音S101的摩托车声音的基本周期S105。并且,在分析部104中
存储有阈值S104。图4表示摩托车声音的一个例子。由此,可知摩托车声音是周期性 的声音。并且,图5A 图5C表示对象声音S102的一例。对象声音可以 是图5A所示的1个周期的摩托车声音,也可以是图5B所示的1个周期 的摩托车声音,也可以是图5C所示的3个周期的摩托车声音,对于对 象声音的时间长度没有限制。在该例子中,设定图5A所示的一个周期 的摩托车声音为对象声音S101。此外,对象声音S101的基本周期S105 是2. 9ms 3. 2ms。首先,通过启动车辆检测系统IOO,评价声音准备部103利用麦克 风开始取入评价声音SIOO、即使用者的周边的声音(步骤201)。在该例子中,从使用者的周边的声音取入包含多个摩托车声音的基本周期的 9ms间隔的评价声音。g卩,每9ms区分使用者的周边的声音并输入,分析摩托车声音的基本周期。接着,在由使用者的周边的声音构成的评价声音S100中,分析在 是否包含有对象声音准备部102中存储的对象声音S101、即摩托车声音 的基本周期(步骤202)。具体地,在分析部104中,将对象声音SIOI 相对于评价声音S100进行时移的同时,依次计算对应的时刻的评价声 音S100和对象声音S101的差分值,基于在阈值S104以下的差分值的 重复时间间隔来分析对象声音S101的基本周期。并且,利用基本周期 S105,在评价声音S100中存在对象声音S101时向警告声音输出部105 输出检测信号S102。图6A 图6C表示分析部104中的分析对象声音的基本周期的方法 的一例。在该例子中,示出评价声音是对象声音的情况。图6A示出评价声音的一例。在该例子中,从当前时刻追溯来截取 9ms的使用者的周边的声音来作为评价声音。在该例子中,评价声音由 3个周期的对象声音、即摩托车声音构成。在此,将评价声音S100表现 为(数学式19) 服⑨ ("-0,l,…,丄)其中,n是将时间离散化的值,在该例子中,L是对应于9ms的值。图6B表示对象声音的一例。在该例子中将1个周期的摩托车声音 作为对象声音。其中,将对象声音S101表现为 (数学式20)(" = 0,1,,,"『)其中,n是将时间离散化的值,在该例子中,W是对应于对象声音SIOI 的基本周期、即3ms的值。图6C中示出将对象声音S101相对于评价声音S100进行时移时的 差分值。在该例子中,利用欧几里德距离。其中,将差分值表现为 (数学式21)五(/n) = Z:::V(服(m + ")-万r("))2(777 = 0,1,…,丄一『)其中,m是将时间离散化的值,对应于求出差分值的评价声音sioo的 开端的时刻。该差分值是对时间宽度w中的评价声音和对象声音的差 分进行总计的值。在该例子中,评价声音是对象声音,所以差分值的重复时间间隔成为3ms,与对象声音的基本周期S105 —致。其中,导入阈值S104。将该阈值S104表现为0。在该例子中, 阈值S104在车辆检测系统100出厂之前存储在分析部104中,考虑对 象声音的基本波形图形的摇摆宽度而设定为比由差分值的最小值的摇 摆引起的变动的最大值稍大的值。图6C示出对象声音的基本周期的分析方法的一例。其中,求出在 阈值O以下的数学式21中表示的差分值的重复时间间隔。在该例子 中,由于评价声音是对象声音,所以差分值的最小值成为非常接近零 的值。因此,在阈值 以下的差分值的重复时间间隔与不考虑阈值的 差分值的重复时间间隔一致。在该例子中,评价声音S100的基本周期 成为3ms。
接着,评价声音的基本周期是3ms,在作为对象声音的基本周期 S105的2.9ms 3.2ms的范围内,所以分析部104判断为在评价声音 S100中存在对象声音S101,向警告声音输出部105输出检测信号S102 (步骤203)。并且,在输入了检测信号S102的定时,警告声音输出 部105向使用者提示警告声音S103。此外,图7A 图7C表示在分析部104中评价声音S100是具有与 对象声音S101相同的基本周期且不同于对象声音S101的声音的情况 的一例。图7A表示不同于摩托车声音的评价声音S100的一例。在该例子 中,从当前时刻追溯来截取9ms的使用者的周边的声音来作为评价声 音S100。在该例子中,评价声音S100由3个周期的不同于对象声音的 声音构成,并且基本周期与对象声音S101相同为W二3ms。图7B表示对象声音S101的一例。在该例子中,与图6B同样地将 1个周期的摩托车声音作为对象声音S101,基本周期是3ms。图7C中,示出将对象声音S101相对于评价声音S100进行时移时 的差分值。在该例子中,与图6C同样地利用欧几里德距离作为差分值。 在该例子中,评价声音S100是具有与对象声音S101相同的基本周期 的声音,所以差分值的重复时间间隔与对象声音S101的基本周期一致 而成为3ms。在此,导入阈值S104。在该例子中,阈值S104在车辆检测系统 100出厂之前存储在分析部104中,考虑对象声音的基本波形图形的摇摆宽度而设定为比由差分值的最小值的摇摆引起的变动的最大值稍大 的值。该值与图6A 图6C的例子相同。在此,求出在阈值e以下的 数学式21所示的差分值的重复时间间隔。在该例子中,评价声音是与 对象声音不同的声音,所以差分值的最小值离开零而成为较大的值。 因此,不存在阈值0以下的差分值的重复时间间隔。在该情况下,由于不存在评价声音S100的基本周期、或者即使存 在评价声音S100的基本周期也不在对象声音S101的基本周期S105的 2. 9ms 3.2ms的范围内,所以分析部104判断为在评价声音S100中不 存在对象声音SlOl,不向警告声音输出部105输出检测信号S102 (步 骤S203)。因此,不输入检测信号S102,所以警告声音输出部105不 向使用者提示警告声音。并且,在评价声音S100是基本周期不同于对象声音S101的声音 的情况下,在分析部104中,在评价声音S100的基本周期上不出现对 象声音S101的基本周期S105,所以判断为在评价声音S100中不存在 对象声音SIOI,警告声音S103不提示给使用者。最后,到车辆检测系统100停止为止,重复这些从步骤201到步 骤203的动作(步骤204)。如上说明,根据本发明的第一实施方式,计算评价声音和对象声 音的差分值,基于在预定阈值以下的差分值的重复间隔的周期和对象 声音的基本周期,分析在评价声音中是否存在对象声音。因此,能够 区分"具有与对象声音相同的基本周期且不同于对象声音的声音"和 "对象声音",分析在评价声音中是否包含对象声音。并且,试着考虑不分析重复时间间隔的周期而仅用评价声音和对 象声音的差分值来判断对象声音的存在的情况,来取代分析部104。即, 差分值为零或接近于零时,判断为存在对象声音。图8A 图8C表示仅 用差分值判断对象声音的存在的方法。图8A是评价声音,图8B是对 象声音。在图8A的评价声音中,在时间的前半部分存在类似于对象声 音的波形图形,在时间的后半部分存在具有与对象声音相同的基本周 期3ms的杂音。并且,在评价声音中实际上不含有对象声音。在图8C 中表示与第一实施方式同样地求出的差分值。时间的后半部分如上述 实施方式中说明那样,不存在阈值以下的部分。即,可知在时间的后 半部分不存在对象声音。另一方面,在时间的前半部分的评价声音中 存在类似于对象声音的波形图形,所以存在差分值接近于零的部分。 即,存在阈值以下的部分。在评价声音的波形图形和对象声音的波形 图形的差分值是阈值以下的情况下认为在评价声音中存在对象声音的
方法中,有可能错误地判断为在这次的评价声音中存在对象声音。另 一方面,在第一实施方式中,不仅在评价声音的波形图形和对象声音 的波形图形的差分值成为阈值以下的情况下,判断在阈值以下的差分 值的时间间隔的周期是否与对象声音的基本周期大致相等,所以在图8C的情况下也可以判断为不存在对象声音。因此,通过判断在阈值以 下的差分值的时间间隔的周期是否与对象声音的基本周期大致相等, 从而即使在评价声音中存在与对象声音的波形图形类似的突发性的杂 音等,也不会错误判断有无对象声音而能够准确地分析,在杂音下也 能够检测有无对象声音。(第一实施方式的第一变形例)说明第一实施方式的第一变形例。图9是表示本发明的第一实施 方式的第一变形例的对象声音分析装置的整体结构的框图。在此,除 了图2所示的车辆检测系统100以外,追加了声音信息设定部700。在 该变形例子中,使用者能够设定对象声音S101。车辆检测系统200具备基本周期分析部201和警告声音输出部 105。基本周期分析部201具备声音信息设定部700、对象声音准备部 701、评价声音准备部103和分析部104。在分析部104中存储有阈值S104。声音信息设定部700设定与对 象声音有关的声音信息S700而向对象声音准备部701输出。对象声音 准备部701基于声音信息S700准备对象声音SlOl,并且准备对象声音 S101的基本周期S105,向分析部104输出对象声音S101和基本周期 S105。评价声音准备部103输入评价声音S100而向分析部104输出。 分析部104将对象声音S101相对于评价声音S100进行时移的同时, 依次计算对应的时刻的评价声音S100和对象声音S101的差分值。分 析部104基于在阈值S104以下的差分值的重复时间间隔的周期和对象 声音S101的基本周期S105,分析在评价声音S100中是否存在对象声 音SIOI。在评价声音SIOO中存在对象声音SIOI时,分析部104向警 告声音输出部105输出检测信号S102。在输入了检测信号S102时,警
告声音输出部105向使用者提示警告声音S103。接着,说明如上那样构成的车辆检测系统200的动作。 图10是表示车辆检测系统200的动作顺序的其它流程图。 在该例子中,在车辆检测系统200出厂之前分析部104中存储有 阈值S104。在该例子中,阈值S104设定为稍大于零的值、即0.2。首先,声音信息设定部700利用麦克风取得声音信息S700、即摩 托车声音并向对象声音准备部701输出(步骤800)。接着,对象声音准备部701通过截取作为声音信息S700的摩托车 声音的一部分来准备对象声音S101 (步骤801)。并且,求出摩托车 声音的基本周期作为基本周期S105。在该例子中,由于成为对象的声 音仅是摩托车声音,具有与摩托车声音相同的基本周期且不包含其它 声音,所以求出摩托车声音的基本周期的方法利用第一现有技术的方 法。接着,通过启动车辆检测系统200,评价声音准备部103利用麦克 风,开始取得作为评价声音S100的使用者的周边的声音(步骤201)。接着,分析在由使用者的周边的声音构成的评价声音S100中,是 否包含有对象声音准备部102准备的对象声音SlOl、即摩托车声音的 基本周期(步骤202)。接着,判断是否提示警告声音,在存在对象声音时输出警告声音 (步骤203)。这里的步骤201、步骤202、步骤203与第一实施方式相同,所以 省略说明。最后,到车辆检测系统200停止为止,重复这些从步骤201到步 骤203的动作(步骤204)。如上说明,对象声音准备部701将声音信息设定单元输入的对象 声音作为准备的对象声音,所以不需要事先存储成为对象声音的候补 的多个声音,可减小存储容量。并且,也可以在步骤800中输入包含摩托车声音的评价声音S100 作为声音信息S700,在步骤801中从声音信息S700中截取摩托车声音 的部分来准备对象声音SlOl。这时,即使在存在对象声音以外的声音 的情况下,也可以准备对象声音S101。 (其它例子)说明声音信息设定部700和对象声音准备部701的其它例子。 图10是表示车辆检测系统200的动作顺序的其它流程图。 在该例子中,在车辆检测系统200出厂之前,在对象声音准备部 701中作为对象声音的候补而存储有摩托车声音、汽车的发动机声音和 警报声音。并且,在对象声音准备部701中存储有与每个对象声音的 候补对应的基本周期。并且,在分析部104中存储有阈值S104。图11表示汽车的发动机声音的一例。并且,图12表示紧急车辆 的警报声音的一例。由此可知汽车的发动机声音和警报声音是周期性 的声音。图13表示对象声音的候补的一例。在该例子中,对象声音准备部 701作为对象声音的候补而存储有"摩托车声音"、"汽车的发动机声 音"、"警报声音"这3种对象声音。并且,存储有与每个对象声音 的候补对应的基本周期。首先,声音信息设定部700向使用者提示对象声音的候补。图14A 及图14B中示出提示对象声音的候补的方法的一例。在该例子中,在 图14A所示的触摸屏上显示对象声音的名称(摩托车、汽车、警报器)和对象声音的波形图形。使用者使用触摸屏来选择对象声音,从而做 成声音信息S700、即选择信号。在该例子中,如图14B所示,摩托车 声音被选择而在显示器上"摩托车"的周围的颜色反转。这时,从扬 声器输出选择的摩托车声音的声音。由此,使用者可以确认选择的对 象声音(步骤800)。接着,对象声音准备部701将与作为声音信息S700的选择信号对 应的对象声音作为对象声音S101 (步骤801)。此外,将对应于选择 信号的对象声音SIOI的基本周期作为基本周期S105。在该例子中,对 象声音S101是摩托车声音,基本周期S105是作为摩托车声音的基本 周期的2. 9ms 3. 2ms。接着,通过启动车辆检测系统100,评价声音准备部103利用麦克 风开始取得作为评价声音S100的使用者的周边的声音(步骤S102)。接着,分析在由使用者的周边的声音构成的评价声音S100中是否 存在对象声音准备部102准备的对象声音SlOl、即摩托车声音的基本 周期(步骤202)。接着,判断是否提示警告声音,当存在对象声音时输出警告声音 (步骤203)。这里的步骤201、步骤202、步骤203与第一实施方式相同,所以 省略说明。最后,到车辆检测系统200停止为止,重复这些从步骤201到步 骤203的动作(步骤204)。如以上说明,可以利用对象声音准备部701存储的对象声音的候 补来准备对象声音,所以不需要输入对象声音。由此,即使在不能输 入对象声音的情况下,也能够分析对象声音。例如,在噪声下分析是 否存在摩托车声音的情况下,在噪声下不能收集安静的环境下的摩托 车声音,但是,通过使用对象声音准备部701存储的安静的环境下的 摩托车声音,从而能够分析是否存在摩托车声音。并且,能够省略输 入对象声音的时间,所以能够进行实时处理。如上说明,根据本发明第一实施方式的第一变形例,对象声音准 备部701基于声音信息设定部700设定的声音信息,准备对象声音, 所以能够控制对象声音准备部701准备的对象声音。由此,使用者能 够利用声音信息设定部700设定对象声音。 (第一实施方式的第二变形例)对第一实施方式的第二变形例进行说明。图15是表示本发明的第 一实施方式的第二变形例的对象声音分析装置的整体结构的框图。在 此,除了图9所示的车辆检测系统200以外,追加了阈值设定部1100。
阈值设定部1100是如下的阈值设定单元的一个例子将对象声音相对 于多个评价声音的每一个进行时移的同时,依次计算对应的时刻的评 价声音和对象声音的差分值,计算上述差分值的最小值,基于与上述 多个评价声音对应的多个上述最小值中的最大值,设定预定阈值。车辆检测系统300具备基本周期分析部301、警告声音输出部105。基本周期分析部301具备阈值设定部1100、声音信息设定部700、 对象声音准备部701、评价声音准备部103和分析部104。对阈值设定部1100基于对象声音准备部701准备的对象声音来设 定阈值的方法进行说明。在该例子中,阈值设定部1100利用图15中 的"选择信号S1100A"设定阈值S104。并且,不使用图15中的"阈 值信息S1100B"和"声音信息S1100C"。在该例子中,车辆检测系统出厂之前,在对象声音准备部701中 作为对象声音的候补而存储有"摩托车声音"、"汽车的发动机声音" 和"警报声音"。此外,在对象声音准备部701中存储有与每个对象 声音的候补对应的基本周期。此外,在阈值设定部iioo中存储有与对 象声音准备部701存储的每个对象声音的候补对应的阈值。在此,存 储有"摩托车声音的阈值"、"汽车的发动机声音的阈值"和"警报 声音的阈值"。这些阈值对于每个对象声音的候补考虑这些基本波形 图形的摇摆宽度而设定为比由差分值的最小值的摇摆引起的变动的最 大值稍大的值。图16A 图16E中表示阈值的设定方法。图16A中示出3个周期的 摩托车声音A的基本波形图形。此外,图16B中示出摩托车声音B的 基本波形图形。此外,图16C中示出摩托车声音C的基本波形图形。 摩托车声音A、摩托车声音B、摩托车声音C的基本波形图形由于运行 状态的影响而产生摇摆。图16D中示出与第一实施方式同样地求出的 摩托车声音A(对应于评价声音)和摩托车声音B(对应于对象声音) 的差分值。此外,在图16E中示出与第一实施方式同样地求出的摩托 车声音A (对应于评价声音)和摩托车声音C (对应于对象声音)的差
分值。根据图16D及图16E,由于摩托车声音A、摩托车声音B及摩托 车声音C的波形图形稍微不同,所以差分值的最小值成为稍大于零的 值。在此,摩托车声音B和摩托车声音C都是作为对象声音的摩托车 声音,所以将比对摩托车声音A和摩托车声音B的差分值的最小值与 摩托车声音A和摩托车声音C的差分值进行比较时的较大的值稍大的 值设为阈值G)。在该例子中,摩托车声音A和摩托车声音C的差分值 的最小值比摩托车声音A和摩托车声音B的差分值的最小值大,所以 将阈值设定为比摩托车声音A和摩托车声音C的差分值的最小值稍大 的值。声音信息设定部700设定与对象声音有关的声音信息S700向对象 声音准备部701输出。对象声音准备部701基于声音信息S700准备对 象声音S101,并且准备对象声音S101的基本周期S105,向分析部104 输出对象声音S101和基本周期S105。阈值设定部1100基于对象声音 准备部701准备的对象声音S101设定阈值S104。评价声音准备部103 输入评价声音S100而向分析部104输出。分析部104将对象声音S101 相对于评价声音S100进行时移的同时,依次计算对应的时刻的评价声 音S100和对象声音S101的差分值。分析部104基于在阈值以下的差 分值的重复时间间隔的周期和对象声音S101的基本周期S105,分析在 评价声音S100中是否存在对象声音SlOl。在评价声音S100中存在对 象声音S101的情况下,分析部104向警告声音输出部105输出检测信 号S102。在输入了检测信号S102时,警告声音输出部105向使用者提 示警告声音S103。接着,对如上那样构成的车辆检测系统300的动作进行说明。 图17是表示车辆检测系统300的动作顺序的流程图。 在该例子中,声音信息设定部700提示对象声音的候补而使使用 者选择对象声音,做成选择信号(步骤800)。在该例子中选择摩托车 声音。接着,对象声音准备部701将与作为声音信息S700的选择信号S1100A对应的对象声音作为对象声音S101 (步骤801)。在该例子中 摩托车声音成为对象声音SIOI。并且,将对应于选择信号S1100A的对 象声音S101的基本周期作为基本周期S105。在该例子中,基本周期 S105是作为摩托车声音的基本周期的2. 9ms 3. 2ms。这里的步骤800、步骤801与第一实施方式的第一变形例的其它例 子相同,所以省略说明。接着,阈值设定部1100根据阈值设定部1100存储的阈值,将与 对象声音准备部701准备的对象声音S101对应的阈值设定为阈值 S104。在该例子中,摩托车声音被选择为对象声音,所以对应于摩托 车声音的阈值成为阈值S104 (步骤1200)。接着,通过启动车辆检测系统300,评价声音准备部103利用麦克 风开始取得作为评价声音S100的使用者的周边的声音(步骤201)。接着,分析在由使用者的周边的声音构成的评价声音SIOO中是否 包含有对象声音准备部102准备的对象声音SlOl、即摩托车声音的基 本周期(步骤202)。接着,判断是否提示警告声音,在存在对象声音时输出警告声音 (步骤203)。这里的步骤201、步骤202、步骤203与第一实施方式相同,所以 省略说明。最后,到车辆检测系统300停止为止,重复这些从步骤201到步 骤203的动作(步骤204)。如上说明那样,分析部104能够利用对应于对象声音的阈值来分 析基本周期,所以能够切换用于判断是否存在的对象声音。 (另一其它例子)对使用者利用阈值设定部IIOO设定阈值的方法进行说明。在该例 子中,阈值设定部1100利用图15中的"阈值信息S1100B"来设定阈 值S104。并且,不使用图15中的"选择信号S1100A"和"声音信息 S1100C"。
在该例子中,车辆检测系统300出厂之前,在对象声音准备部701 中作为对象声音的候补而存储有"摩托车声音"、"汽车的发动机声 音"和"警报声音"。此外,在对象声音准备部701中存储有与每个 对象声音的候补对应的基本周期。此外,在分析部104中存储有阈值 S104。考虑该对象声音的候补的所有声音的基本波形图形的摇摆宽度 而设定为比由差分值的最小值的摇摆引起的变动的最大值稍大的值。声音信息设定部700设定与对象声音有关的声音信息S700向对象 声音准备部701输出。对象声音准备部701基于声音信息S700准备对 象声音SIOI,并且准备对象声音SIOI的基本周期S105,向分析部104 输出对象声音S101和基本周期S105。阈值设定部1100基于使用者输 入的阈值信息S1100B设定阈值S104。评价声音准备部103输入评价声 音S100而向分析部104输出。分析部104将对象声音S101相对于评 价声音S100进行时移的同时,依次计算对应的时刻的评价声音S100 和对象声音S101的差分值。分析部104基于在阈值S104以下的差分 值的重复时间间隔的周期和对象声音SIOI的基本周期,判断在评价声 音S100中是否存在对象声音SlOl。在判断为存在对象声音S101的情 况下,分析部104向警告声音输出部105输出检测信号S102。在输入 了检测信号S102时,警告声音输出部105向使用者提示警告声音S103。接着,对如上那样构成的车辆检测系统300的动作进行说明。图17是表示车辆检测系统300的动作顺序的流程图。首先,声音信息设定部700提示对象声音的候补而使使用者选择 对象声音,做成选择信号(步骤800)。在该例子中选择摩托车声音。接着,对象声音准备部701将与作为声音信息S700的选择信号对 应的对象声音作为对象声音S101 (步骤801)。在该例子中摩托车声 音成为对象声音SIOI。这里的步骤800、步骤801与第一实施方式的第一变形例的其它例 子相同,所以省略说明。接着,阈值设定部1100将使用者输入的阈值信息S1100B、即阈值
的值作为阈值S104 (步骤1200)。并且,作为其它方法,也可以根据 作为使用者输入的阈值信息S1100B的阈值的增减量来调节分析部104 存储的阈值而作为阈值S104。图18A及图18B表示使用者输入阈值信息的方法的一例。图18A 示出使用者输入阈值的值的方法。使用者通过"钮"来输入阈值的值。 这时,在显示器上显示代表性的对象声音彼此的差分值和设定中的阈 值。BP,通过将钮向左右移动,设定中的阈值变化的同时,画面上的 阈值线也上下移动。由此,使用者可以直观地容易设定阈值的值。图 18B中示出输入与存储着的阈值间的阈值的增减量的方法。使用者通过 钮输入阈值的增减量。这时,若存储的阈值是 0,阈值的增减量是A ,则阈值S104成为O0+AO。并且,能够根据显示于显示器上的值 确认阈值的增减量和阈值的值。接着,通过启动车辆检测系统300,评价声音准备部103利用麦克 风开始取得作为评价声音S100的使用者的周边的声音(步骤201)。接着,分析在由使用者的周边的声音构成的评价声音S100中是否 包含有对象声音准备部102准备的对象声音S101、即摩托车声音(步 骤202)。接着,判断是否提示警告声音,在存在对象声音时输出警告声音 (步骤203)。这里的步骤201、步骤202、步骤203与第一实施方式相同,所以 省略说明。最后,到车辆检测系统300停止为止,重复这些从步骤201到步 骤203的动作(步骤204)。如上说明,使用者能够利用阈值设定部iioo对对象声音设定适当 的阈值。由此,能够减少分析错误。 (再一其它例子)对阈值设定部IIOO基于对象声音准备部701准备的对象声音SIOI 的基本波形图形的摇摆宽度来设定阈值的方法进行说明。在该例子中,
阈值设定部1100利用图15中的"阈值信息S1100C"来设定阈值S104。 并且,不使用图15中的"选择信号S1100A"和"阈值信息S1100B"。 声音信息设定部700将包含与对象声音有关的声音信息S700、即 对象声音的声音,向对象声音准备部701输出。对象声音准备部701 基于声音信息S700准备对象声音SlOl,并且准备对象声音S101的基 本周期S105,向分析部104输出对象声音S101和基本周期S105。阈 值设定部1100基于对象声音准备部701准备的对象声音S101的基本 波形图形的摇摆宽度来设定阈值。评价声音准备部103输入评价声音 S100而向分析部104输出。分析部104将对象声音S101相对于评价声 音S100进行时移的同时,依次计算对应的时刻的评价声音S100和对 象声音S101的差分值。分析部104基于在阈值S104以下的差分值的 重复时间间隔的周期和对象声音S101的基本周期S105,分析在评价声 音S100中是否存在对象声音SlOl。在评价声音S100中存在对象声音 S101的情况下,分析部104向警告声音输出部105输出检测信号S102。 在输入了检测信号S102时,警告声音输出部105向使用者提示警告声 音S103。接着,对如上那样构成的车辆检测系统300的动作进行说明。 图17是表示车辆检测系统300的动作顺序的流程图。 首先,声音信息设定部700利用麦克风取得作为声音信息S700的 摩托车声音,向对象声音准备部701输出(步骤800)。接着,对象声音准备部701通过截取作为声音信息S700的摩托车 声音的一部分,准备对象声音S101 (步骤801)。并且,求出摩托车 声音的基本周期作为基本周期S105。在该例子中,由于作为对象的声 音仅是摩托车声音且不包含具有与摩托车声音相同的基本周期的其它 声音,所以求出摩托车声音的基本周期的方法利用第一现有技术的方 法。这里的步骤800、步骤801与第一实施方式的第一变形例的其它例 子相同,所以省略说明。
接着,阈值设定部1100作为对象声音S1100C,将声音信息S700、 即摩托车声音输入为声音信息S1100C,考虑摩托车声音的基本波形图 形的摇摆宽度,将阈值S104设定为比由差分值的最小值的摇摆引起的 变动的最大值稍大的值(步骤1200) 。 gp,考虑对象声音SIOI的基本 波形图形的摇摆宽度而设定阈值S104。在该例子中,用与图16A 图 16E所示的方法相同的方法设定阈值S104。接着,通过启动车辆检测系统300,评价声音准备部103利用麦克 风开始取得作为评价声音SIOO的使用者的周边的声音(步骤201)。接着,分析在由使用者的周边的声音构成的评价声音SIOO中是否 包含有对象声音准备部102中存储的对象声音SlOl、即摩托车声音的 基本周期(步骤202)。接着,判断是否提示警告声音,在存在对象声音时输出警告声音 (步骤203)。这里的步骤201、步骤202、步骤203与第一实施方式相同,所以 省略说明。最后,到车辆检测系统300停止为止,重复这些从步骤201到步 骤203的动作(步骤204)。如以上说明那样,阈值设定部IIOO能够自动地求出适合对象声音 的阈值,所以不需要事先准备阈值。由此,在追加了分析的对象声音 时,利用不需要对追加的对象声音设定阈值,所以使用方便性较好。如上说明那样,根据本发明的第一实施方式的第二变形例,能够 利用阈值设定部IIOO控制分析部104使用的阈值,所以能够对多个对 象声音设定适当的阈值,可对多个对象声音的每一个分析是否存在该 对象声音。并且,通过适当地控制阈值,能够减少是否存在对象声音 的分析错误。在此,对通过分析部分析是否存在对象声音的其它方法进行补充。 在该例子中描述,截取评价声音的一部分作为对象声音,并通过求出 评价声音的基本周期来分析是否存在对象声音的方法。在该例子中, 对象声音的基本周期未存储在基本周期分析部中。图19A 图19C中示出该例子的基本周期的分析方法。图19A中示 出评价声音,基本周期由相同的2种声音构成。图19B中示出从评价 声音中截取的对象声音的一例。图19B (a)是截取图19A的A部分做 成的对象声音A,图19B (b)是截取图19A的B部分做成的对象声音B。 它们是不同种类的声音的1个周期的波形图形。在此,与第一实施方式同样地求出评价声音和对象声音A的差分 值。并且,与第一实施方式同样地求出评价声音和对象声音B的差分 值。将求出的差分值示于图19C。图19C (a)是使用对象声音A时的 差分值。并且,图19C (b)是使用对象声音B时的差分值。根据图19C (a),由于仅在包含有对象声音A的时间出现基本周期,所以能够分 析为在该时间存在对象声音A而对象声音A的基本周期是W。同时,通 过图19C (b),由于仅在包含有对象声音B的时间出现基本周期,所 以能够分析为在该时间存在对象声音B而对象声音B的基本周期是W。 若合成这2个结果,可知在评价声音中包含2种声音且它们的基本周 期是W。并且,还可以得知2种声音切换的时刻。 (第二实施方式)图20是表示本发明的第二实施方式的对象声音分析装置的整体结 构的框图。在此,示出本发明的对象声音分析装置组装在助听系统中 的一例。在本实施方式中,通过分析声音的基本周期,以3名说话人 同时发出声音的混合声音中提取特定的说话人的声音的情况为例进行 说明。在该例子中,说明对每个频带分析对象声音的基本周期并判断 存在对象声音的方法。图21A及图21B中分别示出A君的声音的波形图形及混合了包括A 君的3人的声音的混合声音的波形图形。根据图21A可知A君的声音 是周期性的声音。并且,A君以外的人的声音也是周期性的声音。在该 例子中,说明从图21B所示的混合了 3人的声音的混合声音中提取图 21A所示的A君的声音并向使用者仅提供A君的声音的情况。
助听系统1700具备基本周期分析部1701和声音提取部1705。基 本周期分析部具备对象声音准备部1702、评价声音准备部1703及分析 部1704。在对象声音准备部1702中存储有对对象声音进行频率分析得到的 每个频带的对象声音频率图形S1702和对象声音的基本周期S1706。在 分析部1704中存储有阈值S1705。对象声音准备部1702向分析部1704 输出对象声音频率图形S1702和基本周期S1706。评价声音准备部1703 输入评价声音S1700,对评价声音S1700进行频率分析,将每个频带的 评价声音频率图形S1701输出到分析部1704。分析部1704对每个频带, 将对象声音频率图形S1702相对于评价声音频率图形S1701进行时移的 同时,依次计算对应的时刻的评价声音频率图形S1701和对象声音频率 图形S1702的差分值。分析部1704基于在阈值S1705以下的差分值的 重复时间间隔的周期和对象声音的基本周期S1706,向声音提取部1705 输出与在评价声音1700中存在对象声音的时间一频率区域有关的信息、 即区域信息S1703。声音提取部1705利用区域信息S1703和评价声音频 率图形S1701提取对象声音向使用者提示。对象声音准备部1702是准备通过对对象声音进行频率分析而得到 的对象声音频率图形的对象声音准备单元的一例。评价声音备部1703是准备通过对评价声音进行频率分析而得到的 评价声音频率图形的评价声音准备单元的一例。分析部1704是如下分析单元的一例将上述对象声音频率图形相 对于上述评价声音频率图形进行时移的同时,依次计算对应的时刻的上 述评价声音频率图形和上述对象声音频率图形的差分值,计算上述差分 值成为预定阈值以下的时刻的重复间隔,基于该重复间隔的周期和上述 对象声音的基本周期,来判断在上述评价声音中是否存在上述对象声音接着,说明如上那样构成的助听系统1700的动作。 图22是表示助听系统1700的动作顺序的流程图。
在该例子中,在助听系统出厂之前,在对象声音准备部1702中存 储有对A君的声音进行频率分析而得到的每个频带的频率图形作为对象 声音频率图形S1702 (步骤1800),进而存储有作为对象声音的A君的 声音的基本周期S1706。并且,在分析部1704中对每个频带存储有阈值 S1705。在该例子中,作为对象声音的A君的声音的基本周期S1706是 3ms 12ms。并且,这里的对象声音频率图形通过对第一实施方式的对 象声音进行离散傅立叶变换来得到。但是,在该例子中,对象声音不是 摩托车声音,而是A君的声音。图23表示求出对象声音频率图形S1702的方法的概念图。将某个 时刻的对象声音频率图形S1702表现为 (数学式22).2血其中,N是傅立叶变换的窗口长度,设为比对象声音的长度W短。其中, k是分析的频带的索引。并且, (数学式23)<formula>formula see original document page 41</formula>是对象声音,(数学式24)<formula>formula see original document page 41</formula>是分析波形图形。因此,对象声音频率图形S1702可表现为 (数学式25)<formula>formula see original document page 41</formula>其中t是分析的对象声音的开端的时刻。对象声音频率图形表现对象声音的频率的时间结构。在该例子中,将t错开l个点(point)的同 时计算对象声音频率图形。首先,通过启动助听系统1700,评价声音准备部1703利用麦克风 开始取入作为评价声音S1700的使用者的周边的声音、即3人的声音 的混合声音。在该例子中,以包含多个A君的声音的基本周期的30ms 的间隔取入评价声音。即,每30ms区分混合声音的同时输入,分析A 君的基本周期。并且,对评价声音S1700进行频率分析,做成每个频 带的评价声音频率图形S1701 (步骤1801)。做成评价声音频率图形 的方法与做成对象声音频率图形的方法相同,将对象声音置换为评价 声音S1700进行计算。将某个时刻的评价声音频率图形表示为 (数学式26)<formula>formula see original document page 42</formula>其中,N是傅立叶变换的窗口长度,设为比评价声音S1700的长度L短。 其中,k是分析的频带的索引。并且, (数学式27)<formula>formula see original document page 42</formula>是评价声音。并且,评价声音频率图形S1701可表现为 (数学式28)<formula>formula see original document page 42</formula>接着,分析在由3人的声音的混合声音构成的评价声音S1700中, 是否包含有对象声音准备部1702中存储的对象声音、即A君的声音的 基本周期(步骤1802)。具体地,在分析部1704中,对每个频带将对 象声音频率图形S1702相对于评价声音频率图形S1701进行时移的同 时,依次计算对应的时刻的评价声音频率图形S1701和对象声音频率
图形S1702的差分值。分析部1704基于在阈值S1705以下的差分值的 重复时间间隔来分析对象声音的基本周期。并且,分析部1704利用基 本周期S1706向声音提取部1705输出在评价声音S1700中对象声音存 在时间—频率区域有关的信息、即区域信息S1703。图24A 图24C表示分析部1704中的分析对象声音的基本周期的 方法的一例。在该例子中,示出频带k的评价声音频率图形是对象声 音(对象声音频率图形)的情况。在该例子中,对每个频带求出差分 值。图24A中示出频带k的评价声音频率图形的一例。在该例子中从 当前时刻追溯而截取30ms的混合声音的频率图形来作为评价声音频率 图形XHk(t)。在该例子中,评价声音频率图形由5个周期的对象声 音的A君的声音构成。图24B示出频带k的对象声音频率图形的一例。在该例子中,将2 个周期的A君的声音的频率图形作为对象声音频率图形XTk (t)。图24C是示出在频带k中,将对象声音频率图形S1702相对于评 价声音频率图形S1701进行时移时的差分值。在该例子中,使用欧几 里德距离作为差分值。其中,将差分值表现为 (数学式29)五* ("0 = I]:::—" V阿(w ")-灯* 0 = 1,2,..., AO ,『丄-W —AO其中,ni是将时间离散化的值,对应于求出差分值的评价声音频率图形 S1701的开端的时刻。该差分值是将时间宽度(W—N)中的评价声音频 率图形和对象声音频率图形的差分进行总计的值。在该例子中,评价 声音频率图形是对象声音频率图形,所以差分值的重复时间间隔与对 象声音的基本周期S1706 (3ms 12ms) —致。在该例子中是6ms。在此,导入阈值S1705。在此,将频带k中的阈值S1705表示为 k。在该例子中,阈值S1705在助听系统出厂之前存储在分析部1704 中,考虑对象声音频率图形的基本波形图形的摇摆宽度而设定为比由 差分值的最小值的摇摆引起的变动的最大值稍大的值。在图24C中示出频带k中的对象声音的基本周期的分析方法。在 该例子中求出在阈值0k以下的数学式29所示的差分值的重复时间间 隔。在该例子中,评价声音频率图形是对象声音频率图形,所以差分 值的最小值成为非常接近零的值。因此,在阈值Ok以下的差分值的 重复时间间隔与不考虑阈值的差分值的重复时间间隔一致。由此,评 价声音频率图形S1701的基本周期成为6ms。接着,评价声音频率图形的基本周期是6ms,是作为对象声音的基 本周期S1706的3ms 12ms的范围内,所以判断为在评价声音频率图 形S1701中存在对象声音,做成称为"在频带k中存在对象声音"的 区域信息S1703。此外,在图25A 图25C中表示,在分析部1704中,评价声音频 率图形不同于对象声音(对象声音频率图形)且具有与对象声音相同 的基本周期的声音的频率图形的情况的一例。在图25A中示出频带k的评价声音频率图形的一例。在该例子中, 从当前时刻追溯而截取30ms的混合声音的频率图形而作为评价声音频 率图形XHk (t)。在该例子中,评价声音频率图形由5个周期的不同 于对象声音的B君的声音构成,基本周期与对象声音相同,是6ms。图25B中示出频带k的对象声音频率图形的一例。在该例子中, 与图24B同样地将2个周期的A君的声音的频率图形作为对象声音频 率图形XTk (t),基本周期是6ms。在图25C中示出将对象声音频率图形S1702相对于频带k的评价 声音频率图形S1701进行时移时的差分值。在该例子中,与图24C同 样地,使用欧几里德距离作为差分值。在该例子中,评价声音频率图 形是具有与对象声音(对象声音频率图形)相同的基本周期的声音,所以差分值的重复时间间隔与对象声音的基本周期一致而成为6ms。在此,导入阈值S1705。在该例子中,阈值S1705在助听系统出厂 之前存储在分析部1704中,考虑对象声音频率图形的基本波形图形的
摇摆宽度而设定为比由差分值的最小值的摇摆引起的变动的最大值稍大的值。该值与图24C的例子相同。在图25C中示出频带k中的、对象声音的基本周期的分析方法。 在该例子中,求出在阈值0k以下的数学式29所示的差分值的重复时 间间隔。在该例子中,评价声音频率图形是不同于对象声音(对象声 音频率图形)的声音,所以差分值的最小值离开零而成为较大的值。 因此,不存在阈值e>k以下的差分值的重复时间间隔。接着,评价声音频率图形的基本周期不存在,不是作为对象声音 的基本周期S1706的3ms 12ms的范围内,所以判断为在评价声音频 率图形S1701中不存在对象声音,做成称为"在频带k中不存在对象 声音"的区域信息S1703。并且,频带k的评价声音频率图形是基本周期不同于对象声音的 声音的情况下,在分析部1704中,频带k的评价声音频率图形S1701 的基本周期中不出现对象声音的基本周期S1706,所以判断为在评价声 音频率图形S1701中不存在对象声音而做成"在频带k中不存在对象 声音"那样的区域信息S1703。对所有频带k (k=l, 2,, N)进行这些处理,做成最终的区域 信息S1703。接着,声音提取部1705利用区域信息S1703和评价声音频率图形 1701,提取对象声音而向使用者提示(步骤1803)。在该例子中,在评价声音频率图形S1701中,将区域信息S1703 中记载为"频带k中不存在对象声音"的时间一频率区域的频率图形 置换为零的值,记载为"在频带k中存在对象声音"的时间一频率区 域的频率图形使用评价声音频率图形S1701,做成提取声音频率图形。 并且,通过对提取声音的频率图形进行逆傅立叶变换,从而做成提取 声音S1704,利用扬声器向使用者提示。最后,到助听系统1700停止为止,重复这些从步骤1801到步骤 1803的动作(步骤1804)。
如以上说明那样,根据本发明的第二实施方式,计算评价声音频 率图形和对象声音频率图形的差分值,基于在预定阈值以下的差分值 的重复间隔来分析基本周期,所以能够将不同于对象声音且具有与对 象声音相同的基本周期的声音和对象声音进行区分来分析基本周期。 在此,使用对评价声音和对象声音进行频率分析的评价声音频率图形 和对象声音频率图形,所以能够对每个频带分析基本周期。例如,对 每个频带,从混合声音的频率图形中提取对象声音的频率图形,从而 能够实现混合声音分离。由此,能够判断在评价声音中是否包含有对 象声音。(第二实施方式的变形例)对第二实施方式的变形例进行说明。图26是表示本发明的第二实 施方式的变形例的对象声音分析装置的整体结构的框图。在此,除了 图20所示的助听系统1700以外,追加了声音信息设定部2300.助听系统1800具备基本周期分析部1801和声音提取部1705。基 本周期分析部1801具备声音信息设定部2300、对象声音准备部2301、 评价声音准备部1703和分析部1704。在分析部1704中存储有阈值S1705。声音信息设定部2300设定与 对象声音有关的声音信息S2300而向对象声音准备部2301输出。对象 声音准备部2301基于声音信息S2300准备对象声音频率图形S1702, 并且准备对象声音的基本周期S1706,向分析部1704输出对象声音频 率图形S1702和基本周期S1706。评价声音准备部1703输入评价声音 S1700,对评价声音S1700进行频率分析,向分析部1704输出每个频 带的评价声音频率图形S1701。分析部1704对于每个频带将对象声音 频率图形S1702相对于评价声音频率图形S1701进行时移,依次计算 对应的吋刻的评价声音频率图形S1701和对象声音频率图形S1702的 差分值。分析部1704基于在阈值S1705以下的差分值的重复时间间隔 的周期和对象声音的基本周期S1706,将在评价声音S1700中对象声音 存在的时间一频率区域有关的信息、即区域信息S1703向声音提取部 1705输出。声音提取部1705利用区域信息S1703和评价声音频率图形 S1701提取对象声音向使用者提示。接着,说明如上那样构成的助听系统1800的动作。图27是表示助听系统1800的动作顺序的其它流程图。在该例子中,在助听系统1800出厂之前,在分析部1704中存储 有阈值S1705。在该例子中,阈值S1705设定为稍大于零的值、即O. 5。首先,声音信息设定部2300利用麦克风取得声音信息S2300、即 A君的声音并向对象声音准备部2301输出(步骤2400)。接着,对象声音准备部2301通过截取作为声音信息S2300的A君 的声音的一部分并进行频率分析,准备对象声音频率图形S1702 (步骤 2401)。在该例子中,与第二实施方式同样地进行逆傅立叶变换而做 成对象声音频率图形。并且,求出A君的声音的基本周期作为基本周 期S1706。在该例子中,由于成为对象的声音仅是A君的声音,不含基 本周期与A君的声音相同的其它声音,所以求出A君的声音的基本周 期的方法利用第一现有技术。接着,通过启动助听系统1800,评价声音准备部1703利用麦克风, 开始取得作为评价声音S1700的使用者的周边的声音、即3人的声音 的混合声音。并且,对评价声音S1700进行频率分析,做成每个频带 的评价声音频率图形S1701 (步骤1801)。接着,分析在由3人的声音的混合声音构成的评价声音频率图形 S1701中,是否包含有对象声音准备部2301准备的对象声音频率图形 S1702、即A君的声音的基本周期,做成区域信息1703 (步骤1802)。接着,声音提取部1705利用区域信息S1703和评价声音频率图形 S1701提取对象声音,向使用者提示(步骤1803)。这里的步骤1801、步骤1802、步骤1803与第二实施方式相同, 所以省略说明。最后,到助听系统1800停止为止,重复这些从步骤1801到步骤 1803的动作(步骤1804)。
如上说明,对象声音准备部2301将声音信息设定部2300输入的 对象声音作为准备的对象声音,所以对象声音准备部2301不需要事先 存储成为对象声音的候补的多个声音,可减小存储容量。 (其它例子)说明声音信息设定部2300和对象声音准备部2301的其它例子。图27是表示助听系统1800的动作顺序的其它流程图。在该例子中,在助听系统1800出厂之前,在对象声音准备部2301 中作为对象声音频率图形的候补而存储有A君的声音的频率图形、B 君的声音的频率图形和C君的声音的频率图形。并且,在对象声音准 备部2301中存储有与每个对象声音(对象声音频率图形)的候补对应 的基本周期。并且,在分析部1704中存储有阈值S1705。首先,声音信息设定部2300向使用者提示对象声音的候补。在此, 选择A君的声音而做成称为"A君的声音"的选择信号(步骤2400)。接着,对象声音准备部2301将与作为声音信息S2300的选择信号 对应的对象声音频率图形作为对象声音频率图形S1702 (步骤2401)。 在该例子中,A君的声音的频率图形是对象声音频率图形S1702,并且, 将对应于选择信号的对象声音的基本周期作为基本周期S1706。在该例 子中,基本周期S1706是A君的声音的基本周期、即3ms 12ms。接着,通过启动助听系统1800,评价声音准备部1703利用麦克风, 开始取得作为评价声音S1700的使用者的周边的声音、即3人的声音 的混合声音。并且,对评价声音S1700进行频率分析,做成每个频带 的评价声音频率图形S1701 (步骤1801)。接着,分析在由3人的声音的混合声音构成的评价声音频率图形 S1701中,是否包含有对象声音准备部2301准备的对象声音频率图形 S1702、即A君的声音的基本周期,做成区域信息1703 (步骤1802)。接着,声音提取部1705利用区域信息S1703和评价声音频率图形 S1701提取对象声音,向使用者提示(步骤1803)。这里的步骤1801、步骤1802、步骤1803与第二实施方式相同,
所以省略说明。最后,到助听系统1800停止为止,重复这些从步骤1801到步骤 1803的动作(步骤1804)。如上说明,能够利用对象声音准备部2301存储的对象声音频率图 形的候补来准备对象声音频率图形,所以不需输入对象声音并进行频 率分析而做成对象声音频率图形。由此,在不能输入对象声音的情况 下,也能够分析对象声音的有无。例如,在分析噪声下的A君的声音 的基本周期的情况下,在噪声下不能收集安静的环镜下的A君的声音, 所以利用对对象声音准备部2301存储的安静的环镜下的A君的声音进 行频率分析而做成的对象声音频率图形,从而可以分析有无A君的声 音。并且,能够省略输入对象声音的时间或对输入的对象声音进行频 率分析的时间,所以能够进行实时处理。并且,与第一实施方式的第二变形例同样,也可以追加阈值设定 部而控制分析部1704使用的阈值。由此,能够对多个对象声音设定适 当的阈值,能够相对于多个对象声音分析基本周期。并且,通过适当 地控制阈值,能够减少基本周期的分析错误。并且,在第一实施方式 的第二变形例中,对每个对象声音设定了阈值,但也可以进一步对每 个频带设定阈值。由此,能够进一步减少分析错误。 (另一其它例子)更好是,对象声音准备部2301准备对象声音频率图形,该对象声 音频率图形包含通过对象声音和由预定的频率成分构成的非周期性的 分析波形图形间的互相关计算出的振幅频谱及相位频谱的至少一个, 评价声音准备部1703准备包含通过评价声音和上述分析波形图形间的 互相关而计算出的振幅频谱及相位频谱的至少一个的评价声音频率图 形。图28表示非周期性的分析波形图形的一例。在该例子中,将1.5 个周期的余弦波形的图形和正弦波形的图形作为分析波形图形。具体 地,将第二实施方式中的取数学式22和数学式26的右边的总和的n
范围,按每个分析的频带k设定为数学式24的余弦波形图形和正弦波 形图形成为1.5个周期,求出频率图形。具体地,将数学式25和数学 式28的右边的总和的N的值对每个频带k调节为1. 5个周期,求出频 率图形。由此,利用由非周期性分析波形图形做成的对象声音频率图形及 评价声音频率图形来分析对象声音的基本周期,所以出现对象声音及 评价声音的周期性的特征,所以能够分析对象声音的基本周期。例如, 在比对象声音的基本周期还要高的频带的对象声音频率图形中,也出 现对象声音的基本周期,所以即使在与对象声音的基本周期对应的频 带上附加杂音,也能够分析基本周期。并且,在所有频带中,在对象 声音频率图形中出现对象声音的基本周期,所以能够对每个频带分析 基本周期。由此,能够判断在评价声音中是否包含有对象声音。 (再一其它例子) '更好是,对象声音准备部2301准备对象声音频率图形,该对象声 音频率图形包含通过对象声音和构成由预定的频率成分构成的分析波 形图形的一部分并具有预定的时间分辨率的多个局部分析波形图形的 各个互相关而计算出的振幅频谱及相位频谱的至少一个。评价声音准 备部1701准备评价声音频率图形,该评价声音频率图形包含通过评价 声音和上述多个局部分析波形图形的各个互相关而计算出的振幅频谱 及相位频谱的至少一个。分析部1704将使用上述多个局部分析波形图 形准备的对象声音频率图形和使用上述多个局部分析波形图形准备的 评价声音频率图形,各作为一组数据来使用,分析对象声音的基本周 期,判断有无对象声音。图29表示对象声音频率图形及评价声音频率图形的做成方法的一例。图29(a)中示出由3个周期的余弦波形图形构成的分析波形图形。 将该分析波形图形重叠在评价声音或对象声音上做成了频率图形时, 用3个周期的余弦波形图形求出1个值,所以时间分辨率成为3个周
期的余弦波形图形的长度。另一方面,如图29 (b)所示,准备构成分析波形图形的一部分并 具有预定的时间分辨率的多个局部分析波形图形,对每个局部波形图 形求出1个值时,时间分辨率减小。在该例子中,成为0.5个周期的 余弦波形图形的长度。由此,通过细化时间分辨率,出现时间性的频 率结构的变化,基本周期的形状变得明确。在此,描述将利用多个局部分析波形图形准备的频率图形作为一 组数据使用、而对用3个周期的余弦波形图形求出的频率图形具有的 频率信息进行处理的技术。在该例子中,利用离散余弦变换做成频率图形。将由3个周期的余弦波形图形构成的分析波形图形中的频率图形 表现为(数学式30)—V"3周期 (2W - 1)7^,A/ =丄"辜、q cos ^,将局部分析波形图形中的频率图形表现为(数学式31)乂/ = 2U-始fcX"q cos ~~~~(数学式32)v2 v^周期 (2" — l);zity(数学式33)y3 一 V11.5周期 (2" 一A/ =丄w周期X"Q cos ^~(数学式34)(数学式35) (数学式36)3周期 (2打一1)t^:,,但是,(数学式37)为,N是离散余弦变换的窗口长度的采样数。并且,将评价声音或对象声音设为(数学式38) Xn在此,分析波形图形中的频率图形和局部分析波形图形中的频率图形 的关系表现为(数学式39)<formula>formula see original document page 52</formula>由此,能够通过将利用6个局部分析波形图形准备的频率图形作 为一组数据使用,从而可以做成分析波形图形中的频率图形,所以通 过将局部分析波形图形中的频率图形作为一组数据使用,可以与分析 波形图形中的频率图形同等地处理。这样,可知将6个局部分析波形图形中的频率图形作为1组数据 处理,是在分析波形图形中的频率图形具有的频率信息上还附加了与 时间性的频率结构的变化有关的信息。图30示出频率图形的其它做成方法的一例。图30 (a)中示出由与图29 (a)相同的3个周期的余弦波形图形 构成的分析波形图形。将该分析波形图形重叠在评价声音或对象声音 上做成了频率图形时,由3个周期的余弦波形图形求出1个值,所以 时间分辨率成为3个周期的余弦波形图形的长度。另一方面,如图30 (b)所示,准备构成分析波形图形的一部分并 具有预定的时间分辨率的多个局部分析波形图形,对每个局部波形图 形求出1个值,则时间分辨率细化。在该例子中,成为1个周期的余 弦波形图形的长度。在该例子中,分析波形图形的频率图形可以用3个频率图形的和 来表现,所以,将利用3个局部分析波形图形准备的频率图形作为一 组数据使用,从而能够与通过3个周期的余弦波形图形求出的频率图 形同等地处理。图31 (a)表示利用图30的局部分析波形图形分析的3人的声音 的混合声音的、2KHz上的频率图形。图31 (b)表示利用图30的局部 分析波形图形分析的A君的声音的、2KHz上的频率图形。在该列子中, 可知在混合声音的频率图形中明确地出现了 A君的声音的频率图形的 基本周期。在图32中示出图30的例子中的分析波形图形中的频率图形和局 部分析波形图形中的频率图形的关系。在该例子中,将对象声音表现 为BT (n),将评价声音表现为BH (n)。将这时的对象声音的分析波形图形中的频率图形表现为 (数学式40)")=iT:w"+") &咖^^1 ('=。,1,…,^ 一 w,将对象声音的局部分析波形图形中的频率图形表现为 <formula>formula see original document page 54</formula>(数学式42)<formula>formula see original document page 54</formula>(数学式43)灯;w=i::期周期w"+")(f=0,1,…,『一w。其中,W与第二实施方式相同,N是离散余弦变换的窗口长度的采样 数,Ck是数37。并且,将评价声音中的分析波形图形中的频率图形表 现为(数学式44)<formula>formula see original document page 54</formula>,将对象声音的局部分析波形图形中的频率图形表现为 (数学式45)<formula>formula see original document page 54</formula>(数学式46)<formula>formula see original document page 54</formula>(数学式47)。其中,W与第二实施方式相同,N是离散余弦变换的窗口长度的采样 数,Ck是数37。在该例子中,在频带f中,将对象声音频率图形相对于评价声音 频率图形进行时移时的差分值,用欧几里德距离表现。这时,分析波 形图形中的频率图形上的差分值可以表现为 (数学式48) 五<formula>formula see original document page 55</formula>。在此,将局部分析波形图形中的频率图形的差分值表现为(数学式49)<formula>formula see original document page 55</formula>在此,若利用图32考虑频率图形XH和频率图形XT的距离,则分 析波形图形中的频率图形的距离是平面XH的切片XHf和平面XT的切 片XTf的距离,相对于此,局部分析波形图形中的频率图形的距离还 考虑2个平面XH和平面XT的平面上的坐标的距离。gp,考虑频率图 形微小的时间图形。由此,将利用多个局部分析波形图形准备的对象声音频率图形和 利用多个局部分析波形图形准备的评价声音频率图形,分别用作一组 数据而分析基本周期,所以处理分析波形图形中的频率分辨率的频率 信息的时间性的频率结构的变化,犹如细化频率分辨率,可以分析基 本周期。(第三实施方式)图33是表示本发明的第三实施方式的对象声音分析装置的整体结 构的框图。在此,示出本发明的对象声音分析装置组装在车辆检测系 统中的一例。在本实施方式中,将通过分析摩托车声音的基本周期来 判断在使用者的周边存在摩托车声音而向使用者通知摩托车接近的情 况为例进行说明。在该例子中,取代图2所示的基本周期分析部101 而使用基本周期分析部3003。基本周期分析部3003除了图20的基本 周期分析部1701的结构以外追加了频率设定部3000。频率设定部3000 是对分析单元中使用的对象声音频率图形及评价声音频率图形的频带 进行设定的频率设定单元的一例。车辆检测系统3002具备基本周期分析部3003和警告声音输出部 105。基本周期分析部3003具备对象声音准备部1702、评价声音准备 部1703、频率设定部3000和分析部3001。在该例子中,频率设定部3000利用图33中的"频带信息AS3001A" 设定频带信息S3000。并且,不使用图33中的"频带信息BS3001B" 和"频带信息CS3001C"。在对象声音准备部1702中存储有对对象声音进行频率分析而得到 的每个频带的对象声音频率图形S1702和对象声音的基本周期S1706。 在分析部3001中存储有阈值S1705。对象声音准备部1702向分析部 3001输出对象声音频率图形S1702和基本周期S1706。评价声音准备 部1703输入评价声音S100而对评价声音S100进行频率分析,向分析 部3001输出每个频带的评价声音频率图形S1701。频率设定部3000 输入频带信息AS3001A做成频带信息S3000而向分析部3001输出。分 析部3001在基于频带信息S3000的频带中,将对象声音频率图形S1702 相对于评价声音频率图形S1701进行时移的同时,依次计算对应的时 刻的评价声音频率图形S1701和对象声音频率图形S1702的差分值。 分析部3001基于在阈值S1705以下的差分值的重复时间间隔的周期和 对象声音的基本周期S1706,判断评价声音SIOO中有无对象声音,在 存在对象声音时向警告声音输出部105输出检测信号S102。在输入了 检测信号S102时,警告声音输出部105向使用者提示警告声音S103。 接着,说明如上那样构成的车辆检测系统3002的动作。 图34是表示车辆检测系统3002的动作顺序的流程图。 在该例子中,车辆检测系统出厂之前,在对象声音准备部102中存 储有对摩托车声音进行频率分析而得到的每个频带的频率图形作为对 象声音频率图形S1702 (步骤1800),进而存储有作为对象声音的摩托 车声音的基本周期S1706。并且,在分析部3001中,对每个频带存储有 阈值S1705。首先,通过启动车辆检测系统3002,评价声音准备部1703利用麦 克风开始取入作为评价声音S100的使用者的周边的声音。并且,对评
价声音S100进行频率分析,做成每个频带的评价声音频率图形S1701 (步骤1801)。接着,使用者利用频率设定部3000输入分析基本周期的频带。在 该例子中,输入作为对象声音的摩托车声音的功率大的200Hz和500Hz 的频带。并且,向分析部3001输出作为频带信息S3000的"200Hz、 500Hz"(步骤3100)。并且,考虑包含在评价声音SIOO中的杂音而 在200Hz中附加了杂音的情况下,仅将500Hz设定为分析基本频率的 频带。接着,分析在评价声音SIOO中是否包含有存储在对象声音准备部 1702中的对象声音、即摩托车声音的基本周期(步骤3101)。在该例 子中,频带信息S3000是"200Hz和500Hz",所以在200Hz中的频率 图形和500Hz的频率图形中,与第二实施方式同样地分析对象声音的 基本周期。接着,在200Hz及500Hz的分析结果中,任一个被判断为 存在对象声音时,向警告声音输出部105输出所谓"存在对象声音" 的检测信号S102。并且,在判断为任一个频带中都不存在对象声音时, 不向警告声音输出部105输出检测信号S102。接着,在输入了检测信号S102时,警告声音输出部105向使用者 提示警告声音S103 (步骤203)。这里的步骤1800、步骤180K步骤203与第一实施方式和第二实施方式相同,所以省略说明。最后,到车辆检测系统3002停止为止,重复这些步骤1801、步骤3100、步骤3101、步骤203的动作。如以上说明那样,可以利用频率设定部3000来控制分析部3001 中使用的对象声音频率图形及评价声音频率图形的频带。由此,能够 变更分析的频带或者变更分析的频带的带宽。例如,在分析混合了对 象声音和杂音的评价声音时,能够选择没有杂音的频带而分析评价声 音的基本周期,由此能够判断有无对象声音。 (其它例子)子。在该例子中,频率设定部3000利用图33中的"频带信息BS3001B" 和"频带信息CS3001C"来设定频带信息S3000。并且,不使用图33 中的"频带信息AS3001A"。在对象声音准备部1702中存储有对对象声音进行频率分析而得到 的每个频带的对象声音频率图形S1702和对象声音的基本周期S1706。 在分析部3001中存储有阈值S1705。对象声音准备部1702向分析部 3001输出对象声音频率图形S1702和基本周期S1706。评价声音准备 部1703输入评价声音S100而对评价声音S100进行频率分析,向分析 部3001输出每个频带的评价声音频率图形S1701。频率设定部3000 输入作为评价声音S100的频带信息CS3001C并从对象声音准备部 S1702输入频带信息BS3001B来做成频带信息S3000而向分析部3001 输出。分析部3001在基于频带信息S3000的频带中,将对象声音频率 图形S1702相对于评价声音频率图形S1701进行时移的同时,依次计 算对应的时刻的评价声音频率图形S1701和对象声音频率图形S1702 的差分值。分析部3001基于在阈值S1705以下的差分值的重复时间间 隔的周期和对象声音的基本周期S1706,判断评价声音S100中是否存 在对象声音。分析部3001在存在对象声音时向警告声音输出部105输 出检测信号S102。在输入了检测信号S102时,警告声音输出部105 向使用者提示警告声音S103。接着,说明如上那样构成的车辆检测系统3002的动作。 图34是表示车辆检测系统3002的动作顺序的流程图。 在该例子中,车辆检测系统出厂之前,在对象声音准备部1702中 存储有对摩托车声音进行频率分析而得到的每个频带的频率图形作为 对象声音频率图形S1702 (步骤1800),进而存储有作为对象声音的摩 托车声音的基本周期S1706。并且,在分析部3001中,对每个频带存储 有阈值S1705。首先,通过启动车辆检测系统3002,评价声音准备部1703利用麦
克风开始取入作为评价声音S100的使用者的周边的声音。并且,对评 价声音S100进行频率分析,做成每个频带的评价声音频率图形S1701 (步骤1801)。接着,频率设定部3000从作为频带信息BS3001B的对象声音中选 择对象声音的功率大的频带。在此,选择200Hz和500Hz。并且,从作 为频带信息CS3001C的评价声音S100中选择包含在评价声音的杂音的 功率大的频带。在此,选择200Hz。并且,根据这些,将对象声音的功 率大且不包含杂音的频带设定为频带信息S3000。在该例子中,频带信 息S3000成为"500Hz"。接着,分析在评价声音SIOO中是否包含有存储在对象声音准备部 1702中的对象声音、即摩托车声音的基本周期(步骤3101)。在该例 子中,频带信息S3000是"500Hz",所以在500Hz的频率图形中,与 第二实施方式同样地分析对象声音的基本周期。接着,在500Hz的分 析结果中,判断为存在对象声音时,向警告声音输出部105输出所谓 "存在对象声音"的检测信号S102。接着,在输入了检测信号S102时,警告声音输出部105向使用者 提示警告声音S103 (步骤203)。这里的步骤1800、步骤180K步骤203与第一实施方式和第二实 施方式相同,所以省略说明。如以上说明那样,频率设定部3000能够自动地求出适合于对象声 音的频带,所以使用者不需要设定频带,使用方便性较好。工业可利用性本发明的对象声音分析装置可以在装有混合声音分离、声音识别、 声音合成的功能的车辆检测系统、助听器、便携式电话、电视会议系 统等范围较广的产品上展开,实用性价值极高。
权利要求
1.一种对象声音分析装置,分析在评价声音中是否包含对象声音,其特征在于,具备对象声音准备单元,准备为了分析基本周期而使用的分析波形、即对象声音;评价声音准备单元,准备被分析基本周期的被分析波形、即评价声音;分析单元,使上述对象声音相对于上述评价声音进行时移,依次计算对应的时刻的上述评价声音和上述对象声音的差分值,计算该差分值为预定阈值以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音的基本周期,来判断在上述评价声音中是否存在上述对象声音。
2. 如权利要求1所述的对象声音分析装置,其特征在于, 上述对象声音准备单元准备通过对上述对象声音进行频率分析而得到的对象声音频率图形;上述评价声音准备单元准备通过对上述评价声音进行频率分析而 得到的评价声音频率图形;上述分析单元使上述对象声音频率图形相对于上述评价声音频率 图形进行时移的同时,依次计算对应的时刻的上述评价声音频率图形和 上述对象声音频率图形的差分值,计算上述差分值为预定阈值以下的时 刻的重复间隔,基于该重复间隔的周期和上述对象声音的基本周期,来 判断在上述评价声音中是否存在上述对象声音。
3. 如权利要求2所述的对象声音分析装置,其特征在于, 上述对象声音准备单元准备对象声音频率图形,该对象声音频率图形通过上述对象声音和由预定的频率成分构成的非周期性分析波形间 的互相关来计算、且包含振幅谱及相位谱中的至少一个;上述评价声音准备单元准备评价声音频率图形,该评价声音频率图形通过评价声音和上述分析波形间的互相关来计算、且包含振幅谱及相 位谱的至少一个。
4. 如权利要求2所述的对象声音分析装置,其特征在于, 上述对象声音准备单元准备对象声音频率图形,该对象声音频率图形通过上述对象声音和构成由预定的频率成分构成的分析波形的一部 分并具有预定的时间分辨率的多个局部分析波形间的各个互相关来计 算、且包含振幅谱及相位谱的至少一个;上述评价声音准备单元准备评价声音频率图形,该评价声音频率图 形通过上述评价声音和上述多个局部分析波形间的各个互相关来计算、 且包含振幅谱及相位谱的至少一个;上述分析单元将使用上述多个局部分析波形准备的上述对象声音 频率图形和使用上述多个局部分析波形准备的上述评价声音频率图形, 各作为一组数据使用,来分析上述对象声音的基本周期。
5. 如权利要求2所述的对象声音分析装置,其特征在于, 上述对象声音分析装置还具备频率设定单元,该频率设定单元设定在上述分析单元中使用的对象声音频率图形及评价声音频率图形的频 带;上述分析单元使用由上述频率设定单元设定的上述频带的上述对 象声音频率图形及上述评价声音频率图形,分析上述对象声音的基本周 期。
6. 如权利要求l所述的对象声音分析装置,其特征在于, 在上述重复间隔的周期与上述对象声音的基本周期大致相等时,上述分析单元判断为在上述评价声音中存在上述对象声音,在上述重复间 隔的周期与上述对象声音的基本周期大致不相等时,上述分析单元判断 为在上述评价声音中不存在上述对象声音。
7. 如权利要求6所述的对象声音分析装置,其特征在于, 上述对象声音准备单元存储有上述多个对象声音的候补或上述多个对象声音频率图形的候补;上述声音信息设定单元接收选择信号,该选择信号用于选择上述多 个对象声音的候补及上述多个对象声音频率图形的某一个;上述对象声音准备单元将根据上述选择信号选择的对象声音的候 补或对象声音频率图形的候补,作为准备的上述对象声音或准备的上述 对象声音频率图形。
8. 如权利要求l所述的对象声音分析装置,其特征在于, 上述对象声音分析装置还具备设定与上述对象声音关联的声音信息的声音信息设定单元;上述对象声音准备单元基于设定的上述声音信息准备上述对象声 音或上述对象声音频率图形。
9. 如权利要求8所述的对象声音分析装置,其特征在于, 上述声音信息设定单元接收对象声音的输入,将所输入的上述对象声音作为上述声音信息;上述对象声音准备单元将所输入的上述对象声音作为准备的上述 对象声音,或者,通过进一步对该对象声音进行频率分析来准备上述对 象声音频率图形。
10. 如权利要求l所述的对象声音分析装置,其特征在于, 上述对象声音分析装置还具备阈值设定单元,该阈值设定单元将上述对象声音相对于多个评价声音的每一个进行时移的同时,依次计算对 应的时刻的上述评价声音和上述对象声音的差分值,来计算上述差分值 的最小值,并基于与上述多个评价声音对应的多个上述最小值中的最大 值,设定上述预定阈值。
11. 一种对象声音分析方法,分析在评价声音中是否包含对象声音, 其特征在于,包括准备为了分析基本周期而使用的分析波形、即对象声音的步骤; 准备被分析基本周期的被分析波形、即评价声音的步骤; 使上述对象声音相对于上述评价声音进行时移,依次计算对应的时 刻的上述评价声音和上述对象声音的差分值,基于上述差分值成为预定 阈值以下的时刻的重复间隔的周期和上述对象声音的基本周期,判断在 上述评价声音中是否存在上述对象声音。
12. —种对象声音分析程序,分析在评价声音中是否包含对象声音, 其特征在于,使计算机执行如下步骤-准备为了分析基本周期而使用的分析波形、即对象声音的步骤; 准备被分析基本周期的被分析波形、即评价声音的步骤; 使上述对象声音相对于上述评价声音进行时移,依次计算对应的时 刻的上述评价声音和上述对象声音的差分值,计算上述差分值成为预定 阈值以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音的 基本周期,来判断在上述评价声音中是否存在上述对象声音。
全文摘要
一种对象声音分析装置,对具有与对象声音相同的基本周期且不同于对象声音的声音和对象声音进行区分,能够分析包含在评价声音中的对象声音,该对象声音分析装置分析在评价声音(S100)中是否包含对象声音(S101),具备对象声音准备部(102),准备为了分析基本周期而使用的分析波形、即对象声音(S101);评价声音准备部(102),准备被分析基本周期的被分析波形、即评价声音(S100);分析部(104),将上述对象声音(S101)相对于上述评价声音(S100)进行时移的同时,依次计算对应的时刻的上述评价声音(S100)和上述对象声音(S101)的差分值,计算该差分值成为预定阈值(S104)以下的时刻的重复间隔,基于该重复间隔的周期和上述对象声音(S101)的基本周期,判断在上述评价声音(S100)中是否存在上述对象声音(S101)。
文档编号G10L11/00GK101213589SQ20068002361
公开日2008年7月2日 申请日期2006年12月21日 优先权日2006年1月12日
发明者中藤良久, 芳泽伸一, 铃木哲 申请人:松下电器产业株式会社