专利名称:语音通话装置及车载装置的制作方法
技术领域:
本发明涉及语音通话装置中的用户接ロ。例如,涉及搭载于汽车等车辆中使用的语音通话装置。
背景技术:
目前,以汽车驾驶中的通话为目的,研发了驾驶员不需手持收发通话器(移动电话)即可通话的免提电话装置,并且已在销售。在通常的免提电话装置中,麦克风被设置在远离通话者(驾驶员)的嘴部的位置。因此,免提电话装置在其内部进行将与通话语音一起输入到麦克风中的杂音(行使噪声等通话语音不需要的声音)去除的信号处理。 但是,该信号处理也影响到通话语音。具体地讲,产生使通话语音的质量变差等副作用。因此,通常在研发阶段研究能够尽可能地减小该副作用、而且尽可能地降低杂音的信号处理的内容,将适用了被判定为最佳的设定内容的产品出厂。可是,实际情况是根据通话者的语音的大小和音质、杂音的类型和大小等,被视为最佳的设定的内容大不相同。因此,过去提出了这样的技木,预先对免提电话装置设定多个设定值,以便能够随时选择最佳的设定值。例如,提出了具有下述功能的免提电话装置,即通话者本人能够随时根据状况来选择所适用的设定值。并且,例如还提出了具有下述功能的免提电话装置,即在装置侧随时根据语音和杂音的大小自动选择所适用的设定值。但是,诸如要求变更信号处理的设定值的情况往往是通话者的声音较小的情況、汽车的窗户打开的情况、正在使用空调功能的情况等。如果是这种情况,不至于变更信号处理的设定,通过通话者增大语音、关闭窗户或者停止空调,都能够有效地提高通话音质。因此,正在研究将当前的通话音质反馈给利用者的结构。专利文献I公开了下述的结构,在IP(Internet Protocol,因特网协议)电话机中,将当前使用的线路的传输质量通知利用者。该文献提供了下述的结构,将用于评价线路质量的客观指标提示给利用者,由此利用者能够容易掌握通信状況。专利文献2公开了以移动电话为对象、将通信状况提示给利用者的技木。专利文献3的目的与专利文献I相同,公开了将通话语音的回声量提示给利用者的技木。专利文献3能够将通话语音的实际质量提示给利用者,这一点与专利文献I不同。现有技术文献专利文献专利文献I日本特开2008-211670号公报专利文献2日本特开2008-211361号公报专利文献3日本特开2007-329630号公报非专利文献非专利文献I
ITU-T Recommendation P. 862 ,Perceptual evaluationof speech quality (PSEQ) An objective metnod for ena-to-end speecn qualityassessment of narrow-band telephone networks and speech codecs,,非专利文献2ITU-T Recommendation Ρ· 861 Objective qualitymeasurement of telephoneband(300_3400Hz)speech codecs,,非专利文献3ETSIEG 202 396-3 VI. 2. I 'Speech Processing,Transmissionand Quality Aspects (STQ) ;Speech Quality performance in the presence ofbackground noise, Part 3 Background noise transmission-objective bestmethods, ” 2009-0非专利文献4VDA Specification for Car Hands-free Terminals非专利文献5Pattern Recognition and Machine Learning, Bishop 著,Springer-Verlag 期干丨J 发明概要发明要解决的问题的确,如果采用专利文献I 3公开的技木,能够将当前的通话质量(线路质量、语音质量)提示给利用者。但是,即使采用该技术,也不清楚为了提高通话质量利用者应该采取的行动。在专利文献I 3中假设的通常的固定电话(IP电话机)和移动电话很难根据利用者侧的对策来改变通话质量。与此相対,在诸如在汽车内使用的免提电话装置那样通话质量中的通话环境所占的影响较大的情况下,利用者采取增大声音、关闭窗户等行动,由此能够比较容易地提高通话语音的质量。
发明内容
本发明正是考虑到以上的技术课题而提出的,其目的在于,将利用者应该采取的行动提示给利用者,以便提高通话对象侧的再现语音的质量。用于解决问题的手段本发明提出了ー种语音通话装置,通过通信装置与至少ー个以上的对方装置之间发送并接收语音数据,该语音通话装置具有(I)远端语音质量估计部,估计ー个以上的对方装置的再现语音的质量;(2)推荐行动估计部,估计所述语音通话装置的利用者为了使所述再现语音的质量提高而应该采取的行动;(3)推荐行动提示部,向所述利用者提示所估计的推荐行动。发明效果根据本发明,语音通话装置的利用者为了提高在通话对象侧收听的语音的质量,能够掌握利用者可以采取何种行动。根据下面的实施方式的说明,能够明确除上述内容之外的课题、结构及效果。
图I是说明实施例I的语音通话系统的整体结构的图。图2是说明实施例的语音通话处理的整体处理的流程图。图3是说明实施例的通话处理的内容的流程图。图4是表示实施例的推荐行动估计装置的结构的图。
图5是说明实施例的推荐行动估计处理的内容的流程图。图6是表示推荐行动事例数据的实施例的图。图7是表示实施例的推荐行动提示装置的结构的图。图8是说明实施例的推荐行动提示处理的内容的流程图。图9是表示实施例的提示方法蓄积装置的存储数据示例的图。图10是表示提示数据蓄积装置的存储数据示例的图。图11是表示提示数据蓄积装置的存储数据示例的图。图12是表示操作数据蓄积装置的存储数据示例的图。 图13是说明实施例2的语音通话系统的整体结构的图。图14是说明远端语音质量估计装置的实施例的图。图15是说明实施例2的语音质量通信装置(发送侧)的结构的图。图16是说明实施例2的语音质量通信装置(接收侧)的结构的图。图17是说明实施例3的语音通话系统的整体结构的图。图18是表示推荐行动信息数据库的实施例的图。图19是表示语音质量差分判定装置的实施例的图。图20是说明实施例的行动估计调整处理的内容的流程图。标号说明101电话机;102公用电话网;103移动电话;104移动电话连接装置;105信号处理装置;106远端语音质量估计装置;107推荐行动估计装置;108扬声器;109麦克风;110推荐行动提示装置;111免提电话装置;401特征量抽取装置;402推荐行动数据检索装置;403推荐行动事例数据蓄积装置;701提示方法选择装置;702提示方法蓄积装置;703推荐行动提示内容装置;704提示数据蓄积装置;705提示内容显示装置;706提示内容再现装置;707提示内容指示装置;708提示操作指示装置;1301、1302语音质量通信装置;1401、1402音响特征量分析处理装置;1403语音变形量计算处理装置;1404音质估计值变换处理装置;1501音响特征量分析装置;1502音响特征量发送装置;1601音响特征量接收装置;1701推荐行动实施判定装置;1702语音质量差分判定装置;1703行动估计參数调整装置;1901语音质量估计量存储装置;1902语音质量估计量蓄积装置;1903语音质量估计量差分计算装置。
具体实施例方式下面,根据
本发明的实施方式。另外,本发明的实施方式不限于后面叙述的实施例,能够在其技术思想的范围内实现各种变形。实施例[实施例I][整体结构]图I表示本实施例的语音通话系统的整体结构。本系统假设是在汽车的驾驶员与其通话对象之间实现的通话。构成语音通话系统的装置包括电话机101、公用电话网102、移动电话103、和免提电话装置111。
在本实施例中,电话机101可以是固定电话也可以是移动电话。公用电话网102是固定电话或移动电话所连接的普通的电话线路网,也可以是IP网络。本实施例的驾驶员与对象侧的讲话人通过公用电话网102相互通话。移动电话103是连接免提电话装置111的通信装置。免提电话装置111是具有本发明的推荐行动提示功能的装置。在本实施例中,免提电话装置111被搭载于汽车中。另夕卜,免提电话装置111也可以不具有通信功能。因此,通话需要移动电话103与免提电话装置111的连接。免提电话装置111由移动电话连接装置104、信号处理装置105、远端语音质量估计装置106、和推荐行动估计装置107构成。移动电话连接装置104是用于将免提电话装置111与移动电话103连接的接口装置。与移动电话103的连接方式有采用连接线缆等的有线方式、采用Bluetooth(蓝牙)等 的无线方式。移动电话连接装置104内置语音再现部,对从对象侧的电话机101接收到的语音数据进行解码并输出给扬声器108。并且,移动电话连接装置104将通过信号处理装置105输入的语音数据输出给移动电话103。信号处理装置105与麦克风109连接,将利用者(驾驶员)发出的语音作为原始语音数据Si进行输入。通常在原始语音数据SI中叠加了汽车行驶音等噪声。信号处理装置105对原始语音数据SI执行噪声去除等语音信号处理,仅强调语音部分。即,信号处理装置105执行抑制原始语音数据SI的杂音成分的处理。信号处理装置105将已处理语音数据S2输出给移动电话连接装置104和远端语音质量估计装置106。远端语音质量估计装置106输入原始语音数据SI和已处理语音数据S2,并估计由通话对象侧的电话机101再现的语音的质量。在本说明书中,将由通话对象侧的电话机101再现的语音即通话对象收听的语音也称为“远端侧语音”。关于估计处理的具体内容将在后面进行说明。另外,远端语音质量估计装置106也可以仅输入已处理语音数据S2,并估计由通话对象侧的电话机101再现的语音的质量。推荐行动估计装置107输入远端语音质量估计装置106的估计结果(语音质量估计值S3),并估计利用者(驾驶员)应该采取的行动,以便提高远端侧语音的质量。关于估计处理的具体内容将在后面进行说明。扬声器108是对从通话对象的电话机101发送、由移动电话103接收、并在移动电话连接装置104得以分离后的语音数据进行再现的输出装置。麦克风109是将利用者的语音数字变换为语音数据,并输入免提电话装置111的输入装置。在免提电话装置111中,麦克风109例如被设置在距离利用者的嘴部几十公分 I米左右的位置。在这种情况下,被输入到麦克风109的语音不仅有利用者的讲话语音,也叠加了汽车的行驶噪声、从窗户传入的气流声、空调装置的工作声、车载音响的声音等噪声。推荐行动提示装置110是将由远端语音质量估计装置106估计到的远端语音质量(音质估计值S3)、和由推荐行动估计装置107估计到的推荐行动(推荐行动数据S4)提示给利用者的装置。通常,往往共享汽车导航装置的显示画面等。在这种情况下,与显示在显示画面上的文字和图像相关的数据,是在远端语音质量估计装置106和推荐行动估计装置107中生成的。通过使用文字和图像,能够将通话状况容易理解地提示给利用者。例如,显示图示了推荐行动的图标。此外,也有利用语音来提示推荐行动等的方法。并且,当在车辆侧进行应对的情况下,也可以通过作为推荐行动的操作对象的设备或场所中设置的光源或扬声器,利用语音或光来提示推荐行动。关于这些实施例将在后面进行说明。[免提通话处理的概况]图2说明通过免提电话装置111 (图I)执行的免提通话处理的概況。在利用免提电话装置111吋,利用者通过以下操作来起动免提电话功能。具体地讲,起动呼叫处理201。例如,当利用者在带触摸功能显示装置的画面上选择了 通话功能吋,呼叫处理201被起动。并且,例如在免提电话装置111或汽车导航装置能够应对语音命令输入功能的情况下,在利用者通过麦克风109输入指定命令后,呼叫处理201被起动。然后,在利用者选择通话对象等后,呼叫处理201与对象侧的电话机101之间执行建立连接的处理。另外,详细的处理内容是众所周知的。因此,省略其详细说明。在呼叫处理201结束、与对象侧的电话机101之间建立连接后,执行通话处理202。在通话处理202中执行两个处理动作。一个处理是与现有装置相同地从利用者(驾驶员)的语音中抑制杂音的处理。在此,杂音的抑制处理使用信号处理装置105。信号处理装置105执行从混入了杂音的语音数据输入中仅抽取利用者的语音,并传输给对象侧的电话机101的处理。该处理的详细情况与现有的免提电话装置相同。因此,在此省略其详细说明。另ー个处理是在本实施例中由发明者们提出的处理。具体地讲,指估计远端侧语音的质量的处理、估计为了提高所估计的质量而推荐的行动的处理、以及向利用者提示推荐行动的处理。关于这些处理的详细情况将在其它部分中进行说明。最后,在利用者结束通话后,通话处理202结束,执行通话结束处理203。该通话结束处理203的内容与现有的免提电话装置相同。因此,省略详细说明。在免提电话装置111中整体上执行前述的处理。[通话处理202的概况]图3表示免提电话装置111执行与推荐行动的估计相关的处理内容。这些处理与远端语音质量估计装置106、推荐行动估计装置107、和推荐行动提示装置110相关。在通话处理202起动后,首先执行等待处理301。等待处理301是使处理的执行停止某个固定期间的处理。等待处理301指以固定期间间隔执行远端语音的质量的估计、基于估计结果的推荐行动的估计以及推荐行动的提示的等待时间。该等待时间例如可以始终是固定时间。另外,例如在保存了某个固定时间量的、远端语音质量的估计结果和输入麦克风109的语音数据的特征量(频带功率等)的情况下,等待时间也可以是一直到该估计结果和特征量出现变化的时间。在经过等待时间后,执行远端语音质量估计处理302。该处理由远端语音质量估计装置106执行。在此,远端语音质量估计装置106输入被输入到信号处理装置105的原始语音数据SI和输出的已处理语音数据S2。其中,原始语音数据SI对应于输入麦克风109中的语音。并且,已处理语音数据S2对应于在信号处理装置105进行信号处理后的语音数据。在本实施例中,远端语音质量估计装置106对所输入的两个语音数据的差分进行分析,并估计远端侧语音的质量。关于该处理的详细情况将在后面进行说明。然后,执行推荐行动估计处理303。该处理由推荐行动估计装置107执行。在此,推荐行动估计装置107根据通过处理302而估计到的质量信息,估计为了提高该音质利用者(驾驶员)应该采取的行动。关于该处理的详细情况将在后面进行说明。然后,执行推荐行动提示处理304。该处理由推荐行动提示装置110执行。在此,推荐行动提示装置110以利用者容易理解的方式来提示通过处理303而估计到的推荐行动。关于该处理的详细情况将在后面进行说明。
然后,执行通话结束判定处理305。在通话结束判定处理305中,判定利用者是否指示了结束当前的免提语音通话。在判定为结束通话的情况下(在处理306为肯定结果的情况下),结束通话处理202。在判定为不结束通话的情况下(在处理306为否定结果的情况下),返回等待处理301。因此,等待经过某个等待时间后,再次反复执行音质估计、推荐行动估计、推荐行动提示的处理。[远端语音质量估计处理的详细情况]下面,详细说明由远端语音质量估计装置106执行的远端语音质量估计处理302的内容。关于该装置及处理的实施,能够利用现有的几种方法。例如,能够利用非专利文献I 非专利文献3公开的方法。其中,非专利文献I和2公开了这样的技术,对用于评价音质的目标语音(在本实施例中指远端侧语音)和原始语音进行比较运算,由此预测电话音质的主观评价预测值。但是,这些方法是假设诸如IP电话机等那样在原始语音中没有叠加杂音、即能够利用清楚的语音时的技术。因此,在应用于原始语音中叠加了行驶语音等各种杂音的本实施例的情况下,认为其估计精度通常变差。但是,能够在某种程度上估计远端侧语音的质量。另外,非专利文献3公开了这样的技术,除了原始语音和远端语音之外,还采用被输入到讲话人侧的电话机中的语音(在本实施例中指来自麦克风109的输入语音),由此输出主观评价值的预测值。其中,主观评价值指将通话对象的评价換算为数值后的值。在这种方法中,在应用于原始语音中叠加了行驶声音等各种杂音的本实施例的情况下,认为其估计精度通常变差。但是,能够在某种程度上估计远端侧语音的质量。如上所述,在输入语音中叠加了杂音的本实施例中,无论是哪种方法,预计其估计精度通常都变差。但是,能够在某种程度上估计远端侧语音的质量。并且,估计质量足以用来估计本实施例中的推荐行动。另外,非专利文献4公开了假设应用于搭载在汽车中的免提电话装置的音质评价技木。该评价技术是由德国汽车エ业协会(VDA)制定的汽车用免提电话装置的音质评价指标,实现了该音质评价指标的技术也已经在市场上销售。例如能够通过导入该技术来实现远端语音质量估计装置106。并且,本申请的申请人申请了假设汽车导航装置中的免提通话,并且叠加行驶语音等杂音的麦克风输入语音的音质估计技术(日本特许申请2010-080886号)。该方法对即将进行杂音去除等信号处理之前(麦克风侧)的语音数据、和作为音质估计的对象的语音数据(理想地讲指远端通话侧,但实际上是信号处理后的语音数据)进行比较,并计算音质的估计值。图14表示采用本方法的远端语音质量估计装置106的内部结构示例。与采用前面叙述的非专利文献的方法时相同,远端语音质量估计装置106输入两个语音数据。两个语音数据中的ー个是原始语音数据SI (麦克风侧的语音数据),另ー个是已处理语音数据S2。在本实施例中,根据这两个语音数据的音响特征量之差计算语音变形量,对该值实施某种变换处理,由此计算已处理语音的语音质量估计量S3。首先,音响特征量分析处理装置1401和1402计算表现作为输入对象的语音数据的特征的物理量(即音响特征量)。这些音响特征量例如能够采用将频带分割 得到的各个分割频带的语音功率值。该语音功率值是直接从语音求出的物理量。另外,这些音响特征量也能够采用对通过频率分析而得的特征量应用考虑了人的听觉特性的变换处理而得到的被称为响度的指标等。当然,也能够采用除上述之外的特征量。并且,在此计算的音响特征量也可以仅采用前述的几个指标中的任意一个指标,也可以采用将几个指标组合而得的矢量。所求出的原始语音数据SI的音响特征量和已处理语音数据S2的音响特征量都输出给语音变形量计算处理装置1403。语音变形量计算处理装置1403根据这两个音响特征量计算被称为语音变形量的ー个指标。变形量的计算方法有单纯地求出标量值(单ー值)的音响特征量的差分的方法、求出矢量值的音响特征量之间的距离(欧几里得距离等)的方法、求出矢量间的内积的方法、对上述数值赋予加权的方法等各种方法。在前述的几种公知的方法中,都实施相同的差分(距离)计算。计算出的变形量被输出给音质估计值变换处理装置1404。音质估计值变换处理装置1404将所求出的语音变形量变换为语音质量估计量S3进行输出。前述的语音变形量是在基本上反映了人的听觉特性的线性标度上定义的值。因此,音质估计值变换处理装置1404的变换处理也可以是线性变换。但是,在想要采用更符合应用场景的语音质量估计量S3的情况下,也可以采用非线性的变换处理。例如,在诸如免提通话那样变形量増大到某种程度以上时,在无法理解语音的内容的情况下,也可以采用将与某种程度以上的变形量建立对应的语音质量估计量S3大幅减小等非线性的变换处理。这样,远端语音质量估计装置106根据与由信号处理装置105执行的信号处理的前后对应的两个语音数据的音响特征量(物理量),估计远端侧语音的质量。另外,远端语音质量估计装置106也可以只根据已处理语音数据S2来估计语音的质量。这样,远端语音质量估计装置106的输出信息是远端侧语音的质量信息。但是,在最简单的实施例中,也可以将采用前述的公知技术计算出的主观音质评价值这ー个值作为远端语音质量估计装置106的输出信息。更优选地,远端语音质量估计装置106将在计算语音质量估计值S3时使用的各种语音特征量中有用的几个语音特征量,与语音质量估计值S3同时输出。语音特征量可以采用例如讲话人语音的功率值(dB)、讲话人语音的每个频带的功率值、经由噪声去除处理被抑制的噪声语音的功率值、每个频带的功率值等。并且,作为讲话人语音的详细的分析结果,例如有声区间和无声区间的平均功率比等与讲话人的讲话方式(ロ齿伶俐)相关的信息等也是有用的信息。[推荐行动估计处理的详细情况]下面,详细说明推荐行动估计装置107的内部结构示例和在该装置内部执行的推荐行动估计处理303的内容。在下面的说明中使用图4和图5。图4表示推荐行动估计装置107的内部结构示例。推荐行动估计装置107由特征量抽取装置401、推荐行动数据检索装置402、和推荐行动事例数据蓄积装置403构成。特征量抽取装置401从语音质量估计量S3中抽取能够在推荐行动事例数据的检索中使用的特征量数据(矢量)(包括变换处理)。所抽取的特征量数据(矢量)被输出给推荐行动数据检索装置402。推荐行动数 检索与先前抽取的特征量数据(矢量)最接近的推荐行动事例数据。关于该处理的详细情况将在后面进行说明。推荐行动事例数据蓄积装置403是大量地蓄积特征量数据(矢量)、以及独立地记述与该特征量数据(矢量)相对应的一个或者多个推荐行动的推荐行动数据的存储装置。该存储装置采用硬盘装置和闪存等数据存储装置。所检索到的推荐行动数据S4被从推荐行动估计装置107输出。图5表示推荐行动估计装置107执行的处理内容的实施例。在推荐行动估计装置107的处理开始后,首先执行特征量抽取处理501。在该特征量抽取处理501中,执行将语音质量估计量S3变换为能够在推荐行动事例数据的检索中使用的特征量数据(矢量)的处理。例如,执行利用非线性函数(对数函数、指数函数等)来变换语音质量估计量S3的处理、向语音质量估计量S3乘以加权值的处理、向语音质量估计量S3加上偏置值的处理等。在这些变换处理中,优选进行使变换后的值成为容易在与事例数据的特征量距离的计算中使用的值的处理。关于采用哪个变换函数,根据所输入的语音质量估计量S3的内容而不同。因此,预先在免提通话装置的研发阶段确定变换函数,使得推荐行动估计精度达到最高。也能够预先将所确定的变换函数作为特征量抽取处理501的处理程序而装入。更优选地,另外以表形式来表示函数的类型及其系数值等。在这种情况下,通过选择函数的类型和系数值,也能够应对未来的数据更新。另外,优选语音质量估计量S3不仅输入如前面叙述的単一的值,也输入在求出该值时使用的各种音响/语音特征量的值。通过输入各种值,能够提高推荐行动事例数据的检索精度即推荐行动的估计精度。另外,在特征量抽取处理501中,优选不仅提供远端语音质量估计装置106的输出信息,而且也提供车辆信息。例如,优选在特征量抽取处理501中提供当前窗户是否敞开、空调装置是否在工作等信息。这样,如果也利用除输入麦克风109的利用者的语音之外的信息,则能够进ー步提高推荐行动的估计精度。另外,免提电话装置111往往与汽车导航装置形成为一体。在这种情况下,能够直接利用与搭载了免提电话装置111的汽车相关的各种状况信息(窗户的开闭状况、空调装置和车载收音机的工作状况、行驶速度和发动机转速等行驶状况等)的情况也不少。而且,这些状况信息表示与免提通话的音质恶化相关的可能性较大的噪声要因的产生状况的盖然性较高。因此,通过ー并采用这些状况信息和语音质量估计量S3,能够提高推荐行动的估计精度。如果除这些音响信息之外的信息(汽车的状况信息)也能够利用某个函数进行变换,则能够用来计算与推荐行动事例数据的距离。当然,需要在研发时期预先确定使用的函数的类型及系数值。后面的处理502 508的处理对应于推荐行动数据检索装置402的处理动作。该处理动作的内容对应于用于检索与所抽取的特征量数据(矢量)最接近的距离的推荐行动事例数据的处理内容。在下面的说明中,推荐行动事例数据被存储在推荐行动事例数据蓄积装置403中,而且假设从存储地址的“位置I ”开始顺序排列。首先,在处理502,推荐行动事例数据的取得位置被初始化。然后,顺序执行处理 503 处理507的处理。首先,执行在下ー个取得对象位置是否存在数据的判定处理(处理503),当存在数据的情况下(处理503为肯定结果),执行推荐行动事例数据的取得处理(处理504)。然后,计算通过特征量抽取处理501而抽取到的特征量数据(矢量)、与对所取出的推荐行动事例数据赋予的特征量数据(矢量)之间的距离(处理505)。在计算该距离吋,能够采用以单纯的欧几里得距离为代表的各种距离计算方法。将所计算出的距离与当前记录的距离的最小值(最小距离)进行比较,在此次计算出的有关推荐行动事例数据的距离较小的情况下,将新计算出的距离保存为新的最小距离(处理506)。然后,将数据的取得位置的值加“ 1”,返回处理503。在通过处理503得到肯定结果的期间,反复进行前述的处理。另外,在通过处理503而得到否定结果的情况下(与全部推荐行动事例数据之间的距离的比较处理结束的情况下),执行处理508。即,与当前记录的最小距离对应的推荐行动事例数据被作为前述的推荐行动数据S4而输出。图6表示在推荐行动事例数据蓄积装置403中蓄积的数据表的构造示例。当然,该数据表仅是一例,也有可能是其它不同的数据构造。在图6所示的数据表中,将取得位置ID、特征量矢量、推荐行动ID、推荐的行动量作为ー组来存储推荐行动事例数据。在此,作为识别推荐行动的信息是存储推荐行动ID,但也可以以文本或其它数据形式来存储推荐行动。并且,对于推荐行动伴随有量的推荐行动,也存储推荐的行动量,但不一定进行保存。另外,在存储行动量的情况下,不仅提示推荐行动,也能够具体提示必要的行动量。因此,在采用图6所示的数据表的情况下,将推荐行动ID和行动量(被赋予了行动量的情況)作为推荐行动数据S4进行输出。以上是推荐行动估计装置107及其处理动作(推荐行动估计处理303)的实施例。另外,前述的实施例采用机械学习算法中的ー种即k最近邻法(k-Nearest Neighbor法)。即,前述的实施例对输出与满足k= 1(最小距离)的推荐行动事例数据对应的推荐行动的方法进行了说明。另外,在蓄积了大量推荐行动事例数据的情况下,采用下述的改良方法,即增大k的值(即,从最終距离较短者开始选择k个推荐行动事例数据),以多数确定等方式从k个推荐行动事例数据中确定推荐行动。在这种情况下,能够提高估计精度。改良方法的详细情况已在机械学习的文献(例如非专利文献5)等中公开。并且,在本实施例中采用k最近邻法,但也能够采用除此之外的各种机械学习的方法(例如,基于确定树、SVM等的判别或回归方法)等。[推荐行动提示处理的详细情况]下面,详细说明推荐行动提示装置110的内部结构示例和在该装置内部执行的推荐行动提不处通304的内容。在下面的说明中使用图7和图8。图7表示推荐行动提示装置110的内部结构示例。推荐行动提示装置110由提示方法选择装置701、提示方法蓄积装置702、推荐行动提示内容选择装置703、提示数据蓄积装置704、提示内容显示装置705、提示内容再现装置706、提示内容指示装置707、和提示操作指示装置708构成。 在前述的整体结构的说明(图I)中,主要假设了推荐行动提示装置110是汽车导航装置的显示装置(显示器)等的显示装置的情况(使用视觉信息进行提示的情況)。在此,在图7中也记述能够用作推荐行动提示装置110的其它装置示例。例如,记述利用声音或语音等的听觉信息来实现提示的装置示例、和利用视觉信息或听觉信息来指示或者提示窗户、空调装置、车载音响等推荐行动的对象附近或者应该操作的设备和按钮等的装置示例。在图7中也说明适当切換这三种提示方法的结构。从推荐行动估计装置107向推荐行动提示装置110输出推荐行动数据S4(包括推荐行动量)。此时,推荐行动数据S4被输入提示方法选择装置701。提示方法选择装置701判定将推荐行动作为哪种类别的信息提示给利用者(驾驶员)。此时,提示方法选择装置701參照提示方法蓄积装置702来选择提示方法。图9表示在提示方法蓄积装置702中存储的数据表的构造示例。当然,该数据表仅是一例,也有可能是其它不同的数据构造。在图9所示的数据表中存储有将推荐行动ID和提示方法ID作为ー组的提示方法数据。在此,作为识别推荐行动的信息是存储推荐行动ID,作为识别提示方法的信息是存储提示方法ID,但都可以存储为文本或其它数据形式。在图9中假设有四种提示方法,准备了 4个IDl ID4。在该实施例中,IDl对应于在汽车导航装置的显示装置上显示图标(消息)的方法。ID2对应于在从语音再现装置再现语音消息的方法。ID3对应于直接指示对象设备的方法。ID4对应于推荐行动提示装置UO直接操作对象设备来自动执行推荐行动的方法。其中,在直接指示ID3的对象设备的方法中,可以考虑通过与推荐行动直接对应的设备或按钮、与推荐行动相关的设备、或者配置在这些设备附近的灯或扬声器,对利用者指示对象设备的方法等。例如,在推荐行动是“降低速度”、并且对应于用ID3指示的提示方法的情况下,直接实现速度控制的设备是油门或制动器。另外,在显示速度的速度表上显示信息的方法也是利用者容易理解的方法。在这种情况下,推荐行动提示装置110以与推荐行动所涉及的设备即速度表显示的当前速度重合的方式显示所推荐的速度。另外,在诸如推荐行动的对象是窗户、空调装置、车载音响等提示实际设置的位置更便于利用者容易理解的情况下,可以考虑使在其位置附近设置的灯闪烁、或者从其位置附近的扬声器再现警报声音等方法。推荐行动提示内容选择装置703根据由提示方法选择装置701确定的提示方法,确定具体显示、提示或者再现哪种信息。为了进行该确定,推荐行动提示内容选择装置703參照提示数据蓄积装置704。图10表示在提示数据蓄积装置704中存储的数据表的构造示例。当然,该数据表仅是一例,也有可能是其它不同的数据构造。在图10所示的数据表中存储有将推荐行动ID、提示方法ID及提示内容作为ー组的提示数据。推荐行动ID及提示方法ID与图6所示的提示方法蓄积装置702相同。在此,在提示内容的栏目中存储有与推荐行动ID和提示方法ID的各个组相对应的具体的提示内容。即,在提示内容的栏目中存储有用于指定实际显示或者再现哪种显示数据和语音数据、以及在直接指示对象设备的情况下或者直接操作对象设备的情况下执行哪种动作的信息。例如,在推荐行动ID是IDl (降低速度)、提示方法ID是IDl (在显示装置上显示图标)的情况下,在图10的提示内容的栏目中存储“图标I”。并且,例如在推荐行动ID是IDl (降低速度)、提示方法ID是ID2(再现语音消息)的情况下,在图10的提示内容的栏目中存储例如“请将速度降低X公里”。另外,该存储示例是假设了诸如语音合成那样能够 直接对文本进行语音变换的技术的信息记录方法。在这种情况下,如果用推荐行动量(该情况时指降低的速度的量)置換消息中的文字“X”来进行语音合成,不需对文字“X”能够采取的全部变形录音语音消息即可完成。当然,在采用对已录音的语音消息进行再现的语音提示方法的情况下,也可以将预定的语音消息ID与基于语音再现的提示方法ID相对应地进行存储。并且,在图10中,作为提示方法ID是ID3时(直接指示对象设备的情况)的一例,示出了在提示内容的栏目中存储“指示I”这种数据的示例。该“指示I”指对程序或装置赋予的标签。因此,在提示内容是标签的情况下,利用提示内容指示装置707来起动对应的程序或者装置,并执行针对对象设备的指示动作。在图10的情况下,针对“降低速度”这种推荐行动,执行在速度表上直接显示推荐的速度并提示给利用者的动作。并且,在图10中,作为提示方法ID是ID4时(推荐行动提示装置110直接操作对象设备的情況)的一例,示出了在提示内容的栏目中存储“操作I”这种数据的示例。该“操作I”指对程序或装置赋予的标签。在这种情况下,提示操作指示装置708根据用“操作I”指定的程序或者装置而直接操作对象设备。有关基于所确定的内容的、各个设备的具体控制,属于已知的技木。因此,在本说明书中省略其详细说明。由推荐行动提示内容选择装置703选择的具体的提示内容(图标等显示用数据、语音合成用的消息文本、已录音语音数据、设备的指示/操作数据),分别输出给对应的装置。例如图标等显示用数据输出给提示内容显示装置705。例如语音合成用的消息文本和已录音语音数据输出给提示内容再现装置706。例如针对设备的指示内容输出给提示内容指示装置707。例如针对设备的操作内容输出给提示操作指示装置708。通过这些各个装置,执行在汽车导航装置的显示画面上的显示、来自扬声器的语音的再现、对象设备的指示动作或直接操作。图8表示推荐行动提示装置110执行的处理内容的实施例。在推荐行动提示装置110的处理被起动后,首先执行用于确定推荐行动的提示方法的提示方法选择处理801。在该提示方法选择处理801中,输入推荐行动ID和行动量这两个数据作为推荐行动数据S4。在提示方法选择处理801中,从存储于提示方法蓄积装置702的提示方法数据(图9)中检索与所输入的推荐行动ID —致的提示方法。在图9的情况下,对推荐行动ID赋予唯一的提示方法ID。因此,在采用图9的数据表的检索处理中,单纯检索与推荐行动ID —致的数据。但是,推荐行动数据S4的内容不限于单纯利用推荐行动ID的方法。在这种情况下,必须实现与推荐行动数据S4的内容对应的检索处理。在确定提示方法后,执行提示内容选择处理802。在提示内容选择处理802中,从存储于提示数据蓄积装置704的提示数据(图10)中检索与所输入的推荐行动ID及提示方法ID相对应的提示内容。在检索完成后,提示内容选择处理802输出提示方法ID及相对应的提示内容。在此,对存储于提示方法蓄积装置702中的提示方法数据(图9)和存储于提示数据蓄积装置704中的提示数据(图10)进行区分的理由如下所述。提示数据蓄积装置704 内的提示数据(图10)是针对各个推荐行动ID记录可能的提示方法ID及提示内容的全部模式的固定(不会根据用户的利用程度而变更)的数据。与此相对,提示方法蓄积装置702内的提示方法数据(图9)是表示针对推荐行动ID实际选择哪种提示方法的数据,是表示针对用户在当前时刻选择哪种提示方法的数据。这样,通过在推荐行动提示装置110内具有一部分重复的两个数据库,即使是相同的推荐行动,也能够根据每个用户来改变提示方法,或随着利用程度的推进而变更提示方法等的应对方法。在提示方法分支处理803中,起动与所选择的提示方法ID对应的提示处理。在提示方法分支处理803中,根据提示方法是基于画面显示、还是基于语音再现、还是基于直接指示、还是基于直接操作来选择处理。在执行提示内容显示处理804的情况下,在免提电话装置111或者汽车导航装置的显示画面上显示提示内容。在图10的情况下,指定图标作为提示内容数据。因此,在显示画面上显示用于图示推荐行动的图标(关闭窗户的图案、降低车载音响的音量的图案等)。此外,也能够利用语句来显示推荐行动。在这种情况下,对于提示内容,指定即将显示的语句。在执行提示内容再现处理805的情况下,从扬声器108再现语音消息。语音消息数据的存储方法另外有存储在语音消息蓄积装置中的方法、和使用语音合成装置随时生成语音消息数据的方法。在属于前者的情况下,语音消息ID应该存储在图10所示的数据表的提示内容栏目中。在这种情况下,从语音消息蓄积装置中检索与该ID对应的语音消息(当在提示内容栏目中存储有语音消息的内容本身时,指与该文字内容一致的语音消息),并再现为语音。另ー方面,在属于后者的情况下,在图10所示的数据表的提示内容栏目中存储有朗读语句本身。在这种情况下,该语句被输出给语音合成装置,并被变换为语音。即,再现通过变换而生成的语音。该朗读语句可以是固定内容,也能够使用行动量数据重新生成朗读语句。例如,在图10的情况下,在提示方法ID是ID2的提示内容中存储有“请将速度降低X公里”的朗读语句。如果在该语句内的X部分插入行动量数据,则能够实时生成实际读出的语句。在执行提示内容指示处理806的情况下,实际执行与所输入的提示内容(指示I等)对应的指示动作。在该处理中,另外检索提示内容蓄积装置,实际确定基于检索结果的指示动作。图11表示在提示内容蓄积装置中存储的数据表的构造示例。在图11所示的数据表中存储有将指示ID、指示对象ID、指示动作ID作为ー组的数据。在指示ID中存储与在图10的提示内容栏目中存储的指示内容相同的内容。在图11的情况下,检索词采用指示ID。即,执行指示ID的一致检索。检索的结果是,确定与指示ID对应的指示对象和指示动作。指示对象是作为执行指示动作的对象的物体(设备),在该对象中执行指示动作。使在右侧前方的窗户附近配置的灯闪烁的动作、用车载音响再现警报语音的动作、在速度 表上显示语句“推荐速度X公里”的动作等,与图11所示的指示ID对应。各个指示动作分别需要特殊的装置。但是,在该指示内容指示处理806中,适当选择这些装置来执行适当的处理。在执行提示操作指示处理807的情况下,根据所输入的操作ID(操作I等)执行实际的操作动作。在该处理中,另外检索操作内容蓄积装置,实际确定基于检索结果的操作动作。图12表示在操作内容蓄积装置中存储的数据表的构造示例。在图12所示的数据表中存储有将操作ID、操作对象ID、操作动作ID作为ー组的数据。在操作ID中存储与在图10的提示内容栏目中存储的操作内容相同的内容。在图12的情况下,检索词采用操作ID。即,执行操作ID的一致检索。检索的结果是,确定与操作ID对应的操作对象和操作动作。操作对象是作为应用操作动作的对象的物体(设备)。在各个处理的实现方法及操作确定后,作为操作对象的设备(装置)被起动,这一点与前述的提示内容指示处理806相同,因而省略说明。[总结]通过在汽车中搭载本实施例的免提电话装置111 (图I),不仅能够对利用者提示基本的免提通话,而且能够具体提示为了提高通话对象收听的语音的质量而推荐的行动。即,能够对利用者提示为了抑制利用者的语音中包含的杂音的因素而推荐的行动。因此,通过由利用者实际执行所提示的特定的行动,能够有效改善在通话对象侧再现的语音的质量。另外,在通过所提示的ー种推荐行动,通话对象收听的语音的质量没有有效提高的情况下,通过组合执行其它ー种或者多种推荐行动,能够有效改善通话对象收听的语音的质量。[实施例2]在本实施例中,说明使用免提电话装置的语音通话系统,该免提电话装置具有与对象侧通话装置之间进行语音质量的通信的功能。[整体结构]图13表示本实施例的语音通话系统的整体结构。本系统与实施例I的情况相同,假设是在汽车的驾驶员与其通话对象之间实现的通话。另外,在图13中对与图I对应的部分标注相同的标号。图13所示的语音通话系统与图I的情况相同,由电话机101、公用电话网102、移动电话103、和免提电话装置111构成。与图I的不同之处在干,电话机101与语音质量通信装置1301连接,并对免提电话装置111追加了语音质量通信装置1302。并且,实施例I的远端语音质量估计装置106输入在免提电话装置111内部能够取得的一个或者两个语音数据(即原始语音数据SI和已处理语音数据S2),对这些语音数据进行音响分析,由此估计远端侧的通话对象收听的语音的质量。但是,在信号处理装置105的后面存在对语音的再现质量产生影响的因素,例如移动电话103的语音压缩处理、公用电话网102的包损耗、位于远端的电话机101的特性(语音解码处理的类型或扬声器的音响特性等)等。因此,认为通话对象实际收听的音质往往更加恶化。在实施例I中,预先假设这种恶化状况来实施音质估计处理。例如,通过将固定的恶化量进行相加等来估计音质。另外,作为优选的实施方式,期望在与位于远端的通话人侧的装置(例如电话机101)之间追加用于交换实际的语音质量信息的结构。因此,实施例2在电话机101设置语音质量通信装置1301,在免提电话装置111内 置语音质量通信装置1302。并且,利用新追加的语音质量通信装置交换语音质量信息,实现远端侧的语音质量的更准确的估计。结果,能够确定更加恰当的推荐行动和行动量。其它部分的处理内容与实施例I相同。因此,在下面的说明中对本实施例特有的语音质量通信装置1301和1302进行说明。[语音质量通信装置(发送侧)的结构]图15表示在通信对象侧设置的语音质量通信装置1301的结构。在下面的说明中,发送侧指发送估计对象即通话对象侧的实际的语音质量信息的一侧。并且,接收侧指从在通话对象侧设置的语音质量通信装置1301接收语音质量信息的一侧,即指免提电话装置111 侧。另外,在本实施例的语音通话系统(图13)中,假设仅在驾驶员侧(下面称为“近端侧”)实施在远端侧再现的语音的质量的估计以及基于该估计的推荐行动的确定动作的系统结构。因此,在本实施例中,在发送侧和接收侧对语音质量通信装置要求的结构是不同的。另外,当在发送侧和接收侧双方执行音质估计和推荐行动的确定的情况下,也可以在发送侧和接收侧双方配置相同构造的语音质量通信装置。下面,对发送侧和接收侧的语音质量通信装置的构造不同的情况进行说明。如前面所述,图15所示的语音质量通信装置1301是被配置于发送侧的装置。语音质量通信装置1301至少由音响特征量分析装置1501和音响特征量发送装置1502构成。音响特征量分析装置1501是与图14所示的远端语音质量估计装置106的音响特征量分析处理部1401及1402相同的装置。音响特征量分析装置1501是分析及/或抽取近端侧的利用者(即驾驶员)讲话的语音的音响特征量信息的装置。即,音响特征量分析装置1501将相对于汽车位于远端侧的通话对象(利用者)收听的语音作为处理对象。音响特征量发送装置1502向通话对象(此处指近端侧的免提电话装置111)侧发送由音响特征量分析装置1501分析及/或抽取的音响特征量信息。即,将音响特征量信息作为再现语音的质量信息进行发送。在图15的情况下,采用将音响特征量信息叠加在通话语音中(例如作为语音水印信息进行嵌入)进行发送的结构。另外,也可以构成为准备与在近端侧发送的通话语音线路不同的通信路径,通过该通信路径来发送音响特征量信息。在采用诸如后者的其它通信路径的情况下,不需要采用语音水印技术向语音数据中嵌入音响特征量信息。因此,能够采用通常的数据发送技术来发送音响特征量信息。由此,能够向近端侧(免提电话装置111侧)发送利用者在远端侧实际收听的语音的音响特征量信息。[语音质量通信装置(接收侧)的结构]图16表示在驾驶员侧(音响特征量信息的接收侧)设置的装置结构。另外,在图16中,对与图13及图14对应的部分标注相同的标号。接收侧的语音质量通信装置1302与移动电话连接装置104连接,并输入在移动电话连接装置104进行分支的音响特征量信息。语音质量通信装置1302至少具有接收由发送侧的语音质量通信装置1301发送的音响特征量信息的音响特征量接收装置1601。音响特征量接收装置1601的结构根据音响特征量发送装置1502实施的音响特征量的发送方式而不同。音响特征量接收装置1601根据音响特征量的发送方式,进行抽取在语音中叠加的音响特征量信息的处理、或者接收经由其它线路发送的音响特征量信息的处理中的任意一种处理。 这样接收到的音响特征量信息被输入到远端语音质量估计装置106的语音变形量计算处理装置1403。本实施例的远端语音质量估计装置106 (图16)根据从发送侧接收到的音响特征量信息和从原始语音数据SI中抽取出的音响特征量信息,计算语音变形量。这一点是与实施例I的远端语音质量估计装置106 (图14)的不同之处。然后,计算出的变形量被输出给音质估计值变换处理装置1404。音质估计值变换处理装置1404将所求出的语音变形量变换为语音质量估计值S3,并输出给推荐行动估计装置107和推荐行动提示装置110。[总结]通过采用本实施例的系统结构,能够将实际在远端侧收听的语音和输入到麦克风109的原始语音进行比较。即,由于能够采用通话对象正在收听的语音的音响特征量信息,因而能够实现比实施例I更准确的音质估计。结果,能够提高推荐行动的估计精度。[实施例3]在本实施例中,对具有判定利用者(驾驶员)实际是否执行了推荐行动的功能的免提电话装置进行说明。[整体结构]图17表示本实施例的语音通话系统的整体结构。本系统与实施例I的情况相同,假设是在汽车的驾驶员与其通话对象之间实现的通话。另外,在图13中对与图I对应的部分标注相同的标号。与实施例1(图I)的不同之处在于,对本实施例的免提电话装置111 (图17)追加了推荐行动实施判定装置1701、语音质量差分判定装置1702和行动估计参数调整装置1703。本实施例的免提电话装置111使用这些新追加的装置实现(I)利用者有无实施推荐行动的判定,(2)在确认到已实施的情况下,在实施推荐行动的前后产生的通话语音的质量变化的判定,(3)推荐行动的提示条件的变更。通过具备该功能,在下一次的推荐行动提示时,能够实现更加恰当的推荐行动的提示。即,本实施例的免提电话装置111提供用于提示更加恰当的推荐行动的推荐行动提示条件的学习功能。[免提通话处理的概况]
在此,说明通过本实施例的免提电话装置111 (图17)而执行的免提通话处理的概况。另外,在从语音通话开始到提示推荐行动的处理动作与实施例I相同,因而省略说明。与对利用者(驾驶员)提示由推荐行动估计装置107估计的推荐行动时相同,其推荐行动数据S4也输出给推荐行动实施判定装置1701。推荐行动实施判定装置1701判定利用者(驾驶员)实际是否实施了由推荐行动估计装置107估计的推荐行动。例如,在推荐行动数据S4指示将速度降低X公里的情况下,推荐行动实施判定装置1701根据速度信息判定有无实施推荐行动。例如,在推荐行动数据S4指示关闭驾驶员侧的窗户的情况下,推荐行动实施判定装 旋转信息,判定有无实施推荐行动。判定结果被作为推荐行动实施信息,从推荐行动实施判定装置1701输出给行动估计参数调整装置1703。语音质量差分判定装置1702定期地检查各个时刻的语音质量估计量S3,判定某个判定定时前后的语音质量的差分。该判定结果被作为语音质量差分信息S5输出给行动估计参数调整装置1703。最后,行动估计参数调整装置1703使用由推荐行动实施判定装置1701输出的推荐行动实施信息、和由语音质量差分判定装置1702输出的语音质量差分信息S5,判定推荐行动是否是针对语音质量提高的正确的估计结果。然后,行动估计参数调整装置1703根据判定结果,调整在推荐行动估计装置107内的推荐行动事例数据蓄积装置403中存储的推荐行动事例数据的加权。通过调整该加权,无助于音质提高的推荐行动被抑制,有助于音质提高的推荐行动得到强化。结果,在从下一次起的推荐行动的估计处理中,能够提高估计到更加恰当的推荐行动的可能性。[各个装置的详细结构及处理]下面,详细说明推荐行动实施判定装置1701、语音质量差分判定装置1702和行动估计参数调整装置1703的结构及处理的内容。[推荐行动实施判定装置的详细情况]从推荐行动估计装置107向推荐行动实施判定装置1701输入推荐行动数据S4。在推荐行动数据S4中至少包括表示推荐行动的对象的行动对象信息、和表示对该对象实施哪种行动的行动信息。例如,行动对象信息要考虑窗户、车载音响、速度表等。具体地讲,能够将图11中的指示对象ID、图12中的操作对象ID用作行动对象信息的一例。并且,例如行动信息包括关闭窗户(电动窗户上升)、降低音量(静音)等。具体地讲,能够将图12中的操作动作ID用作行动信息的一例。另外,也假设推荐行动估计装置107参照具有图18所示的数据表构造的推荐行动信息数据库的实施方式。在该推荐行动信息数据库中,分别利用ID来管理推荐行动信息、行动对象信息及行动信息,并通过ID来确定各个信息之间的对应关系。在这种情况下,推荐行动实施判定装置1701使用推荐行动数据S4中包含的行动对象信息和行动信息,判定是否已对该行动对象实际实施了该行动。在该判定处理中,根据行动对象的装置以及/或者行动来实施各种处理。并且,该处理的实施方式也根据装置和行动而不同。例如,针对窗户的开闭这种推荐行动,通过检查窗户的开闭装置的状态,能够判定作为行动对象的窗户是被敞开还是被关闭。例如,针对降低车载音响的音量这种推荐行动,通过检查车载音响装置的音量信息,能够直接判定音量是否已降低。并且,在其它实施方式中,根据从与推荐行动实施判定装置1701连接的语音输入装置(麦克风)输入的车内语音,检查利用车载音响再现的语音的音量(功率)是否减小,由此能够进行间接判定。从推荐行动实施判定装置1701输出的推荐行动实施信息,能够作为对推荐行动信息追加了有无其实施的信息来实现。并且,需要对从推荐行动估计装置107输出的信息赋予向利用者(驾驶员)提示了该推荐行动的时刻信息。该时刻信息也被附加在推荐行动 实施信息中进行输出。另外,虽然依赖于与行动估计参数调整装置1703的结构,但也存在需要从推荐行动估计装置107接收图6所示的推荐行动事例数据的ID信息,并将该ID信息附加在推荐行动信息中进行输出的情况。[语音质量差分判定装置的详细情况]语音质量差分判定装置1702具有以固定间隔而且连续地蓄积从远端语音质量估计装置106输出的语音质量估计量S3的未图示的存储装置。语音质量差分判定装置1702从行动估计参数调整装置1703读出隔着指定的时刻而存储的两个语音质量估计量S3,将这两个语音质量估计量S3的差分作为语音质量差分信息S5进行输出。图19表示语音质量差分判定装置1702的内部结构示例。语音质量差分判定装置1702由至少蓄积语音质量估计量S3的语音质量估计量蓄积装置1902、进行该信息的存储处理的语音质量估计量存储装置1901、和计算在指定时刻的前后蓄积的语音质量估计量的变化的语音质量估计量差分计算装置1903构成。语音质量估计量蓄积装置1902例如是硬盘装置、闪存等数据蓄积装置。语音质量估计量存储装置1901进行将对从远端语音质量估计装置106输出的语音质量估计量信息赋予时刻信息而得的数据,存储在语音质量估计量蓄积装置1902中的处理。语音质量估计量差分计算装置1903在从行动估计参数调整装置1703输出了行动实施时刻信息S6时,将在该时刻的前后蓄积的两个语音质量估计量S3的差分作为语音质量差分信息S5输出给行动估计参数调整装置1703。在此,语音质量估计量差分计算装置1903从语音质量估计量蓄积装置1902抽取由行动实施时刻信息S6表示的时刻的紧前面和紧后面的语音质量估计量S3,并计算两者的差分。此处的紧前面和紧后面包括考虑了根据推荐行动的行动对象和行动而独立定义的时间间隔的前面和后面。另外,语音质量差分信息S5也可以定义为语音质量估计量S3的单纯的差。并且,在语音质量估计量S3被实施为某种矢量信息的情况下,也可以将该矢量间的距离等作为语音质量差分信息S5的定义。[行动估计参数调整装置的详细情况]行动估计参数调整装置1703在每当从推荐行动实施判定装置1701输出推荐行动实施信息时,执行用于规定推荐行动条件的参数的调整处理。图20说明在行动估计参数调整装置1703中执行的处理的流程。
行动估计参数调整装置1703在从推荐行动实施判定装置1701输入推荐行动实施信息时,开始行动估计参数的调整处理。首先,行动估计参数调整装置1703将在推荐行动实施信息中记录的行动实施时刻信息S6输出给语音质量差分判定装置1702。然后,作为处理2001,行动估计参数调整装置1703取得在由行动实施时刻信息S6指定的时刻的前后生成的语音质量估计量差分信息S5。然后,执行处理2002。在该处理中,行动估计参数调整装置1703从推荐行动事例数据蓄积装置403中检索与在推荐行动实施信息中记录的推荐行动对应的信息。为了进行该检索,行动估计参数调整装置1703和推荐行动估计装置107需要共享有相同的推荐行动事例数据蓄积装置403。另外,处理2001和处理2002的顺序可以更换。在后面的处理2003中,行动估计参数调整装置1703判定语音质量估计量差分信息S5的正负。 其中,差分值为正(即语音质量估计量S3在实施推荐行动的前后上升),指由推荐行动估计装置106估计的推荐行动有助于音质提高。在这种情况下,行动估计参数调整装置1703进入到处理2004,增加相应的推荐行动事例数据的加权。即,行动估计参数调整装置1703执行用于增强推荐程度的处理。另一方面,差分值为负(即语音质量估计量S3在实施推荐行动的前后降低),指由推荐行动估计装置106估计的推荐行动阻碍音质提高。在这种情况下,行动估计参数调整装置1703进入到处理2005,减少相应的推荐行动事例数据的加权。即,行动估计参数调整装置1703执行用于抑制推荐程度的处理。在推荐程度的增强处理和抑制处理中实际执行的处理内容,根据推荐行动事例数据的构造和推荐行动估计装置107的结构而不同。但是,通常能够将推荐行动估计处理视为基于多个事例数据的学习问题。因此,在此处的增强处理和抑制处理中能够利用以教师数据为前提的机械学习算法。下面,根据图6示例的推荐行动事例数据来说明推荐程度的增强处理和抑制处理的实施例。并且,假设从推荐行动实施判定装置1701输出的推荐行动实施信息中包含推荐行动事例数据的ID信息。在这种情况下,推荐程度的增强处理和抑制处理能够利用下面示出的方法实现。首先,行动估计参数调整装置1703从推荐行动事例数据蓄积装置403中检索与输入的ID信息对应的推荐行动事例数据。在此,在增强某个行动的推荐程度的情况下,行动估计参数调整装置1703向构成检索到的推荐行动事例数据的行动量的信息加上一定量,增加对应的行动量。另一方面,在抑制某个行动的推荐程度的情况下,行动估计参数调整装置1703从构成检索到的推荐行动事例数据的行动量的信息减去一定量,减小对应的行动量。通过该处理,如果行动量的信息从正变为负,行动估计参数调整装置1703使在该推荐行动事例数据中记录的推荐行动ID的内容变更为与以前的行动相反的行动。例如,针对“增大语音”这种推荐行动,在行动量的信息从正变为负的情况下,行动估计参数调整装置1703变更为“减小语音”的行动ID。例如,对于没有指定行动量的推荐行动,在增强推荐程度时,行动估计参数调整装置1703不对推荐行动的内容实施任何变更。另一方面,对于没有指定行动量的推荐行动,在抑制推荐程度时,行动估计参数调整装置1703使行动ID变更为推荐行动的内容成为相反的行动的行动ID。另外,关于增强推荐行动的推荐程度的处理方法以及抑制推荐行动的推荐程度的处理方法,还可以考虑其它的实施例。推荐行动估计处理的算法例如能够采用k最近邻法。在这种方法中,检索k个与所输入的特征量矢量接近的事例数据,将在这些数据中记录的推荐行动中数量最多者作为推荐行动进行输出。在采用这种算法的情况下,能够采用增加事例数据的方法来增强及抑 制推荐程度。另外,在增强推荐程度的情况下,行动估计参数调整装置1703将此次计算的特征量矢量、和此次选择的事例数据内的推荐行动ID及行动量结合起来,生成新的事例数据,并追加存储在推荐行动事例数据蓄积装置中。另一方面,在抑制推荐程度的情况下,行动估计参数调整装置1703可以对此次计算的特征量矢量附加表示与此次选择的推荐行动ID相反的内容的行动ID,并进行追加存储。[总结]通过在汽车中搭载本实施例的免提电话装置111 (图17),能够学习基于推荐行动的实施的音质改善效果,并反映在下一次以后的推荐行动的估计中。S卩,能够根据推荐行动估计处理的算法增强或者抑制推荐程度。另外,本实施例的学习处理是以免提电话装置111 (图17)单位来进行的。但是,通过登记利用者(驾驶员),也可以对每个利用者执行学习处理。并且,在能够从汽车卸下免提电话装置111 (图17)的情况下,通过登记所搭载的汽车,能够对每个汽车执行学习处理。并且,在本实施例中,以免提电话装置111 (图17)单位来进行推荐行动的学习,但也可以通过移动电话103等接收由汽车制造商、销售公司或者第三者机构进行统计处理而得的学习结果数据。并且,也可以在免提电话装置111 (图17)中搭载该功能、和能够将每个学习结果数据上传到由汽车制造商等管理运用的服务器中的功能。[其它实施例]在前述的实施例中主要假设了搭载于汽车的免提电话装置,但只要是在叠加于麦克风中的杂音能够通过利用者的主观行动而增减的环境下使用的免提电话装置,则不限于车载型。并且,该免提电话装置也可以作为功能模块安装于移动电话中,还可以能够装卸地安装于移动电话中。并且,在前述的实施例中,以免提电话装置被搭载于汽车的情况为前提。但是,搭载免提电话装置的车辆不限于汽车。并且,在前述的实施例中,一种提示方法对应于一种推荐行动,但也可以前述的多种提示方法对应于一种推荐行动。并且,也可以用灯等同时指定基于语音的推荐行动的提示、和推荐行动的对象设备。即,可以同时提示多个推荐行动。另外,本发明不限于上述的实施例,可以包括各种变形例。例如,上述的实施例是为了容易理解地说明本说明而予以详细说明的示例,不一定局限于具有所说明的全部构成要素。并且,也能够将某个实施例的一部分置换为其它实施例的结构,并且也能够对某个实施例的结构追加其它实施例的结构。并且,也能够对各个实施例的结构的一部分追加、删除或者置换其它结构。
并且,关于上述的各个构成要素、功能、处理部、处理单元等,也可以将其一部分或者全部实现为例如集成电路等硬件。并且,上述的各个构成要素、功能等也可以通过对由处理器实现各个功能的程序进行解释并执行来实现。即,也可以实现为软件。实现各个功能的程序、表、文件等的信息能够存储在存储器或硬盘、SSD(Solid State Drive,固态驱动器)等存储装置、IC卡、SD卡、DVD等存储介质中。 并且,控制线和信息线用于表示被认为是在说明中需要的要素,并不表示作为产品所需要的全部控制线和信息线。实际上可以认为几乎全部的构成要素相互连接。
权利要求
1.一种语音通话装置,通过通信装置在与至少一个以上的对方装置之间收发语音数据,其特征在于,该语音通话装置具有 远端语音质量估计部,估计一个以上的对方装置的再现语音的质量; 推荐行动估计部,估计所述语音通话装置的利用者为了使所述再现语音的质量提高而应该采取的行动;以及 推荐行动提示部,向所述利用者提示所估计的推荐行动。
2.根据权利要求I所述的语音通话装置,其特征在于,所述语音通话装置还具有显示文字及/或图像的显示部, 所述推荐行动提示部具有提示内容显示控制部,该提示内容显示控制部使所述显示部对图示出所估计的推荐行动的图标或者语句进行显示。
3.根据权利要求I所述的语音通话装置,其特征在于,所述语音通话装置还具有再现语音的语音再现部, 所述推荐行动提示部具有提示内容再现部,该提示内容再现部通过所述语音再现部对说明所估计的推荐行动的语音数据进行再现。
4.根据权利要求I所述的语音通话装置,其特征在于,所述语音通话装置还具有对象指示部,该对象指示部指示成为推荐行动的操作对象的设备或与推荐行动相关联的设备、或者指示这些设备的场所, 所述推荐行动提示部具有提示内容指示部,该提示内容指示部通过所述对象指示部,向利用者提示要求其进行的推荐动作。
5.根据权利要求I所述的语音通话装置,其特征在于,所述语音通话装置还具有设备操作部,该设备操作部直接操作成为推荐行动的操作对象的设备, 所述推荐行动提示部具有操作指示部,该操作指示部指示所述设备操作部执行针对成为所估计的推荐行动的操作对象的设备的规定操作。
6.根据权利要求I所述的语音通话装置,其特征在于,所述语音通话装置具有多个所述推荐行动提示部,该多个推荐行动提示部各自对应的提示动作不同, 所述语音通话装置具有提示方法选择部,该提示方法选择部确定所述多个推荐行动提示部中任意一个或者任意多个推荐行动提示部来执行对推荐行动的提示。
7.根据权利要求I所述的语音通话装置,其特征在于,所述语音通话装置还具有语音质量提示部,该语音质量提示部向利用者提示对所述再现语音的质量进行估计的信息。
8.根据权利要求I所述的语音通话装置,其特征在于,所述远端语音质量估计部根据被输入到所述语音通话装置的利用者的语音数据、和通过针对该语音数据的信号处理而抑制了杂音成分的语音数据,估计所述对方装置的再现语音的质量。
9.根据权利要求I所述的语音通话装置,其特征在于,所述远端语音质量估计部根据通过针对被输入到所述语音通话装置的利用者的语音数据的信号处理而抑制了杂音成分的语音数据,估计所述对方装置的再现语音的质量。
10.根据权利要求I所述的语音通话装置,其特征在于,所述远端语音质量估计部具有与所述对方装置之间进行所述再现语音的质量的通信的语音质量通信部,所述远端语音质量估计部将由该语音质量通信部从所述对方装置接收到的质量信息作为估计结果进行输出。
11.根据权利要求I所述的语音通话装置,其特征在于,所述语音通话装置还具有 推荐行动实施判定部,判定利用者有无实施所述推荐行动; 语音质量差分判定部,求出在推荐行动的实施前后的所述再现语音的质量的差分; 估计参数调整部,根据所述差分来调整所述推荐行动估计部的参数。
12.—种车载装置,具有权利要求I所述的语音通话装置。
13.根据权利要求12所述的车载装置,其特征在于,所述推荐行动是针对车载设备或者搭载于车辆中使用的设备的操作。
14.根据权利要求12所述的车载装置,其特征在于,所述推荐行动是与车辆的驾驶相关的操作。
全文摘要
免提电话装置的利用者不能判定通话对象侧在以何种音质收听,而且不清楚为了提高该音质需要什么样的行动。本发明的语音通话装置具有用于提示利用者应该采取的行动的功能,以便提高通话对象侧的语音质量。作为这种提示的前提,本发明的语音通话装置具有估计远端侧的语音的质量的功能、为了提高所估计的语音的质量而估计利用者应该采取的行动的功能、以及向利用者提示所估计的行动的功能。
文档编号G10L15/26GK102739834SQ20121003442
公开日2012年10月17日 申请日期2012年2月15日 优先权日2011年3月30日
发明者永松健司, 渡边向纪 申请人:歌乐株式会社
语音通话装置及车载装置的制作方法
相关推荐
专利名称:高弹性材料保护的抗折断光缆的制作方法技术领域:本实用新型涉及光通信行业技术领域,特别涉及光缆技术领域,具体是指一种高弹性材 料保护的抗折断光缆。背景技术:目前的光缆中对光纤的保护有两种方式。1 )在聚对苯二甲酸丁二醇酯或聚丙烯做成
专利名称:一种能发出鹿鸣声音的琴的制作方法一种能发出鹿鸣声音的琴所属领域本发明涉及一种琴,尤其是一种能发出鹿鸣声音的琴。 背景技犬鄂温克族是我国较少民族之一,人口不到三万,解放前大多过着游猎生 活,通过一1=叫"鹿哨"的
专利名称:平版印刷版原版的制作方法技术领域:本发明涉及平版印刷版原版。技术背景对铝合金板的表面进行包括表面粗糙化处理和阳极氧化处理的表面处理工艺以获得载体,之后将光敏材料涂布至载体并干燥以获得通常所说的PS版,之后对PS版进行包括图像曝光、
专利名称:双工式光纤连接器及与其端接的光缆的制作方法技术领域:本发明涉及一种双工式光纤连接器和用这种连接器在端头连接的光缆。数据通信工业界规定光纤配线数据接口(FDDI)作为局部区域网络性能定义的标准。符合这个标准的系统叫做FDDI系统,它
专利名称:编码设备和解码设备的制作方法技术领域:本发明涉及采用一个诸如正交变换的方法通过用一个较少量的编码数据流对通过将时域中的音频信号、例如声音和音乐信号变换成频域内的信号所获得的信号进行编码来压缩数据的编码方法,以及用于在接收到编码数据
专利名称:噪声门、声音采集装置及噪声消除方法技术领域:本发明涉及用于消除音频信号中所含噪声的噪声门,还涉及声音采集装置及噪声消除方法。背景技术:现有技术的声音采集装置中提供有噪声门来作为用于消除噪声的单元(例如,专利文件1)。例如,专利文件