专利名称:通过语音输出信息和/或信号的方法和装置的制作方法
技术领域:
本发明涉及一种通过语音从至少一个电气设备输出信息和/或信号的方法和装置。
这类方法或装置通常应用在譬如交通运输工具、计算机、机器人、机器以及设备等的所谓语音对话系统或语音服务系统中。
一般来讲,语音对话系统(SDS)基本上可缩减成如下部分-语音识别系统,它将传入的命令(“语音命令”)同其它许可的语音命令进行比较,并判断哪个命令很可能已经传入,-语音输出,它把用户引导所需要的语音指令和信号音输出去,必要时还应答识别结果,-对话控制及过程控制,用于为用户说明是等待哪种输入类型,或用于检验产生的输入是否与请求以及应用的瞬时状态相一致,以及用于触发在应用(譬如需要控制的设备)中所产生的作用,-作为应用接口的控制接口其后隐藏有硬件模块和软件模块,用于控制包含有应用的各种执行器或计算机,-通过语音控制的应用这可以譬如是预订系统或询问系统、CAE工位或适合于伤残者的轮椅。
譬如在DE 195 33 541 C1中曾公开过这种语音对话系统。为了改善这种人机对话的接收,它譬如作出了如下建议,即为命令采用同义词或不同的发音变体,或对命令中的字进行词序调整,譬如“左圆中的较大半径”或替而代之的“左圆中较大的半径”。此外,它还建议通过扩展存储器来建立一种多语言的、与说话者无关的对话系统,其中可以有选择地在各种语音的对话系统之间进行切换。另外还建议引入所谓的省略句,也就是说放弃重复整个命令句,并代之以诸如“再高些、”“再强些”、或“再继续”等命令,由此由语音对话系统将这些命令分配给前面的命令。此外,语音对话系统在不确定的识别时还质询譬如“您说什么?”、“请重复”或“还有呢?”,或者输出一定的建议,譬如“请大点声”。所有这些措施的作用是为了避免单调的通信,并更接近于人机通信的对话。为了改善通信,语音系统接有一种光学显示媒体,其上给出了用于控制目的的被识别的指令。此外,该光学显示媒体还能显示由目标设备根据语音命令以反应形式进行调节的功能,及/或显示随后可通过语音命令调节或选出的各种功能/选择。已知的这种装置和由此实施的方法的缺点在于,尽管存在所述的改善作用,但语音输出由于其单调性将会使用户感到疲乏,以致于在出现行动紧急的作用时,用户的反应时间太长。另一个问题是,在识别困难的情况下,已知的语音对话系统将会运行一个无限的循环,并总是为用户重复输出相同的请求,由此中断了工作流程。
因此,本发明以所述技术问题为基础,创造一种通过语音输出信息及/或信号的方法和装置,其中可以实现改善的用户注意力。
该技术问题的解决方案由权利要求1、9及10的特征部分给出。本发明进一步优选的扩展方案由从属权利要求给出。
通过使用不同的语调-其中在行动紧急的指示时信号具有一种命令语调,立即在语音输出时引起用户的注意,由此大大缩短了用于执行所要求的指示的反应时间。
为进一步提高注意力和辨别行动紧急的指示,可以在行动紧急的指示时提高语音输出的音量,以及/或者尤其强烈或突然地渐现该语音输出。
另外,语音对话系统可以构造成多语言的形式,这样,譬如可以在男声和女声之间进行选择,于是在行动紧急的指示时可以选择一种声音,而在行动非紧急的信息或信号时选择系统的另一种声音。
为了确保工作流程,所述语音对话系统只通过操作一个“按压讲话”PTT开关来激活,其中,当有效的交互作用不存在时便更换对话通信层。为提高识别的可靠性,或者为了改善用户引导,单个命令可以按各种可选的输出形式进行存储,然后在交互作用无效时连续地输出该命令,其中,只有当在所有命令形式的基础上均不能产生有效的交互作用时,才更换对话通信层。为了避免单调性,可以通过随机发生器来排列输出的顺序。
本发明的基本思想在于,在车辆驾驶员处通过所述类型的语音输出来唤起能诱发符合情况的行为的情绪。
下面借助优选实施例来详细阐述本发明。图中
图1为通过语音自动地控制至少一个设备的方法的流程框图,
图2a为在行动非紧急的交互作用时的危险可能性的变化曲线,图2b为所属的意义(Denotation)变化曲线,图2c为所属的语调变化曲线,图2d为所属的涵义(Konnotation)变化曲线,图3a为在行动紧急的交互作用时的危险可能性的变化曲线,图3b为所属的意义变化曲线,图3c为所属的语调变化曲线,图3d为所属的涵义变化曲线,通过操作PTT开关将语音对话系统激活。为了能更好地理解,语音对话系统的语音输出被划分为实际上可能相同的命令KOM和请求Auff。命令KOM在下文被理解成直接的行为指示,譬如“刹车”、“接通灯光”等,相反,请求Auff则以输入的形式请求交互作用,譬如“请给出所需的摄氏温度”。
如果此时语音对话系统产生命令KOM,则该命令KOM随后被划分为行动紧急的指示或行动非紧急的指示。在简单的情况下,行动紧急的指示就是要求快速执行行动的命令KOM。若ADR系统或防碰撞传感系统已检测到碰撞物体,则命令KOM“刹车”就是这样的例子。在此,为了在用户处产生较高的注意力,用命令语调语音S1和较大的音量L1在时间t1内强烈而突然地渐现行动紧急的指示。相反,行动非紧急的指示用较低的音量L2和标准语调S2来柔和地渐现。
通常,请求Auff是时间非紧急的,因而较好的用户引导在这里处于突出的地位。对此,请求Auff可以按n个不同的选择体而存放于语音存储器内。这些选择体譬如可以是不同的重音、发音、词序调整或同义概念等等。在第一种选择体进行声学输出之后,语音对话系统将用一个预定的时间等待交互作用。如果在该时间内没有交互作用,或存在无效的交互作用,则语音对话系统利用第二种选择体来重复该请求,有时直到第n个选择体。如果产生有效的交互作用,则执行该作用,并在必要时输出新的请求Auff。相反,如果在请求Auff的第n个选择体基础上都没产生有效的交互作用,则更换到另一对话通信层DKE上,以确保工作流程。于是,新的对话通信层DKE譬如是一种可以在船舶监视仪上显示的选择表,用户可以从中选择相应的菜单。
在图2a-d中示出了行动非紧急的指示的情况,譬如用于导航系统的数据请求。在此,图2a示出的是时间t内交互作用的重要性,其中在时间点t0-t2上输出行为指示,其中,假定在前面每个请求的基础上都没有反应。由于在导航系统中缺少输入,这只是导致那些舒适元件不能工作,而这在有时候也不是车辆驾驶员所希望的,因此,所述的重要性在时间上没有发生改变。同样,命令的内容信息,即所谓的意义,也即输入请求在时间上也是保持恒定的,这如图2b所示。此时,在时间点t0上,譬如可以请求车辆驾驶员“现在请您输入您所需的行驶目标”。该请求用一定的语调I1和一定的概念内容(涵义)K1来执行,如图2c-d所示。如果此时没有产生输入,则系统不知道这为什么没有发生,譬如这是否是由于车辆驾驶员已错过请求或故意不想执行。因此,在时间点t1上重新用较强的语调I2请求“请您输入行驶目标”,但其中降低了涵义级K2,由此以实现改善的可察觉性。如果在此基础上还没有输入,则系统可认为这似乎不是车辆驾驶员所希望的。为了避免由于长期重复给车辆驾驶员带来烦扰,在时间点t2上进行最后一次请求,譬如“若您不想要目标地址,请现在把我关掉”。该最后的请求用极低的语调I3输出,而且只具有极少的涵义。从图2d所示的曲线可以看出,所述涵义形成了一种递减函数,也即一个从较大表示值到较小表示值的过渡,对此,为消除单调性,在语调中产生了一定的变化。
与此相反,在图3a-d中示出了如下一种情形,其中交互作用的重要性随时间上升,且最后变为行动紧急。譬如在遵守跟车安全间距的情况下,车辆在高速公路上的行驶速度超过了允许的速度。在时间点t0,系统譬如以“请您调整您的速度”的形式把行为指示告诉车辆驾驶员。该行为指示具有较低的语调等级I1和相应较低的涵义级K1,原因是车辆驾驶员虽然违章,但不存在直接的危险。另外,假定此时车辆驾驶员没有调整其速度,而且在时间点t1已勉强超出安全间距,也即交通状况的危险可能性增加,这可由图3a中的上升曲线来表示。据此,系统譬如以“您必须刹车”或“您请刹车”的形式把行为指示告诉车辆驾驶员,其中,该行为指示具有较高的语调等级I2和相应较高的涵义级K2。如果车辆驾驶员对此还没有反应,则交通状况的危险可能性将继续上升,这如图3a中的进一步上升曲线所示。这意味着,车辆驾驶员继续不反应可能会在极短的时间内导致事故。该行动紧急的指示譬如以具有命令语调I3的“全刹车”形式给出。在此,图3d所示的涵义级示出了一种递增函数,也即表示值从较低的重要性增加到较高的重要性。需补充指出的是,图2a-d和图3a-d所示的变化不是按比例的,而只需理解为定量的数据。
权利要求
1.通过语音从至少一个电气设备输出信息及/或信号的方法,其中,语音输出所需的信息及/或信号(KOM;Auff)被存放在语音存储器中,并由处理装置根据要求读出,以及通过声学输出装置、尤其是扬声器输出,其特征在于所述信息和/或信号(KOM;Auff)按照重要性以不同的语调(I)输出。
2.如权利要求1所述的方法,其特征在于行动紧急的信息和/或信号(KOM)用命令语调(I)输出。
3.如权利要求1或2所述的方法,其特征在于至少行动紧急的信息和/或信号(KOM)是以较高的音量(L1)输出的。
4.如权利要求1至3中任一项所述的方法,其特征在于行动紧急的信息和/或信号(KOM)是强烈地渐现的。
5.如权利要求1至4中任一项所述的方法,其特征在于所述信息和/或信号(KOM,Auff)以多语言的形式存放在语音存储器内,而且至少在行动紧急的信息和/或信号(KOM)时更换所述的语音。
6.如权利要求1至5中任一项所述的方法,其特征在于至少在行动紧急的信息和/或信号(KOM)时根据重要性来增加语调(I)和涵义(K)。
7.如权利要求1至6中任一项所述的方法,其特征在于在行动紧急的信息和/或信号(KOM)时,所述语调(I)在涵义(K)下降时进行变化。
8.如权利要求1至7中任一项所述的方法,其特征在于该方法是通过语音对话来控制至少一个电气设备的方法的一部分。
9.利用至少一个PTT开关、一个显示装置以及一个语音对话系统并通过语音对话来自动地控制至少一个设备的方法,包括以下步骤a)通过操作PTT开关引入该方法,b)把可能的控制可能性用字母数字表示成命令形式,并用图解显示语音作用的功能,以及c)若等待中没有产生交互作用,则更换对话通信层。
10.通过语音从至少一个电气设备输出信息及/或信号的装置,它具有一个语音存储器、一个处理装置和一个声学输出装置,所述语音存储器中存放有语音输出所需的信息和/或信号(KOM)数据,其特征在于所述信息和/或信息(KOM)可以用不同的语调(I)输出。
全文摘要
本发明涉及一种通过语音从至少一个设备输出信息和/或信号的方法和装置,其中,语音输出所需的信息和/或信号(KOM,Auff)存放在语音存储器中,并由处理装置根据要求读出,以及通过声学输出装置输出。本发明规定,所述信息和/或信号(KOM,Auff)按照重要性以不同的语调(Ⅰ)输出。
文档编号G10L13/02GK1312936SQ99809626
公开日2001年9月12日 申请日期1999年9月3日 优先权日1998年10月16日
发明者I·贝克曼, H·埃贝尔特, M·海默曼 申请人:大众汽车有限公司
通过语音输出信息和或信号的方法和装置的制作方法
相关推荐
专利名称:折叠式可调望远镜的制作方法技术领域:本实用新型涉及折叠式可调望远镜。本实用新型折叠式可调望远镜是这样实现的设置长方形目镜板和物镜板,目镜板和物镜板的长边用两块主遮板连接,主遮板的中部设有与目镜板长边平行的折叠线,主遮板与目镜板和物
专利名称:图像形成装置的制作方法技术领域:本发明涉及一种使用了电子照相方式的图像形成装置。 背景技术:近年,电子照相方式的图像形成装置被广泛使用,该电子照相方式的图像形成装置为,通过使感光鼓的表面带电并进行曝光来形成静电潜像,使带电的调色剂
专利名称:消音器的制作方法技术领域:本实用新型属于一般机器的气流消音器领域。背景技术:消音器是阻止声音传播而允许气流通过的一种 器件,是消除空气动力性噪声的重要措施。消音器是安装在空气动力设备,如鼓风机、空压机、锅炉排气口、发电机、水泵等排
专利名称:音频编码设备、音频解码设备及其方法技术领域:本发明涉及用在编码和发送语音和或声音信号的通信系统中的语音编 码设备、语音解码设备及其方法。背景技术:在数字无线通信、以因特网为代表的分组通信和语音存储等领域中,为 了有效地利用无线电信
专利名称:Led灯的制作方法技术领域:本实用新型是有关于一种LED灯及其散热装置,尤指一种具有一底座及散热片,该底座上具有多个L型导热管,该散热片本体的外侧则具有多个波浪状鳍片,使其具有体积小、重量轻及散热快优点的LED灯及其散热装置。背景
专利名称:节能卤素照明灯的制作方法技术领域:本实用新型涉及一种节能卤素照明灯,属于照明灯具技术领域。背景技术:本实用新型作出以前,在已有技术中,卤素照明灯主要由灯泡体、灯丝、灯脚所组成。灯丝装在灯泡体内,通过压封工艺将灯脚、灯丝与灯泡体连接