专利名称:用于把文本数据转换为语音输出的系统的制作方法
技术领域:
本发明涉及一种按照权利要求1的前序部分所述的、具有借助网络来互联的应用的系统,其中来自至少一个应用的文本数据可以作为语音数据被输出。
已知以文本或数字值形式提供的信息为了作为语音输出而需要被转换为声信号。比如,如果没有可视装置、也即没有屏幕或显示器来输出数据,而只有扬声器或简单的电话,那么这就是必须的。数字值的语音输出比如被应用于电话询问中,以告知用户所期望的电话号码。要输出的信息为此首先被划分为尽可能小的信息单元。借助一种表格或一种算法,每个信息单元被转换为一个音节或一串音节。被组合的音节串通过一个输出设备被转换为声音信号。在电话询问的例子中,所产生的语音信号通过电话网被传输给呼叫者。
另一个把文本转换为语音的已知的例子是“E-Mail-To-Speech(电子邮件至语音)”功能,该功能常常被配置于电子邮件分发业务,即所谓的E-Mail系统。在此,通过由用户呼叫E-Mail服务器的一个特殊端口,E-Mail可以从一个任意的电话端口被“读出”。在证实之后,在E-Mail系统中所提供的业务把E-Mail的文本转换为语音,由用户“读出”该E-Mail的内容。如果该转换包括语法分析-在此也称为语法解析-,那么用于建立音节串的所述业务也被称为“分析器”。与在电话询问中所使用的业务不同,在所述E-Mail系统中所使用的分析器具有较高的复杂性,原因在于被转换的不仅是单个的数字而且还有自然语言的完整词组,并且往往还具有句子音调。所述的分析器在此往往在不同的自然语言之间进行区别,也即具有德语、英语、法语等不同的发音,并且此外往往甚至能够有选择地使用男性的、女性的或者甚至由用户自己预先发出的语音样本。为了进行语音输出,这通常也称为语音“合成”,一般采用设置有特殊编程的DSP(DSP=DigitalSignal Processor,数字信号处理器)或者其他为此特别制造的元件的设备。
在美国专利US 6,263,051 B1“System And Method For VoiceService Bureau(用于语音业务处的系统和方法)”中公开了一种中央业务来用于在通信网络中自动处理电话通话。在此所述的中央业务通过诸如XML接口的数据接口来接收所有的用于实施电话通话的重要数据。之后该中央业务通过一种通信设备构建一个至电话用户的连接,并且借助一种语音输出装置(“T-T-S=Text To Speech Engine,文本-语音引擎”)来处理与所述电话用户的交互通信。所述的中央业务在此按所选择的呼叫号码抵达有线电话或移动电话(从而包括自然的通信伙伴)或者甚至语音-邮件系统、呼叫应答器或者类似的可以连接到电话线上的机器。在此在所公开的方法中,所述的语音输出一直作为声音信号通过电话线来进行。所述的中央业务可以通过不同的路径,因而通过不同的数据接口来提供最近呼叫所必需的数据。在此所公开的配置即所谓的“虚拟呼叫中心”,该“虚拟呼叫中心”为了诸如电话银行的一个特定的应用目的而呼叫一个客户,其中该客户通过语音输出而被提供信息,并且其键盘输入被存储在电话上。
在用语音输出基于文本的信息的常用系统中具有以下缺点,每一种设备或每一种业务作为特殊的应用来用语音输出基于文本的信息必需分别设置独有的装置,也即元件和硬件,以便用于合成和输出语音数据。
从而本发明所基于的任务在于,改善用于语音输出基于文本的信息的系统,使之可以更广泛地被应用。
此任务通过权利要求1所给出的特征而得到解决。通过从属权利要求的特征使该系统以有利的方式进一步扩展。
该任务的解决方案规定,所述的语音输出由所述的应用(1、1c)来进行控制,而且作为语音数据的形式返回给所述的应用。
文本数据转换为语音数据可以在网络中的任意位置来进行,其中至少有一个应用是通讯装置,并且所述的语音数据可以在语音设备上读出或者可以作为数据包被继续传输。
如果关于业务功能的信息可以在管理服务器上被调用,那么采用用于把文本数据转换为语音数据的业务的其他应用就可以尤其简单地补充到网络中。
如果所述的信息可以借助协议来调用,那么所述的关于业务功能的信息的调用是尤其简单和可靠的。
如果所述的信息包含所述业务的地址和/或关于其使用的种类和方式的说明,那么就减少了由应用和业务构成的网络的管理耗费。
如果在所述管理服务器上提供程序部件来使用所述的业务,那么为了访问所述的业务而进行的应用的匹配就变得简单了。
如果在网络中新开始一种业务,那么通过所述业务形成至所述应用的连接并且传输关于其功能的信息,使得所述业务可以由所述应用来使用而不需要在所述应用中进行干预或重新启动所述的应用。
如果所述的业务被用来把网络中的错误报告给网络管理员,那么也可以在网络管理员不在的情况下很快地再次形成网络的作用能力。
下文中借助附图对本系统的实施例进行描述。所述的唯一的附图在此示出了两个网络,这两个网络具有其上安装了用于把文本转换为语音数据的业务的服务器。
在附
图1中输出了一个PC 1a,其上安装了一种应用(应用程序)1。
所述的应用1比如应当给出通过语音输出的E-Mail。为此它通过网络LAN构造一个至业务服务器2的连接,其中在该服务器上安装有文本-语音业务3。借助一种特殊的协议,所述的应用1把要输出的文本以及一组控制指令传输给所述的文本-语音业务3。
所述的控制指令包括以下说明所述输出应当到哪里和何时实施,在不成功的情况下应当如何动作,以及该输出应当用哪种声音来实施。作为输出目标,可以选择在已存在的或要新构建的连接的B信道中的比如作为语音数据包的回复或者作为语音信号的输出。
在本实施例中所述的输出应当借助在PC 1a上连接的扬声器来进行,如此使得在所述控制指令中选择语音数据包来作为回复。作为输出时间点选择选项“立即”,也即在转换之后紧接着进行。对于较晚的输出,所述的协议把传输设定为任意的时间点。
在不成功的情况下应当如何来动作的指令尤其在通过新构建的电话连接的B信道来输出的情况下是很重要的。可能存在所拨叫的用户不接受所述的“通话”或者端口占线。对于这些情况,所述的协议可提供可能性以输入重复输出的次数和时间间隔。
用于选择声音的指令允许在“男性”、“女性”或“根据单独的语音样本”之间来选择。另外还可以选择不同的国家语言,比如德语、英语、法语等。在本实施例中所述的应用1,也即在所述PC 1a上安装的E-Mail程序,利用在E-Mail系统的地址索引中所包含的E-Mail作者的信息来调节语音输出的性别和语种,比如男性和德语。
所述的文本-语音业务3收到所述的文本数据和对于转换所必需的所有信息之后,把通过所述的文本接口3a所接收的文本借助所述的文本分析器3b转换为音节串,并且在语音发生器3c中借助预先存储的语音样本形成具有声音信息的语音数据组。该语音数据组通过一个媒体处理器3d被变换为由所述控制指令所预先定义的格式,并借助输出功能媒体输出3c通过网络LAN的连接传输给PC 1a。在那里所述的语音数据由所述的应用1来中间存储,并且然后通过PC 1a的扬声器来输出。
为了能够以前述的方式利用所述的文本-语音业务3,所述的应用1获得关于业务3的地址以及该业务3的能力的信息,也即在协议中可供利用的控制指令。为此,所述的文本-语音业务3在其启动时把它的功能特征寄存在网络中为之所设置的位置,即所谓的“查询业务”。这比如由JINI(Java Intelligent Network Infrastructure,Java智能网络基础结构)和UPnP(Microsoft Universal Plug and Play,微软通用即插即用)已公开;这里比如利用了一种专用的解决方案。在所述查询业务中所提供的信息包括以下方面信息,即设置有文本-语音业务3来用于自动把被传输的文本转换为语音输出,还包括关于有多少资源可供使用的资料、所支持的语言的资料、在网络LAN、ISDN中的地址信息以及所述的文本-语音业务3可利用哪条路径的信息,还包括辅助功能的资料以及最后的关于如何使用所述的文本-语音业务3的信息。比如所述的要被转换的文本以XML格式(=extended markuplanguage,扩展标记语言)传输,原因在于这里所被选择的字符组(从而也有语种)和结构信息被一同提供。当然也可以提供其他的文本格式。
为了替代在“查询业务”中的上述寄存,所述的文本-语音业务3也可以在其启动之后或者在给定的时间间隔内有效地在网络LAN中查阅能够使用这种业务3的应用,并且可以在所述应用1中有效地注册。
另外该附图还示出了与通信装置4相连接的终端设备4a、4b、4c。所述的通信装置4是一种线路交换的ISDN交换系统,但是也可以是VoIP通信装置(通过数据网传输语音的通信装置;VoIP=IP上的语音;IP=因特网协议)中的通信应用。
根据所述的应用1,此时从终端设备4a发送一个基于文本的短消息(SMS-短消息)至终端设备4b。所述的通信装置4(该装置这里在一般意义上被看作在技术上与应用1不同的另一种应用)把基于文本的短消息仅仅继续传输至这些终端设备4a、4c,其中这些终端设备4a、4c在通信装置的用户表格中被称为“有文本能力”型的终端设备。因为所述的终端设备4b没有字母数字的显示装置来输出文本信息,所以需要语音输出。所述的通信装置4以与所述应用1、1c相同的方式与安装在管理服务器5上的查询业务建立连接,并且查询所提供的文本-语音业务3的地址和能力以把文本数据转换为语音数据。在本例子中,所述的业务服务器2同时用作管理服务器5。所述的文本-语音业务3如所期望的那样能提供短消息(SMS)的语音输出。根据由查询业务所获得的信息,所述的通信装置4此时生成一个包含待转换文本的请求,该请求对于被所述的文本-语音业务3用来接收作业的协议来说是足够的。带有短消息的请求则被传输至业务服务器2,在那里由业务3的中间存储器3a来接收,然后继续传输至所述的分析器3b,由该分析器转换为与文本的语法相对应的音节串,并且由所述的语音发生器3c转换为语音数据串。所述的媒体处理器3d以被用于通过电话连接的B信道来进行输出的格式来输出语音数据。所述的输出模块3e则构建一个至通信设备4的电话连接,并且在此直接选择所述的用户4b。在终端设备4b上接收到所述通话之后,所述的语音数据则被播放。
一种相应设计的终端设备4a、4c也可以替代所述的通信设备4而直接把文本信息传输给业务3以进行语音输出,而通信设备4不用必需能够与所述的管理服务器5和业务服务器2进行通信。
权利要求
1.具有应用(1、1c)的系统,其中这些应用通过网络(LAN、ISDN)相互连接,该系统具有一种设定的业务(3)来把文本数据转换为语音输出,所述的业务(3)可以由至少两个应用(1、1c)来使用,所述的语音输出可以至少作为声音信号的传输而通过电话连接来进行,其特征在于,所述的语音输出由所述的应用(1、1c)来控制并且以语音数据传输的形式返回给所述的应用。
2.根据权利要求1所述的系统,其特征在于至少有一个应用是通信设备(4),并且所述的语音数据可以在语音终端设备(4a、4b)上输出或者可以作为数据包被继续传输。
3.根据权利要求1或2所述的系统,其特征在于关于所述业务(3)的功能的信息可以在管理服务器(5)上被调用。
4.根据权利要求3所述的系统,其特征在于所述的信息可以借助一种协议来被调用。
5.根据权利要求3或4所述的系统,其特征在于所述的信息包括所述业务(3)的地址和/或关于其使用的种类和方式的说明。
6.根据权利要求3至5之一所述的系统,其特征在于在所述管理服务器(5)上提供有程序部件(比如DLL)来使用所述的业务(3)。
7.根据权利要求1至6之一所述的系统,其特征在于所述的业务(3)建立至所述应用(1、1c)的连接,并且传输关于其功能的信息。
8.根据权利要求1至7之一所述的系统,其特征在于利用所述的业务(3)来把网络(LAN、ISDN)中的错误报告给网络管理员。
9.根据权利要求1至8之一所述的系统,其特征在于所述的至少两个应用(1、1c)是不同的应用(1、1c)。
全文摘要
本发明涉及一种系统,其中应用(1、1c)通过网络来连接。文本数据可以通过至少一个应用(1、1c)来作为语音数据来输出。一种用于把文本数据转换为语音数据的业务(3)可以被至少两个应用(1、1c)来使用。
文档编号G10L13/04GK1602608SQ02824869
公开日2005年3月30日 申请日期2002年11月18日 优先权日2001年12月11日
发明者R·纽豪斯 申请人:西门子公司
用于把文本数据转换为语音输出的系统的制作方法
相关推荐
专利名称:短内管大通孔型加热炉汽包消音器的制作方法技术领域:本实用新型涉及一种消音设备,特别是一种消音放散器的改迸, 具体地说是一种短内管大通孔型加热炉汽包消音器。背景技术:消音放散器是阻碍声音传播而让气流通过、防止气流动力性噪声 的专用设
专利名称:隐形眼镜片水合腔的制作方法技术领域:本发明与制造软型隐形眼镜片的改良新颖水合腔有关。本发明具体有关用金属或塑料制造的腔,可有效用于将一个或多个已经基本聚合了的软型隐形眼镜片连续或半连续水合。软质隐形眼镜片受欢迎程度的增高,引来了在
专利名称:无烧焊点镜架的制作方法技术领域:本实用新型涉及日常生活的眼镜。背景技术:眼镜的使用由来已久,时至今日,眼镜的工艺制作方法可以是相当成熟了,各制作程序的管理也趋完备,这保证了当今世界眼镜制造商的大批量生产,满足大量消费者的需求,现在
船舶主动力语音控制方法及系统的制作方法【专利摘要】本发明公开了一种船舶主动力语音控制方法及系统,其方法的步骤为:采用声纹识别方式确认是当班职守人员发出的语音,并作如下处理:如果不是当班职守人员发出的语音,忽略;如果是当班职守人员发出的语音,
专利名称:用于处理信号的方法和装置的制作方法技术领域:本发明涉及信号处理方法和装置,特别涉及用于根据信号的特性用适当的方案对 信号进行编码或解码的信号处理方法和装置。背景技术:通常,音频编码器能够以超过48kbps的高比特率提供高声音质量的
专利名称:制备电摄影光敏元件的方法技术领域:本发明涉及一种制备电摄影光敏元件的方法。使用有机光电导材料制成的电摄影光敏元件具有例如一含有产电荷材料的电荷产生层和一含有导电材料和润滑剂的表面保护层。这些层都是通过涂敷分散体,然后经干燥形成的,