语音操控方法、移动终端装置及语音操控系统的制作方法-品牌商务网

专利名称：：语音操控方法、移动终端装置及语音操控系统的制作方法
技术领域：
：本发明涉及一种语音操控方法，特别是涉及一种通过语音操控应用程序的语音操控方法、移动终端装置及语音操控系统。
背景技术：
：随着科技的发展，具有语音系统的移动终端装置已日渐普及。上述的语音系统是通过语音理解技术，让使用者与移动终端装置进行沟通。举例来说，使用者只要对上述的移动终端装置讲出某项要求，例如想要查车次、查天气或是欲拨打电话等，系统便会依据使用者的语音信号，采取对应的动作。然而对于未加入语音辨识的功能函数或应用程序，则会失去与使用者进行语音交互的能力。换言之，倘若应用程序未加入语音辨识功能，则使用者将无法通过语音来操控应用程序执行对应的动作，故对于使用者来说将造成许多的不便。基此,如何改进上述的这些缺点,成为亟待解决的议题。
发明内容本发明提供一种语音操控方法、移动终端装置以及语音操控系统，其可让使用者通过语音的方式来操控移动终端装置中的应用程序，藉以提升使用移动终端装置的便利性。本发明提出一种语音操控方法，用于移动终端装置，其中移动终端装置具有第一应用程序。在语音操控方法中，第一应用程序提供至少一操作参数至语音软件开发模块。语音软件开发模块通过语音接收单元接收语音信号并解析语音信号，以获得语音识别结果。语音软件开发模块判断语音识别结果是否符合操作参数。当语音识别结果符合操作参数时，语音软件开发模块根据语音识别结果，提供操作指令至第一应用程序。本发明另提出一种移动终端装置，其包括语音接收单元、应用程序模块以及语音软件开发模块。语音接收单元用以接收语音信号。应用程序模块用以提供应用程序。语音软件开发模块耦接语音接收单元与应用程序模块。其中，第一应用程序提供至少一操作参数至语音软件开发模块。语音软件开发模块通过语音接收单元接收语音信号并解析语音信号，以获得语音识别结果。语音软件开发模块判断语音识别结果是否符合操作参数。当语音识别结果符合操作参数时，语音软件开发模块根据语音识别结果，提供操作指令至第一应用程序。本发明另提出一种语音操控系统，其包括移动终端装置以及伺服器。移动终端装置包括语音接收单元以及应用程序模块。语音接收单元用以接收语音信号，而应用程序模块用以提供应用程序。伺服器适与移动终端装置连线，且伺服器具有语音软件开发模块。其中，应用程序提供至少一操作参数至语音软件开发模块。语音软件开发模块通过语音接收单元接收语音信号，并解析语音信号以获得语音识别结果。语音软件开发模块判断语音识别结果是否符合操作参数。当语音识别结果符合操作参数时，语音软件开发模块根据语音识别结果，提供操作指令至应用程序。基于上述，在本发明的语音操控方法、移动终端装置以及语音操控系统中，应用程序会提供操作参数至语音软件开发模块，而语音软件开发模块会解析来自使用者的语音信号而获得语音识别结果。当语音软件开发模块判断语音识别结果符合操作参数时，语音软件开发模块则会提供操作指令至所述应用程序。藉此，本发明可让使用者以语音的方式来操控应用程序，藉以提升移动终端装置的使用便利性。为使本发明的上述特征和优点能更明显易懂，下文特举实施例，并结合附图详细说明如下。图1是依照本发明一实施例所绘示的移动终端装置的方块图。图2是依照本发明一实施例所绘示的语音操控方法的流程图。图3是依照本发明一实施例所绘示的语音操控方法的流程图。图4是依照本发明一实施例所绘示的语音操控系统的方块图。图5是依照本发明一实施例所绘示的语音操控方法的流程图。附图符号说明100、400:移动终端装置110、410:语音接收单元120、420:应用程序模块122、124、126、422、424、426:应用程序130,430:语音软件开发模块132、432:呼叫接口134、434:通知接口136、436:语义数据库40:伺服器4000:语音操控系统P1、P2、P3:操作参数S:操作指令S202、S204、S206、S208、S210、S302、S304、S306、S308、S310、S312、S314、S502、S504、S506、S508、S510:语音操控方法的各步骤具体实施例方式虽然现今的移动终端装置已可提供语音系统，以让使用者发出语音来和移动终端装置沟通，但若应用程序本身不具有语音理解功能，则使用者无法通过语音的方式来操控应用程序执行对应的操作功能。为此，本发明提出一种语音操控方法、移动终端装置及语音操控系统，让使用者能够更便捷地通过语音的方式来操控移动终端装置中的应用程序，以提升使用移动终端装置的便利性。为了使本发明的内容更为明了，以下特举实施例作为本发明确实能够据以实施的范例。图1是依照本发明一实施例所绘示的移动终端装置100的方块图。请参照图1，移动终端装置100例如为移动电话(Cellphone)、个人数字助理(PersonalDigitalAssistant,PDA)手机、智慧型手机(Smartphone),或是安装有通讯软件的掌上型计算机(PocketPC)、平板型计算机(TabletPC)或笔记型计算机等等。移动终端装置100可以是任何具备通讯功能的便携式(Portable)移动装置，在此并不限制其范围。移动终端装置100包括语音接收单元110、应用程序模块120以及语音软件开发模块130，这些元件的功能分述如下。语音接收单元110用以接收来自使用者的语音信号，此语音接收单元110例如为麦克风(Microphone)等接收音讯的装置。应用程序模块120用以提供一个或多个应用程序。应用程序例如桌面应用程序、浏览器应用程序、文书处理应用程序或影像撷取应用程序等，不限于上述。图1绘示应用程序122、124及126为例，但本实施例并不限制应用程序的数量。语音软件开发模块130例如为语音软件开发工具包(softwaredevelopmentkit,SDK)。语音软件开发模块130可提供语音识别(SpeechRecognition)、语音合成(SpeechSynthesis)或其他语音编译等功能。需说明的是，上述的应用程序模块120与语音软件开发模块130可由一个或数个逻辑门组合而成的硬件电路来实作，亦可以是以计算机程序码来实作，并藉由移动终端装置100的中央处理器来执行。在本实施例中，语音软件开发模块130可提供呼叫接口132、通知接口134以及语义数据库136。其中，呼叫接口132用以接收来自应用程序的多个操作参数，例如是对显示页面进行操作时，可输入「上一页」、「下一页」、「放大页面」或「缩小页面」等命令。通知接口134用以输出操作指令至应用程序，其中，依据不同语音辨识结果中所符合的操作参数，语音软件开发模块130会产生不同的操作指令,例如可以是「pageup」、「pagedown」，使应用程序依据操作指令来执行对应的操作功能，例如是执行翻页的操作功能。语音软件开发模块130可根据语义数据库136而解析出语音信号中的请求信息。具体来说，应用程序会提供操作参数至语音软件开发模块130，而语音软件开发模块130可将语音接收单元110所接收的语音信号(比如是，帮我翻下一页等)根据语义数据库136进行解析，而获得语音识别结果，并且判断此语音识别结果是否符合应用程序所提供的操作参数。倘若此语音识别结果符合操作参数，则语音软件开发模块130会通过通知接口134来输出对应于语音识别结果的操作指令至应用程序。此外，开发者或使用者也可在语音软件开发模块130中自行定义功能函数，来对移动终端装置100进行语音命令控制或对话。举例来说，开发者可在语音软件开发模块130中依据语音识别结果，通过通知接口134传送预设指令至应用程序模块120，使得应用程序模块120启动对应于预设指令的应用程序、或是让应用程序依据定义执行对应的功能。例如，应用程式开发者可在语音软件开发模块130中自行定义”把目前显示的照片送往微博”的操作参数与对应功能(假设目前显示照片的应用程序未包含此功能)，于是当使用者输入「帮我把照片往微博」时，可以在语音辨识结果符合此操作参数后，可透过通知接口134将相关命令送往应用程序模块120(或是可执行传送物件至微博的应用程序)，而此应用程序便通知应用程序模块120开启对应的应用程序，并在取得物件(亦即目前显示的照片)的储存位址后，将此物件送往微博。换言之，本实施例的应用程序本身可不需提供语音理解的功能(例如语音识别或语音合成等)，而当使用者欲通过语音来操控应用程序时，语音软件开发模块130会解析使用者的语音，藉以判断是否输出对应的指令至应用程序。如此一来，当应用程序接收到来自语音软件开发模块130的指令时，应用程序可进而执行对应的操作功能。藉此，使用者可便利地通过语音的方式来操控应用程序。举例来说，一个仅提供少数功能的家电(例如冰箱、冷气机、洗衣机、微波炉…等)，便可透过本发明的语音软件开发模块130而达到受控于使用者语音的目的。例如，冷气机的应用程序开发者可以透过本发明语音软件开发模块130建立对应的操作参数,例如开机(TurnOn)、关机(Turnoff)、降温(TempDown)、升温(TempUp)、调整温度至(TempTo)，于是当语音辨识结果符合时，冷气机的应用程序可以依据使用者的语音来开机、关机、或调整温度到用户指定的温度的控制。其他家电的控制方式亦可如上所述，熟习本发明技艺者可依据上述方式透过语音软件开发模块130进行对应功能的设定，但所有基于本发明精神所为之等效修饰仍应包含于本发明申请专利范围中。以下即结合上述移动终端装置100来说明语音操控方法，其中以应用程序122为例来进行说明。图2是依照本发明一实施例所绘示的语音操控方法的流程图。请同时参照图1及图2，于步骤202中，应用程序122会提供至少一操作参数Pl至语音软件开发模块130。在本实施例中，应用程序122可通过提供操作参数Pl来呼叫语音软件开发模块130，而语音软件开发模块130接收到操作参数Pl后可开始进行语音理解。详细而言，当应用程序122被启动时(例如使用者点选应用程序122或者移动终端装置100的作业系统启动应用程序122)，应用程序122则会提供一个或多个操作参数Pl至语音软件开发模块130。上述操作参数Pl例如是应用程序122用以表示其可接收到的命令、文字序列或物件的位置信息等输入值，例如命令、字串参数以及位置参数，不限于此。因此，语音软件开发模块130根据应用程序122所提供的操作参数P1，可判断出应用程序122所需要的输入值是属于命令、文字序列或位置信息。举例来说，假设应用程序122为浏览器应用程序，则应用程序122所提供的操作参数Pl例如是对应于「上一页」、「下一页」、「放大页面」或「缩小页面」等命令，不限于此。假设应用程序122为笔记本应用程序，则应用程序122所提供的操作参数Pl例如是对应于「新增笔记」、「删除笔记」等命令，或者是对应于读取文字序列的字串参数，不限于此。此外，假设应用程序122为邮件应用程序，则应用程序122所提供的操作参数Pl例如是对应于「新增邮件」等命令、对应于读取文字序列的字串参数，或者是上载文档时所需的文档的位置参数，不限于此。应注意的是，应用程序122开发者可自行定义可接受语音控制的功能，例如邮件应用程序开发者可设定邮件的发送、接收、开启、关闭等较简单的功能可受控于使用者的语音，但邮件的编辑、转寄等较复杂的功能仍依据用户的输入再决定处理方式，而应用程序受控于语音的功能可由应用程序开发者自行决定，本发明对此并不加以限制。于步骤204中，语音软件开发模块130会通过语音接收单元110接收语音信号并解析此语音信号，以获得语音识别结果。其中，语音信号例如是来自使用者所说的语音，且语音信号具有使用者的请求信息。具体而言，来自使用者的语音信号可以是命令句或询问句等，例如「看上一页」、「放大第三行第四列」、「声音稍微大一点」、「把照片发送到我的微博」、「把这条简讯发送给王大同」或「今天会不会下雨？」等等。在本实施例中，语音软件开发模块130会解析来自使用者的语音信号而获得语音信号的一个或多个特征语义，并且语音软件开发模块130会根据这些特征语义来产生语音识别结果。具体而言，特征语义例如是语音软件开发模块130解析语音信号后所得到的关键词等，而语音软件开发模块130根据特征语义可获得使用者的请求信息。举例来说，当语音信号为「看上一页」时，语音软件开发模块130经解析所获得的特征语义例如是「『看』、『上一页』」。又例如，当语音信号为「声音稍微大一点」时，语音软件开发模块130经解析所获得的特征语义例如是「『声音』、『稍微』、『大一点』」。或者，当语音信号为「把照片发送到我的微博」时，语音软件开发模块130经解析所获得的特征语义例如是「『照片』、『发送到』、『我的微博』」。进一步地说，语音软件开发模块130可依据特征语义自语义数据库136查询此特征语义对应的类别，其中类别例如是命令、物件、时间、文字序列或位置信息等。更具体而言，语义数据库136可记录有特征语义与对应的类别的关系。因此，语音软件开发模块130可根据语义数据库136而解析出语音信号中的请求信息，据以做为语音识别结果。举例来说，当语音信号为「看上一页」时，语音软件开发模块130会先解析出特征语义分别为「『看』、『上一页』」，接着，语音软件开发模块130可根据语义数据库136而判断出「『看』、『上一页』」是使移动终端装置100执行「将网页回到上一页」的命令。又例如，当语音信号为「声音稍微大一点」时，语音软件开发模块130会先解析出特征语义分别为「『声音』、『稍微』、『大一点』」，且语音软件开发模块130可根据语义数据库136而判断出此语音信号，是使移动终端装置100执行「调升音量」的命令。接后，于步骤S206中，语音软件开发模块130会判断语音识别结果是否符合操作参数P1。具体来说，本实施例的语义数据库136也可储存特征语义所对应的类别与操作参数之间的关系，例如，语义数据库136可记录特征语义所对应的类别是对应于哪一种操作参数。因此，语音软件开发模块130便可藉由查询语义数据库136，来判断出语音识别结果是否符合操作参数Pl。举例来说，当应用程序122提供给语音软件开发模块130的操作参数Pl包括「调升音量」、「调降音量」、「静音」、「调升亮度」或「调降亮度」，而语音识别结果为使移动终端装置100执行「调升音量」的命令时，语音软件开发模块130则会判断「调升音量」这个命令，是否符合「调升音量」、「调降音量」、「静音」、「调升亮度」或「调降亮度」这些操作参数Pl的其中之一。当语音软件开发模块130判断语音识别结果符合操作参数时，则如步骤S208所示，语音软件开发模块130会根据语音识别结果，提供操作指令S至应用程序122。详细而言，由于语音软件开发模块130可提供不同的功能函数，而这些功能函数可接收不同的输入值以产生对应的输出，因此依据不同的语音识别结果中所符合的操作参数P1，语音软件开发模块130会产生不同的操作指令S。在本实施例中，语音软件开发模块130所提供的功能函数可根据开发者或使用者而被定义，亦即，开发者或使用者可定义语音软件开发模块130依据不同的语音识别结果，而产生语音识别结果所对应的操作指令S。藉此，当语音识别结果符合操作参数Pl时，语音软件开发模块130可将所产生的操作指令S，传送至提供操作参数Pl的应用程序122，进而通过操作指令S来操控应用程序122。在本实施例中，应用程序接收到操作指令S之后，可依据操作指令S而执行对应的操作功能。由于操作功能是对应于应用程序所提供的操作参数，因此语音软件开发模块130会通过操作指令S来操控应用程序122，使应用程序122执行对应于操作参数Pl的操作功能。举例而言，当语音识别结果为使移动终端装置100执行「调升音量」的命令，且此命令符合操作参数Pl时，移动终端装置100则会产生对应于「调升音量」的操作指令S，并将此操作指令S传送至应用程序122，使应用程序122进行音量的调升。值得一提的是，应用程序122接收到操作指令S之后，可依据应用程序122目前的状态，以判断是否进行操作指令S所对应的操作功能。举例而言，倘若应用程序判断移动终端装置100目前的音量已达最大值，则应用程序122不会依据操作指令S而对音量进行调升。返回步骤S206，当语音软件开发模块130判断语音识别结果不符合操作参数Pl时，则如步骤S210所示，语音软件开发模块130会依据语音识别结果传送预设指令至应用程序模块124，使其依据预设指令启动另一应用程序并接收此预设指令。举例来说，当语音信号为「明天会下雨吗？」(其语音识别结果例如是使移动终端装置100执行查询天气的命令)，倘若应用程序122未提供对应于「查询天气」的操作参数Pl至语音软件开发模块130，则语音软件开发模块130便会判断语音识别结果不符合操作参数Pl。在此，语音软件开发模块130会传送预设指令至应用程序模块124，而应用程序模块124便会启动搜寻引擎应用程序(例如在移动终端装置100的屏幕上显示搜寻引擎应用程序)，以查询明天的天气。如此一来，若使用者所启动的应用程序122未提供符合语音识别结果的操作参数P1，移动终端装置100可自动传送预设指令至符合语音识别结果的应用程序。为了详细说明本实施例的语音操控方法，底下举一实施例来详细说明。假设使用者启动应用程序122，此应用程序122例如为浏览器应用程序。首先，应用程序122会提供「看上一页」、「看下一页」、「放大页面」或「缩小页面」等类别为命令的操作参数Pl至语音软件开发模块130。接着，若使用者的语音信号为「看上一页」，则语音软件开发模块130解析此语音信号后，可判断出这个语音信号是使应用程序122执行回到上一个网页的命令(即语音识别结果)。由于此语音识别结果符合「看上一页」这个操作参数P1，因此语音软件开发模块130会传送操作指令S至应用程序122，其中操作指令S用以操控应用程序122执行回到上一个网页的动作。如此一来，使用者可通过语音的方式，来操控应用程序122返回上一个网页。在另一实施例中，语音软件开发模块130在提供操作指令S至应用程序122时，还可将语音信号中所对应的文字序列传送至应用程序122，使得应用程序122读取语音信号中所对应的文字序列，并使应用程序122依据此文字序列来执行对应于操作指令S的操作功能。底下即结合图1的移动终端装置100与图2的语音操控方法各步骤，并以应用程序122为例来进行说明。首先，应用程序122提供操作参数Pl至语音软件开发模块130(步骤S202)。接着，语音软件开发模块130会通过语音接收单元110接收来自使用者的语音信号，并且语音软件开发模块130会对此语音信号进行解析，以获得语音识别结果(步骤S204)。语音软件开发模块130在判断语音识别结果是否符合操作参数Pl时(步骤S206)，语音软件开发模块130可进一步判断应用程序122所提供的操作参数Pl是否具有字串参数，亦即判断应用程序122所需要的输入值是否属于文字序列。详细而言，当应用程序122所提供的操作参数Pl具有字串参数时，语音软件开发模块130可将解析后的语音信号视为文字序列，并依据此文字序列提供操作指令S至应用程序122。此外，于一实施例中，语音软件开发模块130可进一步判断语音识别结果中是否具有对应于字串参数的文字序列。在此，倘若语音软件开发模块130判断语音识别结果中有对应于字串参数的文字序列，则语音软件开发模块130在提供操作指令S至应用程序122时(步骤S208)，会将语音识别结果中的文字序列传送至提供的应用程序122。另一方面，倘若语音软件开发模块130判断语音识别结果不具有对应于字串参数的文字序列，语音软件开发模块130不会将此文字序列传送至应用程序122。或者，当语音软件开发模块130判断语音识别结果不符操作参数Pl时，语音软件开发模块130不会传送操作指令S至应用程序，或者传送预设指令至另一应用程序(步骤S210)。如此一来，使用者不仅可通过语音来操控应用程序，且亦可操控应用程序122读取语音中对应的文字序列。举例来说，假设应用程序122为笔记本应用程序，则当使用者启动应用程序122时(例如点选应用程序122或者通过语音方式来唤醒应用程序122)，应用程序122会提供「新增笔记」、「删除笔记」、「修改笔记」、「标记笔记」等类别为命令的操作参数Pl以及类别为字串参数的操作参数Pl至语音软件开发模块130。上述操作参数Pl为举例说明，并不限于此。此时，若语音接收单元110接收到使用者的语音信号为「新增笔记，内容为『明天下午一点开会』」，则语音软件开发模块130会将语音接收单元110所接收的语音信号进行解析而获得「『新增』、『笔记』、『内容为』、『明天』、『下午』、『一点』、『开会』」这些特征语义。在此，语音软件开发模块130会判断「『新增』、『笔记』、『内容为』」这些特征语义是类别为命令的操作参数Pl(即「新增笔记」)，且语音软件开发模块130可判断出现在「内容为」之后的语音信号(即「明天下午一点开会」)为对应于字串参数的文字序列，即语音识别结果符合类别为字串参数的操作参数P1。之后，语音软件开发模块130会依据语音识别结果中相符合的操作参数Pl(即「新增笔记」)传送操作指令S，以及传送语音识别结果中的文字序列(即「明天下午一点开会」)至应用程序122。由于操作指令S是对应于「新增笔记」这个操作参数，因此应用程序122会新增一个笔记数据，并且在此笔记中记录「明天下午一点开会」这个文字序列。如此一来，使用者可直接通过语音的方式，命令应用程序122读取使用者说的语音所对应的文字序列。在另一实施例中，上述语音软件开发模块130在提供操作指令S至应用程序122时，还可将语音信号中所指的物件的位置信息传送给应用程序122，使得应用程序122可取得此物件所在的物件路径。底下即结合图1的移动终端装置100与图2的语音操控方法各步骤，并以应用程序122为例来进行说明。首先，应用程序122提供操作参数Pl至语音软件开发模块130(步骤S202)。接着，语音软件开发模块130会通过语音接收单元110接收来自使用者的语音信号并对此语音信号进行解析，以获得语音识别结果(步骤S204)。语音软件开发模块130在判断语音识别结果是否符合操作参数Pl时(步骤S206)，可进一步判断应用程序122所提供的操作参数Pl是否具有位置参数，亦即判断应用程序122所需要的输入值是否属于路径(例如地址或网址等)。并且，语音软件开发模块130会进一步判断语音识别结果中所解析出的特征语义是否具有位置信息。在此说明的是，若语音软件开发模块130解析语音信号而识别出物件，则上述所指的位置信息指的是表示此物件相对于应用程序122的位置。举例来说，若应用程序122为影像浏览应用程序，则其位置信息可以是指应用程序122显示当前的影像的位置(例如应用程序122的显示画面中的中间区域)。又例如，位置信息可以是指应用程序122显示部分区域的位置，不限上述。在本实施例中，语音软件开发模块130解析语音信号时，可查询语义数据库136来获取位置信息。具体来说，本实施例的语义数据库136中可记录位置关键词与位置信息的关系，其中位置关键词例如是使用者指称此物件时所说的关键词。例如，若使用者正在操作影像浏览应用程序并开启多个影像，则上述的位置关键词例如是「这张」、「全部」或「左上角」等。在此，语义数据库136可记录哪些位置关键词是对应于应用程序122所指的哪个位置。例如，当位置关键词为「这张」时，语义数据库136会记录「这张」是对应于应用程序122在其显示画面当前所显示的影像，而此影像例如是位于应用程序122的显示画面中的中间区域。又例如，当位置关键词为「左上角」时，语义数据库136会记录「左上角」是对应于应用程序122在其显示画面的左上角所显示的影像。藉此，根据语音信号中所述物件的位置关键词，语音软件开发模块130可判断出语音信号中所指的物件是位在相对于应用程序122的哪个位置(即物件的位置信息)。在本实施例中，当语音识别结果具有位置信息，则语音软件开发模块130会依据位置信息取得物件的物件路径。物件路径是表示此物件的位置来源(例如物件所在的地址或网址等)。举例来说，对于储存在移动终端装置100的物件来说，其物件路径例如是物件的文档路径。对于因特网中的物件来说，其物件路径例如是开启此物件的网址。换言之，语音软件开发模块130可根据位置信息而取得应用程序122中的物件的物件路径。如此一来，当应用程序122所提供的操作参数Pl具有位置参数，且语音软件开发模块130判断语音识别结果符合应用程序122所提供的操作参数Pl时(即语音识别结果中具有对应于位置参数的位置信息)，语音软件开发模块130会提供操作指令S至应用程序122，使应用程序122取得对应于位置信息的物件路径，并根据物件路径取得物件。值得一提的是，由于语音软件开发模块130解析语音信号后，可获得不同的特征语义，因此依据特征语义，语音软件开发模块130可判断语音信号中所指的目标信息，其中目标信息中具有目标端的信息。藉此，语音软件开发模块130可提供操作指令S至应用程序122，使得应用程序122根据上述物件路径取得物件，以及依据目标信息将此物件传送至目标端。底下再举一例来进行说明。假设应用程序122为影像浏览应用程序，则使用者在启动此应用程序122来浏览影像时，应用程序122会将「新增影像」、「删除影像」、「传送影像」或「编辑影像」等这些操作参数Pl传送至语音软件开发模块130。若使用者所说的语音信号为「把当前的照片传送到我的微博」，语音软件开发模块130可从语音信号解析出「『当前的』、『照片』、『传送到』、『我的微博』」这些特征语义。在此，由于语义数据库136中可记录特征语义所对应的关键词与命令、位置信息或目标信息等之间的关系，因此语音软件开发模块130会根据特征语义所对应的关键词，而解析出哪些特征语义是对应于命令、哪些特征语义是对应于物件的位置信息，或者哪些特征语义是对应于目标信息的这些语音识别结果。故对于上述的语音信号而言，语音软件开发模块130可解析出「当前的」为位置信息，「照片」为物件，「传送到」为命令，以及「我的微博」为目标信息。亦即，语音软件开发模块130解析语音信号所得到的语音识别结果符合应用程序122所提供的操作参数Pl(即「传送影像」)，且语音识别结果中所解析出的特征语义是对应于物件、位置信息以及目标信息。接着，语音软件开发模块130可传送操作指令S至应用程序122，其中操作指令S具有上述命令、物件的位置信息以及目标信息。因此，应用程序122会依据位置信息(S叮当前的」)取得物件的物件路径(例如是照片储存在移动终端装置100的文档路径，或者应用程序122开启此照片的网址)，并将物件传送到目标端(即「我的微博」)。如此一来，使用者可直接通过语音的方式，命令应用程序122取得物件的物件路径，藉以执行应用程序122的操作功能。值得一提的是，当语音软件开发模块130判断语音识别结果不符合操作参数时，语音软件开发模块130可根据语音识别结果，提供操作指令S至符合语音识别结果的另一应用程序，进而操控所述另一应用程序执行对应于操作指令S的操作功能。底下再举一实施例来进行说明。图3是依照本发明一实施例所绘示的语音操控方法的流程图。请同时参照图1、图2与图3，本实施例的语音操控方法与图2的步骤相似(图3的步骤S302S308对应于图2的步骤S202S208)，其不同之处在于:于图3的步骤S306中，当语音软件开发模块130判断语音识别结果不符合操作参数Pl时，则如步骤S310所示，语音软件开发模块130会判断语音识别结果是否符合其他应用程序(例如为应用程序124)所提供的操作参数P2，其中应用程序124例如是已被使用者启动而在背景模式中执行。当语音软件开发模块130判断语音识别结果符合应用程序124所提供的操作参数P2时，则如步骤S312所示，语音软件开发模块130会提供操作指令S至应用程序124，进而使应用程序124执行对应的操作功能。反之，当语音软件开发模块130判断语音识别结果不符合应用程序122、124及其他应用程序所提供的操作参数时，则如步骤S314所示，语音软件开发模块130会自因特网下载符合语音识别结果的应用程序(例如为应用程序126)，其中应用程序126可提供符合语音识别结果的操作参数P3。并且，语音软件开发模块130会提供操作指令S至应用程序126，使应用程序126执行对应的操作功能。底下再举一例来进行说明。在此，假设使用者所说的语音信号为「把当前的照片传送到我的微博」，其中语音软件开发模块130解析语音信号所获得的语音识别结果具有「传送到」这个命令。并且，假设应用程序122提供至语音软件开发模块130的操作参数Pl不具有对应于「传送到」这个操作参数。在本实施例中，语音软件开发模块130会判断其他应用程序所提供的操作参数是否具有对应于「传送到」这个命令的这个操作参数。倘若应用程序124已被使用者启动而已提供符合「传送到」这个命令的操作参数P2至语音软件开发模块130，则语音软件开发模块130会提供操作指令S至应用程序124。另一方面，倘若应用程序122、124或其他应用程序未提供对应于「传送到」这个命令的这个操作参数至语音软件开发模块130，则语音软件开发模块130会依据「传送到」这个命令，自因特网下载可提供符合「传送到」的操作参数的应用程序126。藉此，语音软件开发模块130便可提供操作指令S至应用程序126。如此一来，语音软件开发模块130可依据解析语音信号所获得的语音识别结果，自动判断符合语音识别结果的操作参数所对应的应用程序，并将操作指令传送至应用程序，藉以让使用者可更方便的通过语音的方式来操控应用程序。需说明的是，上诸实施例中的语音软件开发模块130也可配置于伺服器上，据以实现本发明的语音操控方法。底下再举一实施例来进行说明。图4是依照本发明一实施例所绘示的语音操控系统4000的方块图。请参照图4，语音操控系统4000具有移动终端装置400以及伺服器40。伺服器40例如是云端伺服器。移动终端装置400与图1的移动终端装置100相似，不同之处在于:移动终端装置400可与伺服器10连线，且语音软件开发模块430是配置于伺服器40中。以下即结合语音操控系统4000来说明本发明的语音操控方法，其中以应用程序422为例来进行说明。图5是依照本发明一实施例所绘示的语音操控方法的流程图。请同时参照图4及图5，于步骤502中，应用程序422会提供操作参数Pl，并通过网络连线传送至伺服器40中的语音软件开发模块430。于步骤S504中。语音软件开发模块430取得语音接收单元410所接收的语音信号，并解析此语音信号以获得语音识别结果。接着，在步骤S506中，语音软件开发模块430会判断语音识别结果是否符合操作参数Pl。当语音识别结果符合操作参数Pl时，则如步骤S508所示，语音软件开发模块430根据语音识别结果，并通过网络连线提供操作指令S至应用程序422。另一方面，当语音识别结果不符合操作参数Pl时，则如步骤S510所示，语音软件开发模块430则会依据语音识别结果，传送预设指令至应用程序模块420，使其依据预设指令启动另一应用程序以接收此预设指令。以上步骤S502S510与第一实施例的步骤S202S210相同或相似，故其详细内容在此不再赘述。综上所述，在本发明的语音操控方法、移动终端装置以及语音操控系统中，应用程序会提供操作参数至语音软件开发模块，而语音软件开发模块会解析来自使用者的语音信号而获得语音识别结果。在此，语音软件开发模块会判断语音识别结果是否符合操作参数，因此当语音识别结果符合时，语音软件开发模块则会提供操作指令至所述应用程序。其中，语音软件开发模块可依据语音识别结果中的命令、文字序列、物件的位置信息等请求讯息传送至所述应用程序，使此应用程序执行对应于操作指令的操作功能。由于语音软件开发模块会进行语音识别，据以提供指令来操控应用程序，因此应用程序在不进行语音理解(例如语音识别或者语音合成)的情况下，亦可执行使用者的语音信号所对应的操作功能。如此一来，通过语音软件开发模块，本发明可让使用者以语音的方式来操控应用程序，进而可执行各种应用程序所提供的动作与工作，藉以提升使用移动终端装置的便利性。虽然本发明已以实施例揭示如上，然其并非用以限定本发明，本领域技术人员，在不脱离本发明的精神和范围的前提下，可作些许的更动与润饰，故本发明的保护范围是以本发明的权利要求为准。权利要求1.一种语音操控方法，用于一移动终端装置，其中该移动终端装置具有一第一应用程序，该方法包括:该第一应用程序提供至少一操作参数至一语音软件开发模块；该语音软件开发模块通过一语音接收单元接收一语音信号并解析该语音信号，以获得一语音识别结果；该语音软件开发模块判断该语音识别结果是否符合该操作参数；以及当该语音识别结果符合该操作参数时，该语音软件开发模块根据该语音识别结果，提供一操作指令至该第一应用程序。2.如权利要求1所述的语音操控方法，还包括:该第一应用程序根据该操作指令执行对应于该操作指令的一操作功能。3.如权利要求1所述的语音操控方法，其中该操作参数包括一命令、一字串参数以及一位置参数至少其中之一。4.如权利要求3所述的语音操控方法，还包括:该语音软件开发模块判断该应用程序所提供的该操作参数是否具有该字串参数；以及当该操作参数具有该字串参数，且该语音识别结果具有对应于该字串参数的一文字序列时，该语音软件开发模块将该语音识别结果中的该文字序列传送至该第一应用程序。5.如权利要求3所述的语音操控方法，还包括:该语音软件开发模块判断该应用程序所提供的该操作参数是否具有该位置参数；以及当该操作参数具有该位置参数，且该语音识别结果具有对应于该位置参数的一位置信息时，该语音软件开发模块提供该操作指令至该应用程序，使该应用程序取得对应于该位置信息的一物件路径，并根据该物件路径取得一物件。6.如权利要求1所述的语音操控方法，其中该语音识别结果还具有一目标信息，该语音操控方法还包括:该应用程序根据该操作指令，执行对应于该语音识别结果的该操作功能，其中该操作功能包括依据该目标信息将该物件传送至一目标端。7.如权利要求1所述的语音操控方法，还包括:当该语音识别结果不符合该第一应用程序所提供的该操作参数时，该语音软件开发模块提供该操作指令至符合该语音识别结果的一第二应用程序，使该第二应用程序执行对应于该操作指令的该操作功能。8.如权利要求1所述的语音操控方法，还包括:当该语音识别结果不符合该操作参数时，该语音软件开发模块自一因特网下载符合该语音识别结果的一第三应用程序，并提供该操作指令至该第三应用程序，使该第三应用程序执行对应于该操作指令的该操作功能。9.一种移动终端装置，包括:一语音接收单元，用以接收一语音信号；一应用程序模块，用以提供一第一应用程序；以及一语音软件开发模块，耦接该语音接收单元与该应用程序模块，其中该第一应用程序提供至少一操作参数至该语音软件开发模块，该语音软件开发模块通过该语音接收单元接收该语音信号并解析该语音信号，以获得一语音识别结果，该语音软件开发模块判断该语音识别结果是否符合该操作参数，以及当该语音识别结果符合该操作参数时，该语音软件开发模块根据该语音识别结果，提供一操作指令至该第一应用程序。10.如权利要求9所述的移动终端装置，其中该第一应用程序根据该操作指令执行对应于该操作指令的一操作功能。11.如权利要求9所述的移动终端装置，其中该操作参数包括一命令、一字串参数以及一位置参数至少其中之一。12.如权利要求11所述的移动终端装置，其中该语音软件开发模块判断该应用程序所提供的该操作参数是否具有该字串参数，以及当该操作参数具有该字串参数，且该语音识别结果具有对应于该字串参数的一文字序列时，该语音软件开发模块将该语音识别结果中的该文字序列传送至该第一应用程序。13.如权利要求11所述的移动终端装置，其中该语音软件开发模块判断该应用程序所提供的该操作参数是否具有该位置参数，以及当该操作参数具有该位置参数，且该语音识别结果具有对应于该位置参数的一位置信息时，该语音软件开发模块提供该操作指令至该应用程序，使该应用程序取得对应于该位置信息的一物件路径，并根据该物件路径取得一物件。14.如权利要求9所述的移动终端装置，其中该语音识别结果还具有一目标信息，且该应用程序根据该操作指令，执行对应于该语音识别结果的该操作功能，其中该操作功能包括依据该目标信息将该物件传送至一目标端。15.如权利要求9所述的移动终端装置，其中当该语音识别结果不符合该第一应用程序所提供的该操作参数时，该语音软件开发模块提供该操作指令至符合该语音识别结果的一第二应用程序，使该第二应用程序执行对应于该操作指令的该操作功能。16.如权利要求9所述的移动终端装置，其中当该语音识别结果不符合该操作参数时，该语音软件开发模块自一因特网下载符合该语音识别结果的一第三应用程序，并提供该操作指令至该第三应用程序，使该第三应用程序执行对应于该操作指令的该操作功能。17.一种语音操控系统，包括:一种移动终端装置，包括:一语音接收单元，用以接收一语音信号；以及一应用程序模块，用以提供一第一应用程序；以及一伺服器，与该移动终端装置连线，该伺服器具有一语音软件开发模块，其中该应用程序提供至少一操作参数至该语音软件开发模块，该语音软件开发模块通过该语音接收单元接收该语音信号，并解析该语音信号以获得一语音识别结果，该语音软件开发模块判断该语音识别结果是否符合该操作参数，以及当该语音识别结果符合该操作参数时，该语音软件开发模块根据该语音识别结果，提供一操作指令至该应用程序。18.如权利要求17所述的语音操控系统，其中该第一应用程序根据该操作指令执行对应于该操作指令的一操作功能。19.如权利要求17所述的语音操控系统，其中该操作参数包括一命令、一字串参数以及一位置参数至少其中之一。20.如权利要求19所述的语音操控系统，其中该语音软件开发模块判断该应用程序所提供的该操作参数的是否具有该字串参数，以及当该操作参数具有该字串参数，且该语音识别结果具有对应于该字串参数的一文字序列时，该语音软件开发模块将该语音识别结果中的该文字序列传送至该第一应用程序。21.如权利要求19所述的语音操控系统，其中该语音软件开发模块判断该应用程序所提供的该操作参数的是否具有该位置参数，以及当该操作参数具有该位置参数，且该语音识别结果具有对应于该位置参数的一位置信息时，该语音软件开发模块提供该操作指令至该应用程序，使该应用程序取得对应于该位置信息的一物件路径，并根据该物件路径取得一物件。22.如权利要求21所述的语音操控系统，其中该语音识别结果还具有一目标信息，且该应用程序根据该操作指令，执行对应于该语音识别结果的该操作功能，其中该操作功能包括依据该目标信息将该物件传送至一目标端。23.如权利要求17所述的语音操控系统，其中当该语音识别结果不符合该第一应用程序所提供的该操作参数时，该语音软件开发模块提供该操作指令至符合该语音识别结果的一第二应用程序，使该第二应用程序执行对应于该操作指令的该操作功能。24.如权利要求17所述的语音操控系统，其中当该语音识别结果不符合该操作参数时，该语音软件开发模块自一因特网下载符合该语音识别结果的一第三应用程序至该移动终端装置，并提供该操作指令至该第三应用程序，使该第三应用程序执行对应于该操作指令的该操作功能。全文摘要一种语音操控方法、移动终端装置及语音操控系统。其中语音操控方法包括以下步骤应用程序提供至少一操作参数至语音软件开发模块；语音软件开发模块通过语音接收单元接收语音信号并解析此语音信号，以获得语音识别结果；语音软件开发模块判断语音识别结果是否符合操作参数；以及当语音识别结果符合操作参数时，语音软件开发模块提供操作指令至应用程序。文档编号G10L15/30GK103200329SQ201310122599公开日2013年7月10日申请日期2013年4月10日优先权日2013年4月10日发明者张国峰申请人:威盛电子股份有限公司

本文推荐语音操控方法、移动终端装置及语音操控系统的制作方法仅代表作者观点，不代表本网站立场。本站对作者上传的所有内容将尽可能审核来源及出处，但对内容不作任何保证或承诺。请读者仅作参考并自行核实其真实性及合法性。如您发现图文视频内容来源标注有误或侵犯了您的权益请告知，本站将及时予以修改或删除。未经允许不得转载：http://www.pinpai35.com/1656487410.html

当前位置：网站首页>专利 >正文

语音操控方法、移动终端装置及语音操控系统的制作方法

相关推荐