当前位置:网站首页>专利 >正文

一种适用于云平台的多语音控制方法

专利名称:一种适用于云平台的多语音控制方法
技术领域
本发明涉及一种适用于云平台的多语音控制方法。
背景技术
目前的物联网平台多采用手动操控或计算机远程操控,存在操作繁杂及接口不统一的弊端,用户需要熟悉了产品的操作流程后方可进行操控,十分不方便。而且现有的语音控制方法因其单一性和非指向性,无法识别特定人员所发送的指令,极易受干扰并产生误操作。

发明内容
本发明目的在于提供一种适用于云平台的多语音控制方法,用语音识别技术和 云服务相结合,使用户可以非常容易地操控整个物联网智能控制平台,例如家居系统,生产系统,物流系统等,并可以通过语音控制从互联网及云端获取相应的资源。一种适用于云平台的多语音控制方法,包括如下几个步骤
步骤I、用户的口令采集
采集用户的口令信息,将预录入的口令信息转换成声纹和声音波形信息存入用户特征数据库;
步骤2、口令识别,激活非特定人声识别引擎
特定人声识别引擎处于待机状态,当语音采集装置采集到声音信息时,将分解的声纹和声音波形信息发送给特定人声识别引擎,该特定人声识别引擎首先将收到的声纹信息与用户特征数据库中预录入的声纹信息进行比对,若相符则确认用户身份,进一步将声音波形信息与用户特征数据库中预录入的声音波形信息进行比对,若相符则确认口令,并发出包含经确认的用户身份和口令的激活编码,去激活非特定人声采集引擎,该特定人声识别引擎进入休眠状态;
当激活非特定人声采集引擎后,特定人声识别引擎进入休眠状态,二者不能同时进行工作;激活非特定人声采集引擎后,下一次语言采集装置采集到声音只会发送到非特定人声采集引擎中,非特定人声采集引擎若在一定时间内未接收到语音指令信息就进入休眠状态,而该特定人声识别引擎进入待机状态;
步骤3、识别用户发出的语音指令
语音采集装置将采集到的用户语音指令发送给非特定人声采集引擎,由其识别出包括“指令头+指令内容”的数据内容,经编码、加密和打包后上传给本地主机,本地主机对该上传数据校验、解密后,分离出该数据内容中的指令头进行判断,若是控制指令头,则识别该控制指令头对应的指令内容,由本地主机对相应设备实施控制;若为信息指令头,则将包括“指令头+指令内容”的数据内容上传给云端服务器,该云端服务器从该数据内容的指令内容中识别出关键字,由搜索引擎对关键字进行智能匹配后获得相关检索信息,并将该检索信息从云端服务器返回给本地主机,通过显示器显示给用户。
由于本发明将特定人声识别引擎和非特定人声采集引擎相结合,通过特定人声识别引擎对用户的身份和口令进行认证,唤醒非特定人声采集引擎,这样,用户能够通过简单的口令唤醒整个语音引擎,然后再发出复杂的语音指令,由非特定人声采集引擎进行识别,转换成特定的加密命令并通过本地主机传送到控制终端,实现对整个智能平台的控制。用户无需专业知识和操作学习,就能完成对整个智能平台的操控,而且本发明可以判断命令者身份,由用户指定管理者和使用者,避免误操作。本发明适用于家庭用户和行业用户,该家庭用户主要指智能家居、智能社区、智能建筑以及和家居相关的各个环境;行业用户主要指物流行业、监控行业、生产行业、服务行业和其他测控类行业。


图I为本发明的工作流程图。以下结合附图和具体实施例对本发明做进一步详述。
具体实施例方式
·
本发明中的特定人声识别引擎指的是用户可以通过呼叫预先设定好的系统识别关键字,如系统昵称等进行整个语音系统的唤醒和登录,该特定人声识别引擎中包含了特定人声识别系统以及声纹系统,可以同时判断发声人的身份和命令,并进行特定操作,该操作可由用户自行指定并保存在引擎中;
非特定人声识别引擎指的是一个大型的语音识别和处理引擎,可以将用户所发出的指令和信息转换成特定格式的数据流,并进行关键字识别和拆分,并通过一定的规则将结果反馈到指定数据库或云平台,进行用户所需的操作转换。如图I所示,本发明一种适用于云平台的多语音控制方法,包括如下几个步骤 步骤I、用户的口令采集
采集用户的口令信息,将预录入的口令信息转换成声纹和声音波形信息存入用户特征数据库;
步骤2、口令识别,激活非特定人声识别引擎
特定人声识别引擎处于待机状态,当语音采集装置采集到声音信息时,将分解的声纹和声音波形信息发送给特定人声识别引擎,该特定人声识别引擎首先将收到的声纹信息与用户特征数据库中预录入的声纹信息进行比对,若相符则确认用户身份,进一步将声音波形信息与用户特征数据库中预录入的声音波形信息进行比对,若相符则确认口令,并发出包含经确认的用户身份和口令的激活编码,去激活非特定人声采集引擎,该特定人声识别引擎进入休眠状态;
当激活非特定人声采集引擎后,特定人声识别引擎进入休眠状态,二者不能同时进行工作;激活非特定人声采集引擎后,下一次语言采集装置采集到声音只会发送到非特定人声采集引擎中,非特定人声采集引擎若在一定时间内未接收到语音指令信息就进入休眠状态,而该特定人声识别引擎进入待机状态;
步骤3、识别用户发出的语音指令
语音采集装置将采集到的用户语音指令发送给非特定人声采集引擎,由其识别出包括“指令头+指令内容”的数据内容,经编码、加密和打包后上传给本地主机,本地主机对该上传数据校验、解密后,分离出该数据内容中的指令头进行判断,若是控制指令头,则识别该控制指令头对应的指令内容,由本地主机对相应设备实施控制;若为信息指令头,则将包括“指令头+指令内容”的数据内容上传给云端服务器,该云端服务器从该数据内容的指令内容中识别出关键字,由搜索引擎对关键字进行智能匹配后获得相关检索信息,并将该检索信息从云端服务器返回给本地主机,通过显示器显示给用户。本发明的重点在于将特定人声识别引擎和非特定人声采集引擎相结合,通过特定人声识别引擎对用户的身份和口令进行 认证,唤醒非特定人声采集引擎,这样,用户能够通过简单的口令唤醒整个语音引擎,然后再发出复杂的语音指令,由非特定人声采集引擎进行识别,转换成特定的加密命令并通过本地主机传送到控制终端,实现对整个智能平台的控制。用户无需专业知识和操作学习,就能完成对整个智能平台的操控,而且本发明可以判断命令者身份,由用户指定管理者和使用者,避免误操作。以上所述,仅是本发明较佳实施例而已,并非对本发明的技术范围作任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
权利要求
1.一种适用于云平台的多语音控制方法,其特征在于包括如下几个步骤 步骤I、用户的口令采集 采集用户的口令信息,将预录入的口令信息转换成声纹和声音波形信息存入用户特征数据库; 步骤2、口令识别,激活非特定人声识别引擎 特定人声识别引擎处于待机状态,当语音采集装置采集到声音信息时,将分解的声纹和声音波形信息发送给特定人声识别引擎,该特定人声识别引擎首先将收到的声纹信息与用户特征数据库中预录入的声纹信息进行比对,若相符则确认用户身份,进一步将声音波形信息与用户特征数据库中预录入的声音波形信息进行比对,若相符则确认口令,并发出包含经确认的用户身份和口令的激活编码,去激活非特定人声采集引擎,该特定人声识别引擎进入休眠状态; 当激活非特定人声采集引擎后,特定人声识别引擎进入休眠状态,二者不能同时进行工作;激活非特定人声采集引擎后,下一次语言采集装置采集到声音只会发送到非特定人声采集引擎中,非特定人声采集引擎若在一定时间内未接收到语音指令信息就进入休眠状态,而该特定人声识别引擎进入待机状态; 步骤3、识别用户发出的语音指令 语音采集装置将采集到的用户语音指令发送给非特定人声采集引擎,由其识别出包括“指令头+指令内容”的数据内容,经编码、加密和打包后上传给本地主机,本地主机对该上传数据校验、解密后,分离出该数据内容中的指令头进行判断,若是控制指令头,则识别该控制指令头对应的指令内容,由本地主机对相应设备实施控制;若为信息指令头,则将包括“指令头+指令内容”的数据内容上传给云端服务器,该云端服务器从该数据内容的指令内容中识别出关键字,由搜索引擎对关键字进行智能匹配后获得相关检索信息,并将该检索信息从云端服务器返回给本地主机,通过显示器显示给用户。
全文摘要
本发明一种适用于云平台的多语音控制方法,将特定人声识别引擎和非特定人声采集引擎相结合,通过特定人声识别引擎对用户的身份和口令进行认证,唤醒非特定人声采集引擎,这样,用户能够通过简单的口令唤醒整个语音引擎,然后再发出复杂的语音指令,由非特定人声采集引擎进行识别,转换成特定的加密命令并通过本地主机传送到控制终端,实现对整个智能平台的控制;用户无需专业知识和操作学习,就能完成对整个智能平台的操控,而且本发明可以判断命令者身份,由用户指定管理者和使用者,避免误操作。
文档编号G10L15/26GK102682771SQ20121012770
公开日2012年9月19日 申请日期2012年4月27日 优先权日2012年4月27日
发明者林声滨 申请人:厦门思德电子科技有限公司

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:导光板及背光模组的制作方法技术领域:本发明涉及一种导光板以及背光模组,尤其涉及一种适用于直下式背光模组的导 光板以及直下式背光模组。背景技术:近年来,平面显示器发展迅速,已被广泛应用于个人计算机、电视、移动通讯及消 费性电子产品等

    专利发布时间:2025-07-01阅读:(126)

    专利名称:用于阵列检测设备的光学系统及阵列检测设备的制作方法技术领域:本实用新型涉及液晶显示技术,尤其涉及一种用于阵列检测设备的光学系统及阵 列检测设备。背景技术:液晶显示器是目前常用的平板显示器,其中薄膜晶体管液晶显示器(ThinFilm

    专利发布时间:2025-07-01阅读:(94)

    专利名称:一种基于语音文本转换技术的文本表现方法技术领域:本发明属于语音识别及转换技术,特别涉及利用文本形式向用户传达对方的心理状态或者准备述说的要点的一种基于语音文本转换的文本表现方法。背景技术: 通过语音文本转换,识别用户的语音,并转换

    专利发布时间:2025-07-01阅读:(113)

    专利名称:双立柱划胶机的制作方法技术领域:本实用新型涉及一种改进的划胶机,特别是一种具双立柱机座的划胶机。现有的划胶机普遍采用单螺纹柱机座,这种单螺纹柱与机架之间通过轴套配合,再用螺母固定。采用这种机座,由于工作中产生的振动,使机架产生左右

    专利发布时间:2025-07-01阅读:(108)

    专利名称:新型带阅读架的台灯的制作方法技术领域:本实用新型涉及新型带阅读架的台灯,按国际专利分类表(IPC)划分属于机械工程部,照明加热分部,照明大类,未列入其它类的非便携式照明装置系统小类,使用点状光源的照明装置或系统;使用非特定形状的光

    专利发布时间:2025-07-01阅读:(119)

    专利名称:印刷装置、印刷方法以及印刷系统的制作方法技术领域:本发明涉及执行需要用户认证的印刷任务的印刷装置、印刷方 法以及印刷系统。背景技术:近年来,计算机的普及非常显著。虽然计算机在各种公司中被 用于管理业务信息,但是作为业务信息的一部分

    专利发布时间:2025-07-01阅读:(104)