一种适用于云平台的多语音控制方法-品牌商务网

专利名称：一种适用于云平台的多语音控制方法
技术领域：
本发明涉及一种适用于云平台的多语音控制方法。
背景技术：
目前的物联网平台多采用手动操控或计算机远程操控，存在操作繁杂及接口不统一的弊端，用户需要熟悉了产品的操作流程后方可进行操控，十分不方便。而且现有的语音控制方法因其单一性和非指向性，无法识别特定人员所发送的指令，极易受干扰并产生误操作。

发明内容
本发明目的在于提供一种适用于云平台的多语音控制方法，用语音识别技术和云服务相结合，使用户可以非常容易地操控整个物联网智能控制平台，例如家居系统，生产系统，物流系统等，并可以通过语音控制从互联网及云端获取相应的资源。一种适用于云平台的多语音控制方法，包括如下几个步骤
步骤I、用户的口令采集
采集用户的口令信息，将预录入的口令信息转换成声纹和声音波形信息存入用户特征数据库；
步骤2、口令识别，激活非特定人声识别引擎
特定人声识别引擎处于待机状态，当语音采集装置采集到声音信息时，将分解的声纹和声音波形信息发送给特定人声识别引擎，该特定人声识别引擎首先将收到的声纹信息与用户特征数据库中预录入的声纹信息进行比对，若相符则确认用户身份，进一步将声音波形信息与用户特征数据库中预录入的声音波形信息进行比对，若相符则确认口令，并发出包含经确认的用户身份和口令的激活编码，去激活非特定人声采集引擎，该特定人声识别引擎进入休眠状态；
当激活非特定人声采集引擎后，特定人声识别引擎进入休眠状态，二者不能同时进行工作；激活非特定人声采集引擎后，下一次语言采集装置采集到声音只会发送到非特定人声采集引擎中，非特定人声采集引擎若在一定时间内未接收到语音指令信息就进入休眠状态，而该特定人声识别引擎进入待机状态；
步骤3、识别用户发出的语音指令
语音采集装置将采集到的用户语音指令发送给非特定人声采集引擎，由其识别出包括“指令头+指令内容”的数据内容，经编码、加密和打包后上传给本地主机，本地主机对该上传数据校验、解密后，分离出该数据内容中的指令头进行判断，若是控制指令头，则识别该控制指令头对应的指令内容，由本地主机对相应设备实施控制；若为信息指令头，则将包括“指令头+指令内容”的数据内容上传给云端服务器，该云端服务器从该数据内容的指令内容中识别出关键字，由搜索引擎对关键字进行智能匹配后获得相关检索信息，并将该检索信息从云端服务器返回给本地主机，通过显示器显示给用户。
由于本发明将特定人声识别引擎和非特定人声采集引擎相结合，通过特定人声识别引擎对用户的身份和口令进行认证，唤醒非特定人声采集引擎，这样，用户能够通过简单的口令唤醒整个语音引擎，然后再发出复杂的语音指令，由非特定人声采集引擎进行识别，转换成特定的加密命令并通过本地主机传送到控制终端，实现对整个智能平台的控制。用户无需专业知识和操作学习，就能完成对整个智能平台的操控，而且本发明可以判断命令者身份，由用户指定管理者和使用者，避免误操作。本发明适用于家庭用户和行业用户，该家庭用户主要指智能家居、智能社区、智能建筑以及和家居相关的各个环境；行业用户主要指物流行业、监控行业、生产行业、服务行业和其他测控类行业。

图I为本发明的工作流程图。以下结合附图和具体实施例对本发明做进一步详述。
具体实施例方式
·
本发明中的特定人声识别引擎指的是用户可以通过呼叫预先设定好的系统识别关键字，如系统昵称等进行整个语音系统的唤醒和登录，该特定人声识别引擎中包含了特定人声识别系统以及声纹系统，可以同时判断发声人的身份和命令，并进行特定操作，该操作可由用户自行指定并保存在引擎中；
非特定人声识别引擎指的是一个大型的语音识别和处理引擎，可以将用户所发出的指令和信息转换成特定格式的数据流，并进行关键字识别和拆分，并通过一定的规则将结果反馈到指定数据库或云平台，进行用户所需的操作转换。如图I所示，本发明一种适用于云平台的多语音控制方法，包括如下几个步骤步骤I、用户的口令采集
采集用户的口令信息，将预录入的口令信息转换成声纹和声音波形信息存入用户特征数据库；
步骤2、口令识别，激活非特定人声识别引擎
特定人声识别引擎处于待机状态，当语音采集装置采集到声音信息时，将分解的声纹和声音波形信息发送给特定人声识别引擎，该特定人声识别引擎首先将收到的声纹信息与用户特征数据库中预录入的声纹信息进行比对，若相符则确认用户身份，进一步将声音波形信息与用户特征数据库中预录入的声音波形信息进行比对，若相符则确认口令，并发出包含经确认的用户身份和口令的激活编码，去激活非特定人声采集引擎，该特定人声识别引擎进入休眠状态；
当激活非特定人声采集引擎后，特定人声识别引擎进入休眠状态，二者不能同时进行工作；激活非特定人声采集引擎后，下一次语言采集装置采集到声音只会发送到非特定人声采集引擎中，非特定人声采集引擎若在一定时间内未接收到语音指令信息就进入休眠状态，而该特定人声识别引擎进入待机状态；
步骤3、识别用户发出的语音指令
语音采集装置将采集到的用户语音指令发送给非特定人声采集引擎，由其识别出包括“指令头+指令内容”的数据内容，经编码、加密和打包后上传给本地主机，本地主机对该上传数据校验、解密后，分离出该数据内容中的指令头进行判断，若是控制指令头，则识别该控制指令头对应的指令内容，由本地主机对相应设备实施控制；若为信息指令头，则将包括“指令头+指令内容”的数据内容上传给云端服务器，该云端服务器从该数据内容的指令内容中识别出关键字，由搜索引擎对关键字进行智能匹配后获得相关检索信息，并将该检索信息从云端服务器返回给本地主机，通过显示器显示给用户。本发明的重点在于将特定人声识别引擎和非特定人声采集引擎相结合，通过特定人声识别引擎对用户的身份和口令进行认证，唤醒非特定人声采集引擎，这样，用户能够通过简单的口令唤醒整个语音引擎，然后再发出复杂的语音指令，由非特定人声采集引擎进行识别，转换成特定的加密命令并通过本地主机传送到控制终端，实现对整个智能平台的控制。用户无需专业知识和操作学习，就能完成对整个智能平台的操控，而且本发明可以判断命令者身份，由用户指定管理者和使用者，避免误操作。以上所述，仅是本发明较佳实施例而已，并非对本发明的技术范围作任何限制，故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰，均仍属于本发明技术方案的范围内。
权利要求
1.一种适用于云平台的多语音控制方法，其特征在于包括如下几个步骤步骤I、用户的口令采集采集用户的口令信息，将预录入的口令信息转换成声纹和声音波形信息存入用户特征数据库；步骤2、口令识别，激活非特定人声识别引擎特定人声识别引擎处于待机状态，当语音采集装置采集到声音信息时，将分解的声纹和声音波形信息发送给特定人声识别引擎，该特定人声识别引擎首先将收到的声纹信息与用户特征数据库中预录入的声纹信息进行比对，若相符则确认用户身份，进一步将声音波形信息与用户特征数据库中预录入的声音波形信息进行比对，若相符则确认口令，并发出包含经确认的用户身份和口令的激活编码，去激活非特定人声采集引擎，该特定人声识别引擎进入休眠状态；当激活非特定人声采集引擎后，特定人声识别引擎进入休眠状态，二者不能同时进行工作；激活非特定人声采集引擎后，下一次语言采集装置采集到声音只会发送到非特定人声采集引擎中，非特定人声采集引擎若在一定时间内未接收到语音指令信息就进入休眠状态，而该特定人声识别引擎进入待机状态；步骤3、识别用户发出的语音指令语音采集装置将采集到的用户语音指令发送给非特定人声采集引擎，由其识别出包括“指令头+指令内容”的数据内容，经编码、加密和打包后上传给本地主机，本地主机对该上传数据校验、解密后，分离出该数据内容中的指令头进行判断，若是控制指令头，则识别该控制指令头对应的指令内容，由本地主机对相应设备实施控制；若为信息指令头，则将包括“指令头+指令内容”的数据内容上传给云端服务器，该云端服务器从该数据内容的指令内容中识别出关键字，由搜索引擎对关键字进行智能匹配后获得相关检索信息，并将该检索信息从云端服务器返回给本地主机，通过显示器显示给用户。
全文摘要
本发明一种适用于云平台的多语音控制方法，将特定人声识别引擎和非特定人声采集引擎相结合，通过特定人声识别引擎对用户的身份和口令进行认证，唤醒非特定人声采集引擎，这样，用户能够通过简单的口令唤醒整个语音引擎，然后再发出复杂的语音指令，由非特定人声采集引擎进行识别，转换成特定的加密命令并通过本地主机传送到控制终端，实现对整个智能平台的控制；用户无需专业知识和操作学习，就能完成对整个智能平台的操控，而且本发明可以判断命令者身份，由用户指定管理者和使用者，避免误操作。
文档编号G10L15/26GK102682771SQ20121012770
公开日2012年9月19日申请日期2012年4月27日优先权日2012年4月27日
发明者林声滨申请人:厦门思德电子科技有限公司

本文推荐一种适用于云平台的多语音控制方法仅代表作者观点，不代表本网站立场。本站对作者上传的所有内容将尽可能审核来源及出处，但对内容不作任何保证或承诺。请读者仅作参考并自行核实其真实性及合法性。如您发现图文视频内容来源标注有误或侵犯了您的权益请告知，本站将及时予以修改或删除。未经允许不得转载：http://www.pinpai35.com/1656701348.html

当前位置：网站首页>专利 >正文

一种适用于云平台的多语音控制方法

相关推荐