当前位置:网站首页>专利 >正文

一种适用于云平台的多语音控制方法

专利名称:一种适用于云平台的多语音控制方法
技术领域
本发明涉及一种适用于云平台的多语音控制方法。
背景技术
目前的物联网平台多采用手动操控或计算机远程操控,存在操作繁杂及接口不统一的弊端,用户需要熟悉了产品的操作流程后方可进行操控,十分不方便。而且现有的语音控制方法因其单一性和非指向性,无法识别特定人员所发送的指令,极易受干扰并产生误操作。

发明内容
本发明目的在于提供一种适用于云平台的多语音控制方法,用语音识别技术和 云服务相结合,使用户可以非常容易地操控整个物联网智能控制平台,例如家居系统,生产系统,物流系统等,并可以通过语音控制从互联网及云端获取相应的资源。一种适用于云平台的多语音控制方法,包括如下几个步骤
步骤I、用户的口令采集
采集用户的口令信息,将预录入的口令信息转换成声纹和声音波形信息存入用户特征数据库;
步骤2、口令识别,激活非特定人声识别引擎
特定人声识别引擎处于待机状态,当语音采集装置采集到声音信息时,将分解的声纹和声音波形信息发送给特定人声识别引擎,该特定人声识别引擎首先将收到的声纹信息与用户特征数据库中预录入的声纹信息进行比对,若相符则确认用户身份,进一步将声音波形信息与用户特征数据库中预录入的声音波形信息进行比对,若相符则确认口令,并发出包含经确认的用户身份和口令的激活编码,去激活非特定人声采集引擎,该特定人声识别引擎进入休眠状态;
当激活非特定人声采集引擎后,特定人声识别引擎进入休眠状态,二者不能同时进行工作;激活非特定人声采集引擎后,下一次语言采集装置采集到声音只会发送到非特定人声采集引擎中,非特定人声采集引擎若在一定时间内未接收到语音指令信息就进入休眠状态,而该特定人声识别引擎进入待机状态;
步骤3、识别用户发出的语音指令
语音采集装置将采集到的用户语音指令发送给非特定人声采集引擎,由其识别出包括“指令头+指令内容”的数据内容,经编码、加密和打包后上传给本地主机,本地主机对该上传数据校验、解密后,分离出该数据内容中的指令头进行判断,若是控制指令头,则识别该控制指令头对应的指令内容,由本地主机对相应设备实施控制;若为信息指令头,则将包括“指令头+指令内容”的数据内容上传给云端服务器,该云端服务器从该数据内容的指令内容中识别出关键字,由搜索引擎对关键字进行智能匹配后获得相关检索信息,并将该检索信息从云端服务器返回给本地主机,通过显示器显示给用户。
由于本发明将特定人声识别引擎和非特定人声采集引擎相结合,通过特定人声识别引擎对用户的身份和口令进行认证,唤醒非特定人声采集引擎,这样,用户能够通过简单的口令唤醒整个语音引擎,然后再发出复杂的语音指令,由非特定人声采集引擎进行识别,转换成特定的加密命令并通过本地主机传送到控制终端,实现对整个智能平台的控制。用户无需专业知识和操作学习,就能完成对整个智能平台的操控,而且本发明可以判断命令者身份,由用户指定管理者和使用者,避免误操作。本发明适用于家庭用户和行业用户,该家庭用户主要指智能家居、智能社区、智能建筑以及和家居相关的各个环境;行业用户主要指物流行业、监控行业、生产行业、服务行业和其他测控类行业。


图I为本发明的工作流程图。以下结合附图和具体实施例对本发明做进一步详述。
具体实施例方式
·
本发明中的特定人声识别引擎指的是用户可以通过呼叫预先设定好的系统识别关键字,如系统昵称等进行整个语音系统的唤醒和登录,该特定人声识别引擎中包含了特定人声识别系统以及声纹系统,可以同时判断发声人的身份和命令,并进行特定操作,该操作可由用户自行指定并保存在引擎中;
非特定人声识别引擎指的是一个大型的语音识别和处理引擎,可以将用户所发出的指令和信息转换成特定格式的数据流,并进行关键字识别和拆分,并通过一定的规则将结果反馈到指定数据库或云平台,进行用户所需的操作转换。如图I所示,本发明一种适用于云平台的多语音控制方法,包括如下几个步骤 步骤I、用户的口令采集
采集用户的口令信息,将预录入的口令信息转换成声纹和声音波形信息存入用户特征数据库;
步骤2、口令识别,激活非特定人声识别引擎
特定人声识别引擎处于待机状态,当语音采集装置采集到声音信息时,将分解的声纹和声音波形信息发送给特定人声识别引擎,该特定人声识别引擎首先将收到的声纹信息与用户特征数据库中预录入的声纹信息进行比对,若相符则确认用户身份,进一步将声音波形信息与用户特征数据库中预录入的声音波形信息进行比对,若相符则确认口令,并发出包含经确认的用户身份和口令的激活编码,去激活非特定人声采集引擎,该特定人声识别引擎进入休眠状态;
当激活非特定人声采集引擎后,特定人声识别引擎进入休眠状态,二者不能同时进行工作;激活非特定人声采集引擎后,下一次语言采集装置采集到声音只会发送到非特定人声采集引擎中,非特定人声采集引擎若在一定时间内未接收到语音指令信息就进入休眠状态,而该特定人声识别引擎进入待机状态;
步骤3、识别用户发出的语音指令
语音采集装置将采集到的用户语音指令发送给非特定人声采集引擎,由其识别出包括“指令头+指令内容”的数据内容,经编码、加密和打包后上传给本地主机,本地主机对该上传数据校验、解密后,分离出该数据内容中的指令头进行判断,若是控制指令头,则识别该控制指令头对应的指令内容,由本地主机对相应设备实施控制;若为信息指令头,则将包括“指令头+指令内容”的数据内容上传给云端服务器,该云端服务器从该数据内容的指令内容中识别出关键字,由搜索引擎对关键字进行智能匹配后获得相关检索信息,并将该检索信息从云端服务器返回给本地主机,通过显示器显示给用户。本发明的重点在于将特定人声识别引擎和非特定人声采集引擎相结合,通过特定人声识别引擎对用户的身份和口令进行 认证,唤醒非特定人声采集引擎,这样,用户能够通过简单的口令唤醒整个语音引擎,然后再发出复杂的语音指令,由非特定人声采集引擎进行识别,转换成特定的加密命令并通过本地主机传送到控制终端,实现对整个智能平台的控制。用户无需专业知识和操作学习,就能完成对整个智能平台的操控,而且本发明可以判断命令者身份,由用户指定管理者和使用者,避免误操作。以上所述,仅是本发明较佳实施例而已,并非对本发明的技术范围作任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明技术方案的范围内。
权利要求
1.一种适用于云平台的多语音控制方法,其特征在于包括如下几个步骤 步骤I、用户的口令采集 采集用户的口令信息,将预录入的口令信息转换成声纹和声音波形信息存入用户特征数据库; 步骤2、口令识别,激活非特定人声识别引擎 特定人声识别引擎处于待机状态,当语音采集装置采集到声音信息时,将分解的声纹和声音波形信息发送给特定人声识别引擎,该特定人声识别引擎首先将收到的声纹信息与用户特征数据库中预录入的声纹信息进行比对,若相符则确认用户身份,进一步将声音波形信息与用户特征数据库中预录入的声音波形信息进行比对,若相符则确认口令,并发出包含经确认的用户身份和口令的激活编码,去激活非特定人声采集引擎,该特定人声识别引擎进入休眠状态; 当激活非特定人声采集引擎后,特定人声识别引擎进入休眠状态,二者不能同时进行工作;激活非特定人声采集引擎后,下一次语言采集装置采集到声音只会发送到非特定人声采集引擎中,非特定人声采集引擎若在一定时间内未接收到语音指令信息就进入休眠状态,而该特定人声识别引擎进入待机状态; 步骤3、识别用户发出的语音指令 语音采集装置将采集到的用户语音指令发送给非特定人声采集引擎,由其识别出包括“指令头+指令内容”的数据内容,经编码、加密和打包后上传给本地主机,本地主机对该上传数据校验、解密后,分离出该数据内容中的指令头进行判断,若是控制指令头,则识别该控制指令头对应的指令内容,由本地主机对相应设备实施控制;若为信息指令头,则将包括“指令头+指令内容”的数据内容上传给云端服务器,该云端服务器从该数据内容的指令内容中识别出关键字,由搜索引擎对关键字进行智能匹配后获得相关检索信息,并将该检索信息从云端服务器返回给本地主机,通过显示器显示给用户。
全文摘要
本发明一种适用于云平台的多语音控制方法,将特定人声识别引擎和非特定人声采集引擎相结合,通过特定人声识别引擎对用户的身份和口令进行认证,唤醒非特定人声采集引擎,这样,用户能够通过简单的口令唤醒整个语音引擎,然后再发出复杂的语音指令,由非特定人声采集引擎进行识别,转换成特定的加密命令并通过本地主机传送到控制终端,实现对整个智能平台的控制;用户无需专业知识和操作学习,就能完成对整个智能平台的操控,而且本发明可以判断命令者身份,由用户指定管理者和使用者,避免误操作。
文档编号G10L15/26GK102682771SQ20121012770
公开日2012年9月19日 申请日期2012年4月27日 优先权日2012年4月27日
发明者林声滨 申请人:厦门思德电子科技有限公司

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:静电图像显影剂用载体的制造方法技术领域:本发明涉及显影剂制造领域,具体的是说一种静电图像显影剂用载体的制造方法。背景技术:诸如静电图像显影等通过静电潜像使图像信息化的方法目前已广泛应用于各个领域。静电图像显影技术中,通过充电、曝光

    专利发布时间:2025-05-15阅读:(95)

    专利名称:词典、分段和语言模型联合优化的系统和迭代方法技术领域:本发明涉及语言建模,更具体地说涉及词典、文字分段和语言模式联合优化的系统和迭代方法。背景技术: 近来计算能力和相关技术的发展促进了新一代强大的应用软件的发展,包括web浏览器、

    专利发布时间:2025-05-15阅读:(86)

    专利名称:光连接器的制作方法技术领域:本发明涉及光缆连接器的领域。本发明涉及根据权利要求1前序的 光连接器。背景技术:对于户外应用,如移动无线网络的基站或天线、在船上的应用、工 业电缆和光纤装置等,这些地方环境条件恶劣,根据应用和性能与特殊

    专利发布时间:2025-05-15阅读:(62)

    专利名称:多域垂直配向液晶显示面板及多域垂直配向液晶显示器的制作方法技术领域:本发明是有关于一种液晶显示面板及液晶显示器,且特别是有关于一种多域垂直配向(multi-domain vertically alignment, MVA)液晶显示

    专利发布时间:2025-05-15阅读:(65)

    专利名称:升降式led景观灯的制作方法技术领域:本实用新型涉及一种LED景观灯,尤其是一种升降式LED景观灯。背景技术:目前,市场上的路灯和景观灯高度都是固定的,给维修带来不便和安全隐患。发明内容本实用新型要解决上述现有技术的缺点,提供一种

    专利发布时间:2025-05-15阅读:(75)

    喇叭面地鼓的制作方法【专利摘要】本实用新型提供一种喇叭面地鼓,包括鼓筒和鼓面,所述鼓筒的后部设置有所述鼓面,其特征在于所述鼓筒的前部设有喇叭状面。用喇叭状面来替代传统的平面鼓皮,由于喇叭状面的形状酷似喇叭,发出的声音具有更好的冲击力,使声音

    专利发布时间:2025-05-15阅读:(76)