当前位置:网站首页>专利 >正文

语音识别方法和系统的制作方法

语音识别方法和系统的制作方法
【专利摘要】本发明公开了一种语音识别方法,在接收到语音信号时,控制图像采集装置进行图像采集,并在所述语音信号结束时,控制所述图像采集装置停止图像采集;对接收到的语音信号进行识别,以得到语音信号识别结果;对采集到的图像中包含唇部的图像进行唇语识别,以得到唇语识别结果;计算所述语音信号识别结果和唇语识别结果的准确度,将准确度较高的识别结果作为当前的语音识别结果。本发明还公开了一种语音识别系统。本发明提高了语音识别的准确性。
【专利说明】语音识别方法和系统

【技术领域】
[0001] 本发明涉及语音控制领域,尤其涉及语音识别方法和系统。

【背景技术】
[0002] 随着语音交互的飞速发展,通过语音的方式控制终端(如电视以及空调器等),或 者通过语音的方式进行数据输入已成为应用非常广泛的方式。目前,语音交互仍存在诸多 问题,如语音识别不准确,易受环境影响较大,例如周围有人声嘈杂或者有背景音乐的话, 语音采集装置采集到的语音信号包括人发出的语音信号以及周围的噪音信号,使得终端无 法准确识别接受到的语音信号,导致语音识别不够准确。


【发明内容】

[0003] 本发明的主要目的在于提出一种语音识别方法和系统,旨在解决语音识别不够准 确的技术问题。
[0004] 为实现上述目的,本发明提供的一种语音识别方法,所述语音识别方法包括以下 步骤:
[0005] 在接收到语音信号时,控制图像采集装置进行图像采集,并在所述语音信号结束 时,控制所述图像采集装置停止图像采集;
[0006] 对接收到的语音信号进行识别,以得到语音信号识别结果;
[0007] 对采集到的图像中包含唇部的图像进行唇语识别,以得到唇语识别结果;
[0008] 计算所述语音信号识别结果和唇语识别结果的准确度,将准确度较高的识别结果 作为当前的语音识别结果。
[0009] 优选地,所述对采集到的图像中包含唇部的图像进行唇语识别,以得到唇语识别 结果的步骤包括:
[0010] 确定采集到的图像中包含唇部的图像,将所述包含唇部的图像作为有效图像,并 确定所述有效图像中唇部的位置;
[0011] 根据每一帧所述有效图像的唇形以及上一帧所述有效图像的唇形确定用户输出 的字符;
[0012] 基于每一帧所述有效图像对应的字符组成唇语识别结果。
[0013] 优选地,所述确定采集到的图像中包含唇部的图像,将所述包含唇部的图像作为 有效图像,并确定所述有效图像中唇部位置的步骤包括:
[0014] 确定采集到的每帧图像中脸部轮廓;
[0015] 将脸部轮廓内的各个像素点色度值与预存的人脸中各个像素点的色度值进行比 对,以确定采集到的每帧图像中脸部位置;
[0016] 确定脸部位置中眼部位置,并基于眼部位置以及唇部位置之间的相对位置确定唇 部区域;
[0017] 将唇部区域中各个像素点的RGB色度值进行比对;
[0018] 在唇部区域存在RGB色度值满足预设条件的像素点时,确定该帧图像为包含唇部 的图像,将所述包含唇部的图像作为有效图像;
[0019] 基于唇部区域中各个像素点的RGB色度值确定唇部的位置。
[0020] 优选地,所述对接收到的语音信号进行识别,以得到语音信号识别结果的步骤包 括:
[0021] 将接收到的语音信号转换成字符串,并按照预设的关键词库,将所述字符串拆分 为多个关键词;
[0022] 标注各个所述关键词的词性,确定各个相邻的关键词之间的词性是否匹配;
[0023] 在有相邻的关键词之间的词性不匹配时,将所述不匹配关键词作为第一关键词, 并确定预设的混淆音词库是否存在所述第一关键词;
[0024] 在所述混淆音词库存在所述不匹配的关键词时,确定所述混淆音词库中所述第一 关键词对应的第-关键词;
[0025] 将所述第一关键词替换为第二关键词,并在替换后的第二关键词与相邻关键词之 间词性匹配时,将替换后的第二关键词以及其它关键词重新组合成为语音信号识别结果, 并将重新组合的唇语识别结果作为当前的语音信号识别结果。
[0026] 优选地,所述计算所述语音信号识别结果和唇语识别结果的准确度,将准确度较 高的识别结果作为当前的语音识别结果的步骤包括:
[0027] 将所述语音信号识别以及唇语识别结果拆分为多个关键词;
[0028] 确定所述语音信号识别结果拆分成的关键词中,各个相邻关键词的之间的第一 关联度,并确定所述唇语识别结果拆分成的关键词中,各个相邻关键词的之间的第二关联 度;
[0029] 对确定的第一关联度求和,得到所述语音信号识别结果的准确度,并对确定的第 二关联度求和,得到所述语音信号识别结果的准确度;
[0030] 将准确度较高的识别结果作为当前的语音识别结果。
[0031] 此外,为实现上述目的,本发明还提出一种语音识别系统,其特征在于,所述语音 识别系统包括:
[0032] 控制模块,用于在接收到语音信号时,控制图像采集装置进行图像采集,并在所述 语音信号结束时,控制所述图像采集装置停止图像采集;
[0033] 语音信号识别模块,用于对接收到的语音信号进行识别,以得到语音信号识别结 果;
[0034] 唇语识别模块,用于对采集到的图像中包含唇部的图像进行唇语识别,以得到唇 语识别结果;
[0035] 处理模块,用于计算所述语音信号识别结果和唇语识别结果的准确度,将准确度 较高的识别结果作为当前的语音识别结果。
[0036] 优选地,所述唇语识别模块包括:
[0037] 唇部定位子模块,用于确定采集到的图像中包含唇部的图像,将所述包含唇部的 图像作为有效图像,并确定所述有效图像中唇部位置;
[0038] 确定子模块,用于根据每一帧所述有效图像的唇形以及上一帧所述有效图像的唇 形确定用户输出的字符;
[0039] 重组子模块,用于基于每一帧所述有效图像对应的字符组成唇语识别结果。
[0040] 优选地,所述唇部定位子模块包括:
[0041] 脸部轮廓确定单元,用于确定采集到的每帧图像中脸部轮廓;
[0042] 脸部位置定位单元,用于将确定的脸部轮廓内的各个像素点色度值与预存的人脸 中各个像素点的色度值进行比对,以确定采集到的每帧图像中脸部位置;
[0043] 唇部区域定位单元,用于确定脸部位置中眼部位置,并基于眼部位置以及唇部位 置之间的相对位置确定唇部区域;
[0044] 比对单元,用于将唇部区域中各个像素点的RGB色度值进行比对;
[0045] 处理单元,用于在唇部区域存在RGB色度值满足预设条件的像素点时,确定该帧 图像为包含唇部的图像,将所述包含唇部的图像作为有效图像;
[0046] 唇部位置定位单元,用于基于唇部区域中各个像素点的RGB色度值确定唇部的位 置。
[0047] 优选地,所述语音信号识别模块包括:
[0048] 转换子模块,用于将接收到的语音信号转换成字符串;
[0049] 拆分子模块,按照预设的关键词库,将所述字符串拆分为多个关键词;
[0050] 词性匹配子模块,用于标注各个所述关键词的词性,,确定各个相邻的关键词之间 的词性是否匹配;
[0051] 确定子模块,用于在有相邻的关键词之间的词性不匹配时,将所述不匹配关键词 作为第一关键词,并确定预设的混淆音词库是否存在所述第一关键词,以及在所述混淆音 词库存在所述不匹配的关键词时,确定所述混淆音词库中所述第一关键词对应的第二关键 词;
[0052] 处理子模块,用于将所述第一关键词替换为第二关键词,并在替换后的第二关键 词与相邻关键词之间词性匹配时,将替换后的第二关键词以及其它关键词重新组合成为语 音信号识别结果,并将重新组合的唇语识别结果作为当前的语音信号识别结果。
[0053] 优选地,所述处理模块包括:
[0054] 拆分子模块,用于将所述语音信号识别以及唇语识别结果拆分为多个关键词;
[0055] 关联度计算子模块,用于确定所述语音信号识别结果拆分成的关键词中,各个相 邻关键词的之间的第一关联度,并确定所述唇语识别结果拆分成的关键词中,各个相邻关 键词的之间的第二关联度;
[0056] 准确度计算子模块,用于对确定的第一关联度求和,得到所述语音信号识别结果 的准确度,并对确定的第二关联度求和,得到所述语音信号识别结果的准确度;
[0057] 处理子模块,用于将准确度较高的识别结果作为当前的语音识别结果。
[0058] 本发明提出的语音识别方法和系统,同时进行语音信号以及唇语的识别,并计算 所述语音信号识别结果和唇语识别结果的准确度,将准确度较高的识别结果作为当前的识 别结果,而不是仅仅单一识别语音信号,提高了语音识别的准确性。

【专利附图】

【附图说明】
[0059] 图1为本发明语音识别方法较佳实施例的流程示意图;
[0060] 图2为图1中步骤S20的细化流程示意图;
[0061] 图3为图1中步骤S30的细化流程示意图;
[0062] 图4为图3中步骤S31的细化流程示意图;
[0063] 图5为图1中步骤S40的细化流程示意图;
[0064] 图6为本发明语音识别系统较佳实施例的功能模块示意图;
[0065] 图7为图6中语音信号识别模块的细化功能模块示意图;
[0066] 图8为图6中唇语识别模块的细化功能模块示意图;
[0067] 图9为图8中唇部定位子模块的细化功能模块示意图;
[0068] 图10为图6中处理模块的细化功能模块示意图。
[0069] 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

【具体实施方式】
[0070] 应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0071] 本发明提供一种语音识别方法。
[0072] 参照图1,图1为本发明语音识别方法较佳实施例的流程示意图。
[0073] 本实施例提出的语音识别方法优选运行于被控终端(如电视机以及空调器等) 中,被控终端基于语音识别接收进行相应的操作;或者语音识别方法可运行于控制终端,控 制终端将语音信号识别结果对应的代码传输至相应的被控终端。
[0074] 本实施例提出一种语音识别方法,所述语音识别方法包括:
[0075] 步骤S10,在接收到语音信号时,控制图像采集装置进行图像采集,并在所述语音 信号结束时,控制所述图像采集装置停止图像采集;
[0076] 在本实施例中,仅在接收到语音信号时才控制图像采集装置进行图像采集,而在 未接受语音信号时处于休眠状态,以减少能耗,例如,在预设时间间隔内未接受到语音信号 时,控制所述图像采集装置进入休眠状态。
[0077] 本领域技术人员可以理解的是,可控制图像采集装置实时或定时进行图像采集, 在接收到语音信号时,确定接收到的语音信号的第一时间点以及语音信号结束的第二时间 点,获取图像采集装置在该第一时间点以及第二时间点之间采集到的图像。
[0078] 步骤S20,对接收到的语音信号进行识别,以得到语音信号识别结果;
[0079] 在本实施例中,可通过将语音信号转换为字符信号得到语音信号识别结果。进一 步地,为提高语音信号识别结果的准确性,可对语音信号转换的字符串进行纠错,具体纠错 过程参照图2,所述步骤S20包括:
[0080] 步骤S21,将接收到的语音信号转换成字符串,并按照预设的关键词库,将所述字 符串拆分为多个关键词;
[0081] 可预设包括多个关键词的关键词库,将语音信号转换得到的字符串与词库中存储 的关键词进行比对,并确定预设的关键词库中与字符串匹配的关键词,并将该字符串拆分 为各个匹配的关键词。本领域技术人员可以理解的是,关键词库中可不用设置数字类的关 键词,在确定与字符串匹配的关键词后,可先提取字符串中匹配的关键词,并将字符串中剩 余的不匹配的部分作为一个关键词。例如,语音信号转换得到的字符串为"电视机,切换至 23频道",则该字符串与预设的关键词库中的关键词匹配的为"电视机、切换、至以及频道", 则由字符串中直接提取出"电视机、切换、至以及频道",然后将剩余的"23"作为一个关键 T^lJ〇
[0082] 步骤S22,标注各个所述关键词的词性,确定各个相邻的关键词之间的词性是否匹 配;
[0083] 该关键词的词性可为名词、动词、形容词、副词以及介词等,可预约各类词性的搭 配,例如在相邻的关键词为动词+形容词时,则认为相邻的关键词之间词性不匹配,可能存 在识别错误。
[0084] 步骤S23,在有相邻的关键词之间的词性不匹配时,将所述不匹配关键词作为第一 关键词,并确定预设的混淆音词库是否存在所述第一关键词;
[0085] 步骤S24,在所述混淆音词库存在所述不匹配的关键词时,确定所述混淆音词库中 所述第一关键词对应的第二关键词;
[0086] 在本实施例中,可预设混淆音词库,该混淆音词库中可设置在语音信号转换为字 符串时容易混渚的关键词,各个易混渚的关键词关联保存。在相邻的关键词不匹配时,可将 该不配的关键词作为第一关键词与混淆音词库中的关键词进行比对,以对错误的关键词进 行纠错。
[0087] 本领域技术人员可以理解的是,在所述混淆音词库中不存在所述不匹配的关键词 时,可将转换得到的字符串作为当前的语音信号识别结果。
[0088] 步骤S25,将所述第一关键词替换为第二关键词,并在替换后的第二关键词与相邻 关键词之间词性匹配时,将替换后的第二关键词以及其它关键词重新组合成为语音信号识 别结果,并将重新组合的唇语识别结果作为当前的语音信号识别结果。
[0089] 本领域技术人员可以理解的是,在替换后的第二关键词与相邻关键词之间词性不 匹配,且所述第二关键词存在多个时,将所述第一关键词替换为其它第二关键词,并确定替 换后的第二关键词与相邻关键词之间词性是否匹配,直至替换完所有的第二关键词,将转 换得到的字符串作为当前的语音信号识别结果。
[0090] 步骤S30,对采集到的图像中包含唇部的图像进行唇语识别,以得到唇语识别结 果;
[0091] 在本实施例中,唇语识别结果可根据每一帧图像中的唇形以及与上一帧的图像中 的唇形确定得到,具体过程如图3所示,所述步骤S30包括:
[0092] 步骤S31,确定采集到的图像中包含唇部的图像,将所述包含唇部的图像作为有效 图像,并确定所述有效图像中唇部的位置;
[0093] 在本实施例中,确定采集到的每帧图像中唇部的位置具体过程如图4所示,具体 过程如下:
[0094] 步骤S311,确定采集到的每帧图像中脸部轮廓;
[0095] 由于采集到的图像中的各个像素点对应的色度值不同,可直接根据每帧图像中的 像素点的色度值分布以及预设的脸部轮廓得到每帧图像中脸部位置。
[0096] 本领域技术人员可以理解的是,在图像采集装置的图像采集区域中有多个人存在 时,可基于接收到语音信号对声源方向进行定位,基于确定的声源方向确定用户在采集到 的图像中的位置,基于声源方向确定用户在采集到的图像中的位置属于现有技术,在此不 再赘述。
[0097] 在采集到的图像中没有脸部轮廓时,直接将语音信号对应的语音信号识别结果作 为当前的语音识别结果,或者可提示用户重新输入语音信号。
[0098] 步骤S312,将确定的脸部轮廓内的各个像素点色度值与预存的人脸中各个像素点 的色度值进行比对,以确定采集到的每帧图像中脸部位置;
[0099] 确定脸部轮廓内各个像素点的YUV色度值至与预存的人脸中各个像素点的YUV色 度值之间的相似度,在相似度大于预设值时,认为该像素点为脸部像素点,还相似度的计算 公式为现有技术,在此不再赘述。
[0100] 步骤S313,确定脸部位置中眼部位置,并基于眼部位置以及唇部位置之间的相对 位置确定唇部区域;
[0101] 在本实施例中,由于眼部的像素点的灰度值小于脸部其它位置的灰度值,可根据 各个像素点之间的灰度值确定眼部位置,在眼部位置的下方以及脸部的下三分之一出,即 可容易确定出唇部所在的区域。
[0102] 步骤S314,在唇部区域存在RGB色度值满足预设条件的像素点时,确定该帧图像 为包含唇部的图像,将所述包含唇部的图像作为有效图像;
[0103] 步骤S315,基于唇部区域中各个像素点的RGB色度值确定唇部的位置
[0104] 但由于当前确定的唇部区域仅仅为初步确定,该区域内有唇部的像素点以及脸部 的像素点,则需要在该区域内确定唇部位置。由于唇部像素点的RGB色度值中,B(蓝色)分 量的远远大于G(绿色)分量,则预设的条件可设置为B(蓝色)分量与G(绿色)分量之间 的差值大于预设值,而脸部的像素点中B(蓝色)分量的小于G(绿色)分量,则可通过对各 个像素点的B分量以及G分量进行比对,以确定唇部位置。
[0105] 步骤S32,根据每一帧所述有效图像的唇形以及上一帧所述有效图像的唇形确定 用户输出的字符;
[0106] 步骤S33,基于每一帧所述有效图像对应的字符组成唇语识别结果。
[0107] 本领域技术人员可以理解的是,采集到的图像中第一帧图像的上一帧图像的唇形 默认为闭嘴唇形,用户可基于上一帧图像以及该帧图像对应的唇形可得出用户的唇部走 势,将得到的唇部走势与预存的唇部走势进行比对,以得到当前输出的字符。按照每一帧图 像的采集顺序,将每一帧图像的文件组合成唇语识别结果
[0108] 步骤S40,计算所述语音信号识别结果和唇语识别结果的准确度,将准确度较高的 识别结果作为当前的识别结果。
[0109] 在本实施例中,计算所述语音信号识别结果和唇语识别结果的准确度的具体过程 如图5所示,具体过程如下:
[0110] 步骤S41,将所述语音信号识别以及唇语识别结果拆分为多个关键词;
[0111] 关键词拆分的过程见上述语音信号关键词拆分过程,在此不再赘述。
[0112] 步骤S42,确定所述语音信号识别结果拆分成的关键词中,各个相邻关键词的之间 的第一关联度,并确定所述唇语识别结果拆分成的关键词中,各个相邻关键词的之间的第 二关联度;
[0113] 在本实施例中,第一关联度的计算公式为:

【权利要求】
1. 一种语音识别方法,其特征在于,所述语音识别方法包括以下步骤: 在接收到语音信号时,控制图像采集装置进行图像采集,并在所述语音信号结束时,控 制所述图像采集装置停止图像采集; 对接收到的语音信号进行识别,以得到语音信号识别结果; 对采集到的图像中包含唇部的图像进行唇语识别,以得到唇语识别结果; 计算所述语音信号识别结果和唇语识别结果的准确度,将准确度较高的识别结果作为 当前的语音识别结果。
2. 如权利要求1所述的语音识别方法,其特征在于,所述对采集到的图像中包含唇部 的图像进行唇语识别,以得到唇语识别结果的步骤包括: 确定采集到的图像中包含唇部的图像,将所述包含唇部的图像作为有效图像,并确定 所述有效图像中唇部的位置; 根据每一帧所述有效图像的唇形以及上一帧所述有效图像的唇形确定用户输出的字 符; 基于每一帧所述有效图像对应的字符组成唇语识别结果。
3. 如权利要求2所述的语音识别方法,其特征在于,所述确定采集到的图像中包含唇 部的图像,将所述包含唇部的图像作为有效图像,并确定所述有效图像中唇部位置的步骤 包括: 确定采集到的每帧图像中脸部轮廓; 将脸部轮廓内的各个像素点色度值与预存的人脸中各个像素点的色度值进行比对,以 确定采集到的每帧图像中脸部位置; 确定脸部位置中眼部位置,并基于眼部位置以及唇部位置之间的相对位置确定唇部区 域; 将唇部区域中各个像素点的RGB色度值进行比对; 在唇部区域存在RGB色度值满足预设条件的像素点时,确定该帧图像为包含唇部的图 像,将所述包含唇部的图像作为有效图像; 基于唇部区域中各个像素点的RGB色度值确定唇部的位置。
4. 如权利要求1-3任一项所述的语音识别方法,其特征在于,所述对接收到的语音信 号进行识别,以得到语音信号识别结果的步骤包括: 将接收到的语音信号转换成字符串,并按照预设的关键词库,将所述字符串拆分为多 个关键词; 标注各个所述关键词的词性,确定各个相邻的关键词之间的词性是否匹配; 在有相邻的关键词之间的词性不匹配时,将所述不匹配关键词作为第一关键词,并确 定预设的混淆音词库是否存在所述第一关键词; 在所述混淆音词库存在所述不匹配的关键词时,确定所述混淆音词库中所述第一关键 词对应的第二关键词; 将所述第一关键词替换为第二关键词,并在替换后的第二关键词与相邻关键词之间词 性匹配时,将替换后的第二关键词以及其它关键词重新组合成为语音信号识别结果,并将 重新组合的唇语识别结果作为当前的语音信号识别结果。
5. 如权利要求1-3任一项所述的语音识别方法,其特征在于,所述计算所述语音信号 识别结果和唇语识别结果的准确度,将准确度较高的识别结果作为当前的语音识别结果的 步骤包括: 将所述语音信号识别以及唇语识别结果拆分为多个关键词; 确定所述语音信号识别结果拆分成的关键词中,各个相邻关键词的之间的第一关联 度,并确定所述唇语识别结果拆分成的关键词中,各个相邻关键词的之间的第二关联度; 对确定的第一关联度求和,得到所述语音信号识别结果的准确度,并对确定的第二关 联度求和,得到所述语音信号识别结果的准确度; 将准确度较高的识别结果作为当前的语音识别结果。
6. -种语音识别系统,其特征在于,所述语音识别系统包括: 控制模块,用于在接收到语音信号时,控制图像采集装置进行图像采集,并在所述语音 信号结束时,控制所述图像采集装置停止图像采集; 语音信号识别模块,用于对接收到的语音信号进行识别,以得到语音信号识别结果; 唇语识别模块,用于对采集到的图像中包含唇部的图像进行唇语识别,以得到唇语识 别结果; 处理模块,用于计算所述语音信号识别结果和唇语识别结果的准确度,将准确度较高 的识别结果作为当前的语音识别结果。
7. 如权利要求6所述的语音识别系统,其特征在于,所述唇语识别模块包括: 唇部定位子模块,用于确定采集到的图像中包含唇部的图像,将所述包含唇部的图像 作为有效图像,并确定所述有效图像中唇部位置; 确定子模块,用于根据每一帧所述有效图像的唇形以及上一帧所述有效图像的唇形确 定用户输出的字符; 重组子模块,用于基于每一帧所述有效图像对应的字符组成唇语识别结果。
8. 如权利要求7所述的语音识别系统,其特征在于,所述唇部定位子模块包括:脸部轮廓确定单元,用于确定采集到的每帧图像中脸部轮廓; 脸部位置定位单元,用于将确定的脸部轮廓内的各个像素点色度值与预存的人脸中各 个像素点的色度值进行比对,以确定采集到的每帧图像中脸部位置; 唇部区域定位单元,用于确定脸部位置中眼部位置,并基于眼部位置以及唇部位置之 间的相对位置确定唇部区域; 比对单元,用于将唇部区域中各个像素点的RGB色度值进行比对; 处理单元,用于在唇部区域存在RGB色度值满足预设条件的像素点时,确定该帧图像 为包含唇部的图像,将所述包含唇部的图像作为有效图像; 唇部位置定位单元,用于基于唇部区域中各个像素点的RGB色度值确定唇部的位置。
9. 如权利要求6-8所述的语音识别系统,其特征在于,所述语音信号识别模块包括: 转换子模块,用于将接收到的语音信号转换成字符串; 拆分子模块,按照预设的关键词库,将所述字符串拆分为多个关键词; 词性匹配子模块,用于标注各个所述关键词的词性,,确定各个相邻的关键词之间的词 性是否匹配; 确定子模块,用于在有相邻的关键词之间的词性不匹配时,将所述不匹配关键词作为 第一关键词,并确定预设的混淆音词库是否存在所述第一关键词,以及在所述混淆音词库 存在所述不匹配的关键词时,确定所述混淆音词库中所述第一关键词对应的第二关键词; 处理子模块,用于将所述第一关键词替换为第二关键词,并在替换后的第二关键词与 相邻关键词之间词性匹配时,将替换后的第二关键词以及其它关键词重新组合成为语音信 号识别结果,并将重新组合的唇语识别结果作为当前的语音信号识别结果。
10.如权利要求6-8任一项所述的语音识别系统,其特征在于,所述处理模块包括:拆分子模块,用于将所述语音信号识别以及唇语识别结果拆分为多个关键词; 关联度计算子模块,用于确定所述语音信号识别结果拆分成的关键词中,各个相邻关 键词的之间的第一关联度,并确定所述唇语识别结果拆分成的关键词中,各个相邻关键词 的之间的第二关联度; 准确度计算子模块,用于对确定的第一关联度求和,得到所述语音信号识别结果的准 确度,并对确定的第二关联度求和,得到所述语音信号识别结果的准确度; 处理子模块,用于将准确度较高的识别结果作为当前的语音识别结果。
【文档编号】G10L15/26GK104409075SQ201410714386
【公开日】2015年3月11日 申请日期:2014年11月28日 优先权日:2014年11月28日
【发明者】付春元 申请人:深圳创维-Rgb电子有限公司

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:背光源、液晶显示器及液晶电视的制作方法技术领域:本实用新型涉及液晶显示技术领域,尤其涉及一种背光源、液晶显示器 及液晶电4见。背景技术:目前,在平板显示(Flat Panel Display,以下简称FPD)技术中,液晶显 示(L

    专利发布时间:2025-05-15阅读:(66)

    专利名称:遮阳帽太阳镜的制作方法技术领域:本实用新型是一种太阳镜,特别是一能卡接在帽沿上的遮阳帽太阳镜。背景技术:太阳镜和遮阳帽是夏天经常要用到的日用品,在实际使用中,经常是在在戴遮阳帽的同时,还要再戴上太阳镜,如此的使用方式使人感到有如下

    专利发布时间:2025-05-15阅读:(63)

    专利名称:一种光学比较显微仪器的制作方法技术领域:本实用新型属于光学仪器的技术领域,涉及一种光学比较显微仪器。 背景技术:下面结合本说明书附图对与本实用新型相关的己有的技术进行简要介绍 传统的光学比较显微仪器图像比对原理如图1、图2和图3所

    专利发布时间:2025-05-15阅读:(86)

    专利名称:用于噪声检测的方法和设备的制作方法技术领域:本发明涉及一种用于检测在电子通信设备中的蜂窝电话感应噪声 的音频通信方法和设备。背景技术:现有的会议系统通常装备有敏感的不定向麦克风,用于捕获来自 多个参与者的讲话。因为任何护罩或包装会

    专利发布时间:2025-05-15阅读:(75)

    专利名称:反射型微型投影机用光学引擎的制作方法技术领域:本发明涉及一种光学引擎,尤其涉及一种反射型微型投影机用光学引擎。背景技术:为了将相对于手掌面积还要小的便携式微型投影机或者对笔记本等设备进行嵌入式设计的投影仪进行实用化,必须要开发出小

    专利发布时间:2025-05-15阅读:(66)

    专利名称:光电传感保护网的制作方法技术领域:本发明涉及电力设施,具体而言是利用光电缆特性对电网设备提供保护。背景技术:对于高电压、大电流的电力线路和变压器等重要电力设施,为了保证安全,保护工 作显得尤为重要,必须提供高效、可靠的技术设备。随

    专利发布时间:2025-05-15阅读:(70)