专利名称:语音文字转换、手语文字转换的方法和装置的制作方法
技术领域:
本发明涉及手机、电话等通讯领域,特别是涉及将音频信息或手语视频 信息,转换成文字信息并且通过视频进行通讯的方法和装置。
背景技术:
目前各种通讯终端不断出现,从固网的座机电话到移动终端比比皆是。 但是这些通讯终端都是面向普通人进行使用的功能,对于聋哑人士,目前只 有短信这种方式可以进行交流。随着可视通讯时代的到来,人们可以借助网 络,进行面对面的交流。但是聋哑人士由于无法用声音进行交流,只能借助手 语,另一方面一般人又不懂手语,这就造成了交流上的困难。
发明内容
本发明的目的是提供一种语音文字转换、手语文字转换的方法和装置, 使聋哑人士和不懂手语的人能够进行交流,同时也适合普通人群的使用。 本发明的目的是通过以下技术方案实现的-
一种语音与文字转换的方法,其特点在于,其包括以下步骤1)检测 输入的音频数据;2)将该音频数据转换成相应的文字信息;3)编码器将该 文字信息编码进入视频数据中。
一种手语与文字转换的方法,其特点在于,其包括以下步骤1)检测 输入的手语视频数据;2)将该手语视频数据转换成相应的文字信息;3)编 码器将该文字信息编码进入视频数据中。
其中,在手语与文字转换的方法中,将摄像机采集的手语图像,与预先设置好的手语图像信息对比,找到与该摄像机采集的手语图像最接近的图 像,并提取出该图像对应的文字信息。
一种文字可视通讯装置,其特点在于,其包括语音与文字转换终端, 用于检测输入的音频数据,将该音频数据转换成相应的文字信息,并用编码
器将该文字信息编码进入视频数据中;手语与文字转换终端,用于检测输入
的手语视频数据,将该手语视频数据转换成相应的文字信息,编码器将该文 字信息编码进入视频数据中。
其中,该手语与文字转换终端将摄像机采集的手语图像,与预先设置好 的手语图像信息对比,找到与该摄像机采集的手语图像最接近的图像,并提 取出该图像对应的文字信息。
本发明的积极进步效果在于通过可视通讯装置,对声音和图像信号进 行处理,增加了通讯形式和内容。使聋哑人士和不懂手语的人能够通过文字 进行交流,并且对于普通人群来说,也提高了相互间交流的通话速度和通话 质量。
图1为本发明较佳实施例中,语音与文字转换功能流程图。
图2为本发明较佳实施例中,手语视频与文字转换功能流程图。
图3为图2所示的手语与文字转换过程中,提取文字信息的具体方法流程图。
图4为本发明较佳实施例中,文字可视通讯装置的结构示意图。 图5为本发明较佳实施例中,两人之间通讯的示意图。
具体实施例方式
下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案。 一、语音与文字、手语与文字转换的方法和装置 1、语音与文字转换的流程
4步骤IOI,用户选择声音与文字转换操作。
步骤102,检测输入的音频数据。
步骤103,将该音频数据转换成相应的文字信息。
步骤104,编码器将该文字信息编码进入视频数据中。
2、 手语与文字转换的流程
步骤201,用户选择手语与文字转换操作。
步骤202,检测输入的手语视频数据。
步骤203,将该手语视频数据转换成相应的文字信息。
步骤204,编码器将该文字信息编码进入视频数据中。
在上述步骤203中,提取文字信息的具体方式如图3所示。
步骤301,摄像机采集手语图像。
步骤302,与预先设置好的手语图像信息对比。
步骤303,找到与该摄像机采集的手语图像最接近的图像,并提取出该 图像对应的文字信息。
3、 文字可视通讯装置
如图4所示为实现上述方法的一文字可视通讯装置400。该装置包括有 如下终端。
语音与文字转换终端401,用于检测输入的音频数据,将该音频数据转 换成相应的文字信息,并用编码器将该文字信息编码进入视频数据中。
手语与文字转换终端402,用于检测输入的手语视频数据,将该手语视 频数据转换成相应的文字信息,编码器将该文字信息编码进入视频数据中。
二、实际通讯中的具体操作方法
1、聋哑人士与普通人士通讯 如图5,假定A为聋哑人士, B为普通人士。
l)在A端,A开启文字可视通讯装置400的手语与文字转换功能,A 的手语被转换成文字,同时视频编码器将文字信息也编码进入视频数据传送 给B。在B终端显示视频图像的同时,将文字信息也显示出来。2)在B端,B开启文字可视通讯装置400的语音与文字转换功能,将 B的语音信号转换成文字,同时被视频编码器编码进入视频数据。在A端显 示视频图像的同时,将文字信息显示出来。
通过上面两个步骤的反复交互,就可以实现聋哑人士和普通人之间的 正常交流了。
2、普通人与普通人通讯
如图5,假定A、 B均为普通人士。在可视通讯装置的通讯中,考虑到 语音在线路上的传输质量不好等问题,也可以将双方的语音转换为文字显 示,边听对方的话边看视频上的文字,达到更好的交流效果。
1) 在A端,A开启文字可视通讯装置400的语音与文字转换功能,A 的语音信号被转换成文字,同时视频编码器将文字信息也编码进入视频数据 传送给B。在B终端显示视频图像的同时,将文字信息也显示出来。
2) 在B端,B也开启文字可视通讯装置400的语音与文字转换功能, 将B的语音信号转换成文字,同时被视频编码器编码进入视频数据。在A 端显示视频图像的同时,将文字信息显示出来。
通过上面两个步骤的反复交互,就可以实现两普通人之间的正常交流了。
虽然以上描述了本发明的具体实施方式
,但是本领域的技术人员应当理 解,这些仅是举例说明,在不背离本发明的原理和实质的前提下,可以对这 些实施方式做出多种变更或修改。因此,本发明的保护范围由所附权利要求 书限定。
权利要求
1、一种语音与文字转换的方法,其特征在于,其包括以下步骤1)检测输入的音频数据;2)将该音频数据转换成相应的文字信息;3)编码器将该文字信息编码进入视频数据中。
2、 一种手语与文字转换的方法,其特征在于,其包括以下步骤1) 检测输入的手语视频数据;2) 将该手语视频数据转换成相应的文字信息;3) 编码器将该文字信息编码进入视频数据中。
3、 根据权利要求2所述的手语与文字转换的方法,其特征在于, 其将摄像机采集的手语图像,与预先设置好的手语图像信息对比,找到与该 摄像机采集的手语图像最接近的图像,并提取出该图像对应的文字信息。
4、 一种文字可视通讯装置,其特征在于,其包括 语音与文字转换终端,用于检测输入的音频数据,将该音频数据转换成相应的文字信息,并用编码器将该文字信息编码进入视频数据中;手语与文字转换终端,用于检测输入的手语视频数据,将该手语视频数据转换成相应的文字信息,编码器将该文字信息编码进入视频数据中。
5、 根据权利要求4所述的文字可视通讯装置,其特征在于,该手语与文字转换终端将摄像机采集的手语图像,与预先设置好的手语图像信息对比,找到与该摄像机采集的手语图像最接近的图像,并提取出该图像对应的文字信息。
全文摘要
本发明公开了一种语音与文字转换的方法,其包括以下步骤1)检测输入的音频数据;2)将该音频数据转换成相应的文字信息;3)编码器将该文字信息编码进入视频数据中。本发明还公开了一种手语与文字转换的方法,其包括以下步骤1)检测输入的手语视频数据;2)将该手语视频数据转换成相应的文字信息;3)编码器将该文字信息编码进入视频数据中。本发明还公开了一种文字可视通讯装置,其包括语音与文字转换终端和手语与文字转换终端。本发明通过可视通讯装置,对声音和图像信号进行处理,增加了通讯形式和内容。使聋哑人士和不懂手语的人能够通过文字进行交流,并且对于普通人群来说,也提高了相互间交流的通话速度和通话质量。
文档编号G10L21/06GK101452705SQ20071017192
公开日2009年6月10日 申请日期2007年12月7日 优先权日2007年12月7日
发明者军 周 申请人:希姆通信息技术(上海)有限公司
语音文字转换、手语文字转换的方法和装置的制作方法
相关推荐
专利名称:硒鼓的制作方法技术领域:本实用新型涉及一种办公设备中激光打印机的主要附件,具体地说是一 种应用在激光打印机中的硒鼓。技术背景市场上现有产品因其碳粉盒和碳粉盒固件是一体的,活塞是封闭式活塞, 故其拆卸难,碳粉盒仅为一次性使用,如果想
双头开合台灯的制作方法【专利摘要】本发明提供一种双头开合台灯,包括灯头、连接管、灯座、铰接头,所述灯头采用半椭圆形容器形状的聚光外壳,内部装有节能灯管,所述连接管一端固定于灯座,一端与所述铰接头固定连接;所述灯头为两个,面对面上下排布铰接于
专利名称:具有感红外照明功能的摄像头的制作方法技术领域:本实用新型属于电子监控装置,尤其涉及一种用于监控环境光线较暗条 件下的具有感红外照明功能的摄像头。 背景技术:随着监控系统应用的范围广泛,不同的环境对于摄像头的要求也越来越高,而且监控
专利名称:带反射层的euv光刻用衬底、euv光刻用反射型掩模坯料、euv光刻用反射型掩模、和该带反 ...的制作方法技术领域:本发明涉及半导体制造等中使用的带反射层的EUV (Extreme Ultraviolet :极紫夕卜。以下简称为E
专利名称:视场角控制装置和具有该视场角控制装置的显示器的制作方法技术领域:本发明涉及一种利用液晶双折射在宽视场角和窄视场角之间 切换视场角的视场角控制装置和具备该视场角控制装置的显示器。背景技术:最近,在个人计算机、PDA (Persona
专利名称:一种磁浮三维显示器的制作方法技术领域:本发明属于三维显示技术领域,尤其涉及一种磁浮三维显示器。背景技术:三维显示器是当前显示方法的主要研究方向。从观看手段来区分,主要分为两类视差显示型和空间显示型。视差型三维显示技术是将具有视差的