专利名称:跨语种语音信息交流方法
技术领域:
本发明设计的是一种网络信息交互方法,特别是一种跨语种语音信息交流方法,属于信息技术领域。
背景技术:
随着Internet的发展,Web信息的数量迅速增长,然而各国文化和语言的差异,导致信息的交流存在很大的问题。网络用户往往会受到语言的限制,由于信息所基于的语言和文化的不同,在Internet上形成许多“信息孤岛”,其中每一部分的信息都是不全面的,进而还会导致岛间的信息交流存在很大的障碍,特别是语音的交流存在更大的障碍。国内外专家各学者们提出了很多跨语种网络交流方法,经文献检索发现,日本京都大学在ICE2002实验中实现的TransBBS系统(ICE2002 Site,http//ice2002.kuis.kyoto-u.ac.jp)实现了多语种跨文化交流方法,可以支持日韩中马英5种语言的交流。该系统已经代表了这个领域的最前沿研究成果。然而却同样存在很多不足(1)只能提供单一翻译引擎和搜索源的支持,不能动态提高翻译质量。(2)处理速度过慢,无法进行语音级别的交流,而只能实现基于文字的交流。(3)无法保留用户信息,不能实现翻译反馈,使交流过程中的错误无法得到修正,导致信息交流始终存在较大的障碍。
发明内容
本发明的目的在于克服现有技术的不足,提供一种跨语种语音信息交流方法,将原有方式提升到语音的层面来进行研究和设计,使其有助于基于Web和Agent的多语言跨文化语音信息交流的实现。
本发明是通过以下技术方案实现的,本发明以Agent技术为基础,接受用户的语音信息,由用户交互Agent,语音识别Agent,翻译Agent,信息交互Agent,语音表示Agent和多级知识数据库完成“语音识别----翻译过程----信息交互----语音表示---翻译反馈”过程。首先,用户交互Agent解析用户提出的语音信息和翻译方案,将结果提交给语音服务器和翻译平台,用户通过语音识别Agent,进行语音信息的处理,翻译Agent根据提供的语义信息和语种信息,识别出合理的翻译方案或者根据用户指定的翻译方案进行处理,并处理和各种翻译服务之间的交互过程,通过信息交互Agent将结果提交给信息传输目的地,由那里的语音表示Agent实现语义信息的语音表达,最后由接收者参与对反馈知识信息库的更新和迭代处理,这样一次完整的语音信息传播便完成了。
以下对本发明作进一步的描述,具体内容如下(1)语音识别过程如下①用户在用户交互Agent提供的界面上进行语音信息的录入;②由语音识别Agent进行独立用户的语音信息库的建立;③语音识别Agent将用户的语音信息进行有效的识别,将产生的语义信息和语种传递给翻译Agent,由翻译Agent进行有效的语义翻译。
(2)翻译过程具体如下①语义信息经由翻译Agent接口传入,翻译方案可选择性地从用户交互Agent处获得;②翻译方案由翻译Agent根据内容语种决定或由用户指定,调用翻译服务;③翻译Agent将翻译结果传递信息交互Agent。
(3)信息交互过程如下①信息交互Agent接收到由翻译Agent传入的语义信息;②根据信息源和信息目标进行绑定,提高后期的信息交流效率。
(4)语音表示过程如下①利用本地的母语信息,将语义信息用语音形式表现出来,便于用户交流;②用户选择合适的语音表示Agent完成语音表示。
③本地知识库将保留用户的语音表示信息。
(5)翻译反馈过程如下①用户对最终接受到的语音信息进行相关评价,通过用户交互Agent,对翻译错误或者语音表示错误进行记录。
②在本地知识库保留①中的反馈信息,进行更新和迭代处理,将有效且正确的结果提交到中央服务器,优化后期的翻译交流效果。
其中涉及到的语音交流效果的关键是速度问题,在这个问题上,本发明用多种方法加以弥补,得到了有效的提高。首先,翻译Agent会将翻译平均任务分配给各翻译源,以减少瓶颈的出现;其次,采用分布式系统,降低单机过载的可能性;在用户交流使用的过程中,系统会根据语音数据库和翻译数据库进行有效的自学习,逐渐加快系统的处理速度并提高服务的有效性。
本发明具有实质性特点和显著进步,本发明是一种基于语音识别,跨语种信息交流等多种新型技术相结合的跨文化交流方法,克服了现有技术的不足,改变了单一翻译引擎的支持的状况,能动态提高翻译质量;可以方便进行语音级别的交流,处理速度得到了有效的提高;实现了翻译反馈,交流过程中的错误可以方便地修正,从而实现多语言跨文化语音信息的交流。
具体实施例方式
结合本发明的内容提供实施例,具体如下考虑到语音信息的特殊性,基于本发明方法运用的系统由语音客户平台,翻译平台,语音服务器和信息交互服务器。根据Agent的职能不同,系统结构中涉及了四种不同的单元,分别部署相应的Agent以及相关的软件。其中,语音客户平台是直接面对用户的界面,它将会和语音识别Agent发生通讯,并且在本机建立语音知识库,以便于优化语音识别效果;翻译平台是翻译Agent的部署单元,它将从语音客户平台处获得语义信息,动态选择翻译源,并将目标语义信息反馈给客户平台;语音服务器是部署语音识别Agent的单元,它将从语音客户平台处获得用户的语音信号及信息,将执行语音处理识别并协助其建立和用户相关的语音数据库;信息交互服务器是执行远程语义信息交互的平台,是沟通各Agent和各用户的枢纽。
实施例过程语音客户平台要求新用户初始化语音数据库,接受信息,便于后期工作;当初始化完成后,语音客户平台才开始工作,将处理过的语义信息通过网络传给翻译平台,由它来动态选择翻译代理,完成翻译;翻译平台完成翻译后将结构回传给语音客户平台,由语音客户平台与语音服务器发生通信,传送语义信息给目标;语义信息到达目标后,目标端的语音客户平台会把接收到的语义信息送交语音表示Agent,由它完成由语义到语音的转化;最后,由用户交互Agent选择性地接受用户的反馈信息,记录到反馈数据库中以便于迭代。这样一次完整的单工信息交流处理结束。
实施效果本发明方法实施后,提供了多个语种的翻译源,并有语音处理代理和语音表示的支持;其次,在实施过程中,利用反馈数据库优化翻译效果,加快交互速度;最后,在实施过程中,用户交互Agent不断和用户交互,给用户提供了良好的对话环境,并有效地获得不同用户的信息。
权利要求
1.一种跨语种语音信息交流方法,其特征在于以Agent技术为基础,接受用户的语音信息,由用户交互Agent,语音识别Agent,翻译Agent,信息交互Agent,语音表示Agent和多级知识数据库完成语音识别----翻译过程----信息交互----语音表示---翻译反馈过程首先,用户交互Agent解析用户提出的语音信息和翻译方案,将结果提交给语音服务器和翻译平台,用户通过语音识别Agent,进行语音信息的处理,翻译Agent根据提供的语义信息和语种信息,识别出合理的翻译方案或者根据用户指定的翻译方案进行处理,并处理和各种翻译服务之间的交互过程,通过信息交互Agent将结果提交给信息传输目的地,由那里的语音表示Agent实现语义信息的语音表达,最后由接收者参与对反馈知识信息库的更新和迭代处理,至此完成一次完整的语音信息传播。
2.根据权利要求1所述的跨语种语音信息交流方法,其特征是,所述的语音识别过程如下①用户在用户交互Agent提供的界面上进行语音信息的录入;②由语音识别Agent进行独立用户的语音信息库的建立;③语音识别Agent将用户的语音信息进行有效的识别,将产生的语义信息和语种传递给翻译Agent,由翻译Agent进行有效的语义翻译。
3.根据权利要求1所述的跨语种语音信息交流方法,其特征是,所述的翻译过程具体如下①语义信息经由翻译Agent接口传入,翻译方案可选择性地从用户交互Agent处获得;②翻译方案由翻译Agent根据内容语种决定或由用户指定,调用翻译服务;③翻译Agent将翻译结果传递信息交互Agent。
4.根据权利要求1所述的跨语种语音信息交流方法,其特征是,所述的信息交互过程如下①信息交互Agent接收到由翻译Agent传入的语义信息;②根据信息源和信息目标进行绑定,提高后期的信息交流效率。
5.根据权利要求1所述的跨语种语音信息交流方法,其特征是,所述的语音表示过程如下①利用本地的母语信息,将语义信息用语音形式表现出来;②用户选择合适的语音表示Agent完成语音表示;③本地知识库保留用户的语音表示信息。
6.根据权利要求1所述的跨语种语音信息交流方法,其特征是,所述的翻译反馈过程如下①用户对最终接受到的语音信息进行相关评价,通过用户交互Agent,对翻译错误或者语音表示错误进行记录;②在本地知识库保留①中的反馈信息,进行更新和迭代处理,将有效且正确的结果提交到中央服务器,优化后期的翻译交流效果。
7.根据权利要求1所述的跨语种语音信息交流方法,其特征是,通过以下方法有效提高交流速度首先,翻译Agent将翻译任务平均分配给各翻译源,减少瓶颈的出现;其次,用户根据自己的偏好,参与选择翻译源和语音表示Agent,数据库将保留这些用户信息;此外,用户交流使用的过程中,系统会根据语音数据库和翻译数据库进行有效的自学习,逐渐加快系统的处理速度并提高服务的有效性。
全文摘要
一种跨语种语音信息交流方法属于信息技术领域。本发明以Agent技术为基础,接受用户的语音信息,用户交互Agent解析用户提出的语音信息和翻译方案,将结果提交给语音服务器和翻译平台,用户通过语音识别Agent,进行语音信息的处理,翻译Agent根据提供的语义信息和语种信息,识别出合理的翻译方案或者根据用户指定的翻译方案进行处理,并处理和各种翻译服务之间的交互过程,通过信息交互Agent将结果提交给信息传输目的地,由那里的语音表示Agent实现语义信息的语音表达,最后由接收者参与对反馈知识信息库的更新和迭代处理,至此语音信息传播完成。本发明能动态提高翻译质量,处理速度得到了有效的提高,实现了翻译反馈,从而实现多语言跨文化语音信息的交流。
文档编号G10L15/00GK1441402SQ0311616
公开日2003年9月10日 申请日期2003年4月3日 优先权日2003年4月3日
发明者丁鹏, 朱成, 梁阿磊, 林冬惠, 盛焕烨 申请人:上海交通大学
跨语种语音信息交流方法
相关推荐
一种新型乐器的制造方法【专利摘要】本实用新型公开了一种乐器,特别是公开了一种新型乐器,包括击打棒和材质为聚苯乙烯的共鸣器,所述共鸣器上端均匀设置有多个凹槽,在所述凹槽内放置有金属发音器,所述金属发音器的两端延伸出凹槽外部,通过击打棒击打金属
专利名称:中音萨克斯的制作方法技术领域:本实用新型属音乐乐器领域,具体涉及一种中音萨克斯。技术背景现有的中音萨克斯主要有一吹口管、主体管、弯管及 喇叭口组成,该主体管侧边设有多个以精确间隔依序排列的音孔,各 音孔对应有音孔盖,通过按键控制各
专利名称::电子设备的显示器用保护板及电子设备的制作方法技术领域::本发明涉及安装在具有液晶显示器等显示器的电子设备的箱体上,保护所述显示器的显示面,并且对所述电子设备附加特殊的设计性的电子设备的显示器用保护板及电子设备。背景技术::在便携
专利名称:变焦镜头和成像设备的制作方法技术领域:本发明涉及变焦镜头和成像设备,并特别涉及这样的变焦镜头和成像设备的技术 领域,其优选在数字摄像机、数字相机、和其他电子相机中使用,并且其特征在于具有紧凑 尺寸、高变倍比(variable po
专利名称:一种具有镀膜遮罩的成像装置的制作方法技术领域:本实用新型涉及一种日夜型摄像装置,特别是涉及一种具有镀膜遮罩的成像装置。 背景技术:目前防盗监视用的日夜型摄像装置,是把摄像成像模组与红外光源模组合在一起,再 同时置放在一铝制外壳体内