当前位置:网站首页>专利 >正文

正弦编码的制作方法

专利名称:正弦编码的制作方法
技术领域
本发明涉及信号编码,其中至少一个正弦分量的频率和幅度信息被确定并且表示频率和幅度信息的正弦参数被传输。
US-A 5,664,051公开了一种语音译码器装置,用于从通过用语音编码器处理语音得到的类型的数字化语音比特流合成语音信号。该装置包括一分析器,用于处理数字化语音比特流以为表示由语音编码器处理的语音的多个正弦分量中的每个分量产生角频率和大小,该分析器在一时间序列中产生角频率和大小;一随机信号发生器,用于产生随机相位分量的时序;一相位合成器,用于为至少一些正弦分量产生合成相位的时序;合成相位由角频率和随机相位分量产生;以及一合成器,用于从角频率、大小和合成相位的时序合成语音。该文献公开,合成语音质量的显著改进可通过不对语音的话音(即主要由谐波组成)部分中的谐波相位编码,而是在受话器处为谐波合成人工相位实现。通过不对该谐波相位信息编码,有可能在表示相位时用尽的比特可用于改进编码的语音(例如,音调,调和度)的其它分量的质量。在合成人工相位的过程中,考虑若干段内的谐波的相位和频率。此外,添加随机相位分量或抖动以在相位中引入无序度。更多的抖动用于其中频带的大部分为无声的语音段。随机抖动改进合成语音的质量,避免当相位被人工合成时可导致的嗡嗡的,不自然的音质。
本发明的目的在于提供有利的编码。为此,如独立权利要求中所规定的,本发明提供一种将信号编码的方法,一种将编码的信号译码的方法,一声频信号编码器,一声频播放器,一声频系统,一编码信号和一存储介质。有利的实施例在从属权利要求中规定。本发明提供一种通过将相位抖动参数从编码器传输到译码器施加相位抖动,以指出在合成过程中应施加在译码器中的相位抖动量的有利方法。发送相位抖动参数尤其具有在译码器中施加的相位抖动量和原始信号间建立关系的优点。以这种方式,获得重建声频信号的更自然的声音,它良好地对应于原始声频信号。此外,因为不需要在译码器中局部地确定待施加的以产生自然发声信号的相位抖动量,待施加的相位抖动量可更快和更可靠地确定。
通过将相位抖动参数包括在编码的比特流中,位速率增加。但是,增加的位速率可为极小的因为这些相位抖动参数可具有非常低的更新速率,例如每个轨迹(track)一次。一个轨迹为具有给定频率和幅度的正弦分量,即一整套的正弦波的段。优选地,相位抖动参数在轨迹的第一阶段与正弦波的频率和幅度大致一同传输。在那种情况下,所有要求的信息在译码的初期是可得的。
该问题的另一解决方案将是在各种不同的时间阶段传输原始相位,或相位差,使得频率可在合成过程中适于在相应的时间阶段与该原始相位匹配。发送这些原始相位参数导致更好的质量但需要更高的位速率。
在一优选实施例中,假设施加给谐波相关频率的相位抖动承载与相关频率相同的谐波关系。则每个谐波相关频率组足以传输一个相位抖动参数。
相位抖动参数优选从在原始相位中测量的统计偏差推出。在一优选实施例中,信号的原始相位和预测的相位间的差值被确定,该预测的相位从传输的频率参数和相位连续要求计算,并且相位抖动参数从该差值推出。对于连续相位,每个轨迹中只有正弦波的第一阶段可包括相位参数,正弦波的相继的段必须以这种方式匹配即计算它们的相位参数,即它们与当前的正弦波的段的相位一致。基于连续相位规则的重建相位失去它们与原始相位的关系。如在现有技术中解释的,具有恒定频率和幅度以及连续相位的重建信号,听起来有些不自然。
通常,不要求相位抖动参数指出相位抖动的精确量。译码器可基于相位抖动参数的数值和/或信号特性执行一定的预定计算。
在一极端情况下,相位抖动参数仅由一个比特组成。在这种情况下,例如一个零指出不应施加相位抖动,而一个一指出应施加相位抖动。译码器中待施加的相位抖动可为预定的量或可以预定的方式从信号特性中推出。
参照在下文描述的实施例将明确并阐明本发明的上述和其它方面。
附图中

图1示出包括按照本发明的声频信号编码器的说明性实施例;图2示出包括按照本发明的声频播放器的说明性实施例;以及图3示出按照本发明的一声频系统的说明性实施例。
附图仅示出对于理解本发明所必需的那些元件。
本发明优选应用于通用正弦编码方案中,不仅是应用于语音编码方案中,同样还应用于正弦声频编码方案中。在正弦编码方案中,待编码的声频信号由其频率和幅度在编码器中确定的多个正弦波表示。通常,不传输相位,但合成以这种方式进行,即两个后继段间的相位是连续的。这样做是为了节省位速率。在典型的正弦编码方案中,提取出用于许多正弦分量的正弦参数。用于一个分量的正弦参数组至少由频率和幅度组成。更复杂的编码方案同样提取出频率和/或幅度过程中的信息作为时间函数。在最简单的情况下,假设频率和幅度在一时间量内为恒定的。该时间是指更新间隔并且典型的范围为5ms-40ms。在合成过程中,串行帧的频率和幅度必须被连接。跟踪算法可应用于识别频率轨迹。基于该信息,可计算连续相位使得对应于单个轨迹的正弦分量正确连接。这是重要的,因为它防止几乎经常可听见的相位的不连续性。由于频率在每个更新间隔内恒定,连续重建的相位已失去它与原始相位的关系。
图1示出按照本发明的示范性声频信号编码器2。声频信号A从声源1,例如话筒、存储介质、网络等获得。声频信号A输入至声频信号编码器2。声频信号A中的正弦分量在声频信号编码器2中被参数化建模。编码单元20从声频信号A中推出至少一个正弦分量的频率参数f和幅度参数a。这些正弦参数f和a包括在多路复用器21中的编码的声频信号A’中。声频流A’从声频信号编码器经可为无线连接、数据总线或存储介质等的通信信道3供给声频播放器。在编码器正弦轨迹被识别。这意味着在两个时间时刻t1和t2,频率和相位是已知的。从t1时刻的频率轨迹和相位,可预测t2时刻的相位。这优选以与在译码器中相同的方法进行。t2时刻相位的预测和实际测量的相位的误差可被计算。该误差的特征值,如平均绝对值或方差可被确定。优选,相位抖动参数由该特征值推出。以这种方式,通过计算实际相位和从编码器中的正弦参数确定的相位间差值,在编码器中确定所需要的相位抖动。从该差值推出的相位抖动参数被传输至译码器,该译码器使用相位抖动参数通过在合成中稍稍改变相应信号的相位引入相位抖动的导出量。
确定相位抖动参数的替换方法为监测原始频率中的波动。
图2示出包括按照本发明的声频播放器4的实施例。声频信号A’从通信信道3获得并在多路分配器40中多路分路以获得包括在编码的声频信号A’中的正弦参数f和a和相位抖动参数p。这些参数f,a和p被供给正弦合成(SS)单元41。在SS单元41中,产生具有与原始声频信号A中的正弦分量S大致相同的性能的正弦分量S’。正弦分量S’与其它重建分量一起多路传输并输出至可为扬声器的输出单元5。在译码器,相位抖动参数p是可得的。紧接在通过使用相位连续和一些频率(和由此相位)插值确定每个时刻信号的相位之后,相位抖动参数被用于将一扰动添加至所构建的相位插值。在频率在合成过程中被调整以匹配这些新的相位值这个意义上,该新的相位则被视为“原始相位”。
图3示出按照本发明的、包括如图1所示声频信号编码器2和如图2所示声频播放器4的声频系统。这种系统提供播放和记录特征。通信信道3可为声频系统的一部分,但常常在声频系统的外部。在通信信道3为存储介质的情况下,存储介质可固定在系统中或同样可为可拆装的盘,带,存储棒等。
应注意上述实施例只是说明而不是限制本发明,并且在不偏离所附权利要求的范围的情况下,本领域的技术人员将能够设计很多可替换的实施例。在权利要求中,位于括弧中的任何参考符号将不被认为是限制权利要求。单词“包括”不排除存在除那些列于权利要求中的以外其它的元件或步骤。本发明可借助包括几个特殊元件的硬件,并借助适当编程的计算机实现。在列举几种单元的装置权利要求中,这些单元中的几种可由同一硬件实现。一定的措施在互相不同的从属权利要求中叙述这一情况并不指示这些措施的组合不能被有利使用。
总之,提供信号编码,其中信号中至少一个正弦分量的频率和幅度信息被确定,并且表示频率和幅度信息的正弦参数被传输,并且其中进一步一个相位抖动参数被传输,该相位抖动参数表示在从传输的正弦参数恢复正弦分量期间应添加的一个相位抖动量。
权利要求
1.一种编码(2)信号(A)的方法,该方法包括步骤确定(20)信号(A)中至少一个正弦分量的频率和幅度信息;以及传输(22)表示频率和幅度信息的正弦参数(f,a);其特征在于该方法(2)进一步包括步骤传输(22)相位抖动参数(p),该相位抖动参数表示在从传输的正弦参数(f,a)恢复正弦分量期间应添加的一个相位抖动量。
2.如权利要求1所要求的方法(2),其中在轨迹的第一阶段相位抖动参数(p)与正弦参数(f,a)大致一起传输(22)。
3.如权利要求1所要求的方法(2),其中相位抖动参数(p)为正弦分量的一个给定组被传输(22),该正弦分量具有谐波相关的频率。
4.如权利要求1所要求的方法(2),该方法(2)进一步包括步骤确定(20)正弦分量的相位和预测的相位间的差值,该预测的相位从传输的正弦参数(f,a)和相位连续要求计算;以及从所述差值推出(20)该相位抖动参数(p)。
5.一种解码(4)编码的信号(A’)的方法,该方法包括步骤接收(40)表示至少一个正弦分量的频率和幅度信息的正弦参数(f,a);从正弦参数(f,a)恢复(41)至少一个正弦分量;其特征在于该方法进一步包括接收(40)相位抖动参数(p);将一个相位抖动量添加(41)至正弦分量,该相位抖动量从相位抖动参数推出。
6.一个声频信号编码器(2)包括用于确定信号(A)中至少一个正弦分量的频率和幅度信息的装置(20);以及用于传输表示频率和幅度信息的正弦参数(f,a)的装置(22);其特征在于声频信号编码器(2)进一步包括用于传输相位抖动参数(p)的装置(22),该相位抖动参数表示在从传输的正弦参数(f,a)恢复正弦分量期间应添加的一个相位抖动量。
7.一个声频播放器(4)包括用于接收表示至少一个正弦分量的频率和幅度信息的正弦参数(f,a)的装置(40);用于从正弦参数(f,a)恢复至少一个正弦分量的装置(41);其特征在于该声频播放器进一步包括用于接收相位抖动参数(p)的装置(40);用于将一个相位抖动量添加至正弦分量的装置(41),该相位抖动量从相位抖动参数推出。
8.包括如权利要求6所要求的声频信号编码器(2)和如权利要求7所要求的声频播放器(4)的一种声频系统。
9.一种编码的信号(A’),包括表示至少一个正弦分量的频率和幅度信息的正弦参数(f,a)并进一步包括相位抖动参数(p),该相位抖动参数表示在从正弦参数(f,a)恢复正弦分量的期间应添加的一个相位抖动量。
10.一种存储介质(3),其上存储有如权利要求9所要求的编码的信号(A’)。
全文摘要
提供将一信号(A)编码(2),其中信号(A)中至少一个正弦分量的频率和幅度信息被确定(20),并且表示频率和幅度信息的正弦参数(f,a)被传输(22),并且其中进一步一个相位抖动参数(p)被传输,相位抖动参数表示在从传输的正弦参数(f,a)恢复正弦分量期间应添加的一个相位抖动量。
文档编号G10L19/02GK1383546SQ01801727
公开日2002年12月4日 申请日期2001年6月14日 优先权日2000年6月20日
发明者A·W·J·奥门, A·C·登布林克 申请人:皇家菲利浦电子有限公司

喜欢就赞一下

上一篇
下一篇

相关推荐

    专利名称:三声道复合哨子的制作方法技术领域:本实用新型是一种二孔无核和一空腔有核有效结合的三声道复合哨子。通常。我们使用的哨子为一种带有小球的有核哨子,即在哨子的壳体内空腔放有一只可以自由移动的小球。这种有核哨子在使用过程中,哨子里的小球常

    专利发布时间:2025-05-15阅读:(86)

    专利名称::摄像透镜及摄像装置的制作方法技术领域::本实用新型涉及一种摄像透镜及摄像装置,更详细地涉及一种适合于在使用CCD(ChargeCoupledDevice)或CMOS(ComplementaryMetalOxideSemicond

    专利发布时间:2025-05-15阅读:(77)

    专利名称:Pc卡拉ok卡匣装置的制作方法技术领域:本实用新型涉及电子乐器,具体是一种可插置入电脑主机预留软碟机槽座上的卡拉OK卡匣装置。常见的卡拉OK装置,大部分是独立实施,也就是说具有单一组的话筒输入设备,其可与录放影机或与收录音机配合使

    专利发布时间:2025-05-15阅读:(75)

    专利名称:具有不依赖于说话者的语音识别的通信设备的制作方法技术领域:本文描述的技术通常涉及通信设备,以及这种通信设备中的不依 赖于说话者的语音识别技术。背景技术:移动电话已经开始配备有依赖于说话者的姓名拨号以允许实现 特定的功能,如不用手的

    专利发布时间:2025-05-15阅读:(110)

    专利名称:一种移动照明万向灯架的制作方法技术领域:本发明涉及一种灯架。 背景技术:目前现有技术, 一种收折灯架,包括底支撑架座、顶支撑杆、中空的 中支撑杆、设置在顶支撑杆上的灯架杆,底支架座由三个支撑脚杆、连接 座、中心支撑杆、紧固活动套构

    专利发布时间:2025-05-15阅读:(91)

    专利名称:汽车笛声分级装置的制作方法技术领域:本实用新型涉及一种汽车装置,具体地说是一种汽车笛声分级装置。背景技术:我们知道,目前广泛应用于汽车的笛声系统主要由按钮、电源、喇叭组成,其工作过程如下驾驶员按按钮,电路接通,喇叭中电磁铁在电流的

    专利发布时间:2025-05-15阅读:(94)