专利名称:重获原始信号中的水印数据的方法和设备的制作方法
技术领域:
本发明涉及重获通过与至少两个不同参考数据序列有关地修改原始信号的部分而嵌入所述原始信号中的水印数据的方法和设备。
背景技术:
音频信号的水印旨在以该音频内容中的变化不可被人的听觉系统识别到的方式来处理该音频信号。很多音频水印技术将覆盖音频信号的整个频谱的扩频信号添加到原始信号上,或将一个或更多以扩频信号进行调制的载波插入原始音频信号中。在解码器或接收侧,多数情况下使用与一个或更多参考比特序列的相关来检测所嵌入的参考符号并且从而检测水印信号比特。针对包括噪声和/或回声的音频信号(如,听觉上接收到的音频信号),在解码器侧可能很难以可靠的方式对水印信号进行重新获取和解码。例如,在EP 1764780 A1、US 6584138B1和US 6061793中描述了使用相关来检测水印信号。在EP 1764780A1中,用参考相位序列的相位在频域内对音频信号的相位进行处理,然后将该音频信号转换到时域。根据心理声学的原理对频域中相位改变的可允许幅度进行控制。
发明内容
每一个水印处理都需要检测度量以在解码器或接收侧判决信号内容是否被标记了。如果被标记了,检测度量必须进一步判决哪一个符号被嵌入到音频或视频信号内容中。因此,检测度量应该达到三个特征 -低误报率,即,检测度量应该极少将未标记的信号内容分类为已标记。
-高命中率,即,如果接收到的信号内容已被标记,检测度量应该正确地识别所嵌入的符号。如果被标记的信号内容发生改变,例如,由于在混响的环境中播放并且用麦克风捕捉到混响的声音,高命中率尤其困难。
-该度量可以轻易地适配于给定的误报率限制,因为该技术的客户常常要求该处理不超过预定的误报率。
利用已知的检测度量,通过进行大量的测试并相应地适配有关的内部阈值来执行该适配,即,在存在附加噪声和回声的情况下,已知的检测度量不能达到以上三个特征。
本发明所要解决的问题是提供达到以上三个要求的新的水印信号检测度量。通过权利要求1所公开的方法,该问题得以解决。权利要求2中公开了利用该方法的设备。
根据本发明,在存在附加噪声和回声的情况下,能够实现音频水印的可靠检测。通过考虑判决度量中的接收到的音频信号的回声中所包含的信息并将该信息与通过对未标记信号进行解码所获得的度量相比较,来执行该检测。针对多峰,该判决度量基于对参考序列的误检率的计算。将与具有最低误检率(即,最低误报误差)的参考序列相对应的符号选择为所嵌入的符号。
特别地,当回声和混响被添加至水印信号内容时,接收机侧的本发明的处理导致更低的误报率和更高的“命中率”,即,检测率。为了使该度量适配于客户提供的误报限制,即,为了控制取决于应用的误报率,只需要改变单个值。
针对“误报”检测率的合理的较低的概率阈值是例如P=10-6(即,图8中t右侧由‘I’表示的f(m|H0)以下的区域)。如果该比率小于阈值P,做出内容已被标记的判决。这意味着在一百万次测试中,期望只有一次误检。
原则上,本发明的方法适于重获通过与至少两个不同参考数据序列有关地修改原始信号的部分而嵌入所述原始信号的水印数据,其中,将被修改的信号部分表示为“已标记”且将原始的信号部分表示为“未标记”,所述方法包括以下步骤 -在每一种情况下,将所述打上水印的信号的接收版本的当前部分与所述参考数据序列的候选进行相关,其中,所述接收到的打上水印的信号能够包括噪声和/或回声; -基于针对所述当前信号部分的相关结果值, 可选地,确定所述当前信号部分是否是未标记的,并且如果不是,执行以下步骤; 针对所述候选参考数据序列中的每一个,基于所述相关结果值中的两个或更多个显著的峰,确定误报误差,其中,所述误报误差由针对未标记信号部分的相关结果的幅度的功率密度函数以及由与所述功率密度函数有关的第一阈值导出; 为所述当前信号部分选择所述候选参考数据序列中具有最低误报误差的一个,以便提供所述水印数据。
原则上,本发明的设备适于重获通过与至少两个不同参考数据序列有关地修改原始信号的部分嵌入所述原始信号的水印数据,其中,将修改后的信号部分表示为“已标记”,而将原始的信号部分表示为“未标记”,所述设备包括适于进行以下操作的装置 -在每一种情况下,将所述打上水印的信号的接收版本的当前信号部分与所述参考数据序列的候选进行相关,其中,所述接收到的打上水印的信号包括噪声和/或回声; -基于针对所述当前信号部分的相关结果值, 可选地,确定所述当前信号部分是否是未标记的,并且如果不是,执行以下步骤; 针对所述候选参考数据序列中的每一个,基于所述相关结果值中的两个或更多个显著的峰,确定误报误差,其中,所述误报误差由针对未标记信号部分的相关结果的幅度的功率密度函数以及由与所述功率密度函数有关的第一阈值导出; 为所述当前信号部分选择所述候选参考数据序列中具有最低误报误差的一个,以便提供所述水印数据。
在对应的从属权利要求中公开了本发明的优势附加实施方式。
参考附图对本发明的示例性实施例进行描述,在附图中 图1示出了非匹配和匹配相关结果值的图; 图2示出了存在附加噪声情况下,非匹配和匹配相关结果值的图; 图3示出了存在附加噪声和回声情况下,非匹配和匹配相关结果值的图; 图4示出了与所计算的理论高斯分布相比,非匹配参考序列的相关的幅度分布; 图5示出了与所计算的理论高斯分布相比,两个轻微相关的参考序列的相关的幅度分布; 图6示出了未标记的情况下,峰值的幅度m与数目Npeaks; 图7示出了本发明的水印解码器的框图; 图8示出了分布和误差概率。
具体实施例方式 本发明的水印处理使用基于相关的检测器。如现有技术一样,很可能被打上水印的音频(视频)信号的当前块与一个或更多个参考序列或模式相关,所述一个或更多个参考序列或模式中的每一个表示一个不同的符号。选择具有最佳匹配的模式,并将其对应的符号馈送至下行纠错。
然而,根据本发明,对与未标记(音频)信号内容的一部分进行相关的结果值的幅度的功率密度函数进行估计,然后判决当前的相关序列的最高相关结果幅度是否也属于该未标记内容。在判决步骤中,计算当前相关结果值的幅度分布与该未标记信号的估计功率密度函数相匹配的概率。如果计算出的误报概率接近于例如‘0’,就做出内容被标记的判决。假定具有最低误报概率的符号被嵌入。
为了判决什么是‘最佳匹配’,为了说明的目的,产生数量为numRef(如,numRef=7)的参考模式,所述参考模式与已打上水印的音轨相关(在Matlab的符号中,pi=π) rand(′seed′,0) numRef=7; N=2048; NSpec=N/2+1; for k=1:numRef ang=rand(NSpec,1)*2*pi; ref{k}=irfft(cos(ang)+i*sin(ang)); end 接下来的小节介绍根据可发生在被打上水印的音轨上的处理的种类的不同情况。通过实验对这种处理对相关的效果进行模拟,并被讨论为描述在被打上水印的音频文件在声学路径上传输的情况下水印检测的问题。
被打上水印的音轨未改变 参照图1a中参考信号与另一个表示非匹配情形的参考模式进行的相关和图1b中该信号与表明匹配情形的自身进行的相关,在未受到干扰的情况下(即,无噪声/回声/混响),匹配和非匹配之间的差异是明显的。
%将第一参考模式用作‘信号’ signal=ref{1}; %白化该信号并将其与自身相关以模拟匹配情况。
%将其与另一个参考信号相关以模拟非匹配情况 signal=irfft(sign(rfft(signal))); [noMatch t]=xcorr(signal,ref{2}); [match t]=xcorr(signal,ref{1}); %绘制非匹配和匹配序列 ax=[(-N+1)(N-1)-1 1]; figure;plot(t,noMatch);axis(ax); print(gcf,′-depsc2′,′noMatch.eps′); figure;plot(t,match);axis(ax); print(gcf,′-depsc2′,′match.eps′); 在图1a(非匹配)和图1b(匹配)中示出相应的结果,其中,纵轴示出了‘-1’到‘+1’之间的相关结果值,横轴示出了从‘-2048’到‘+2048’的值。
将噪声加至被打上水印的音轨 在信号受到干扰的情况下,匹配和非匹配之间的检测和区分变得更加困难。通过将噪声加至原始参考模式并计算与表示非匹配情形的另一个参考模式的相关(参照图2a),以及与表明匹配情形的原始参考模式的相关(参照图2b),可以对此进行论证。 rand(′seed′,1) %产生噪声并将噪声加至信号 noise=0.8*(rand(N,1)-0.5); signal=ref{1}+noise; %白化被噪声破坏的信号,并与原始信号进行相关以模拟匹配的 %情况。将被破坏的信号与其它参考模式进行相关以模拟非匹配 %的情况 signal=irfft(sign(rfft(signal))); [noMatch t]=xcorr(signal,ref{2}); [match t]=xcorr(signal,ref{1}); %绘制在存在噪声的情况下的非匹配和匹配序列 ax=[(-N+1)(N-1)-0.20.2]; figure;plot(t,noMatch);axis(ax); print(gcf,′depsc2′,′noMatchNoise.eps′); figure;plot(t,match);axis(ax); print(gcf,′depsc2′,′matchNoise.eps′); 对应的结果在图2a(非匹配)和图2b(匹配)中示出,图2a和图2b具有与图1中所使用的相同水平刻度,而纵轴在“-0.2”到“+0.2”之间示出了相关结果值。在匹配的情况下,与图1b中获得的相应结果值相比,相关的最大结果值大约减少了9/10。
将噪声和回声加至被打上水印的音轨 如果包括更少的噪声而包括了附加的回声,匹配和非匹配之间的检测和区分变得更加困难。 rand(′seed′,2) %将噪声和回声加至信号ref{1} noise=0.6*(rand(N,1)-0.5); signal=filter([1 0 0 0 0 0-0.8-0.4 0 0 0 0 0 0.3 0.2], …[1 0 0 0 0-0.3],ref{1})+noise; %白化被噪声和回声破坏的信号,并与原始信号进行相关以模拟 %匹配的情况。将被破坏的信号与其它参考模式进行相关以模拟 %非匹配情况 signal=irfft(sign(rfft(signal))); [noMatch t]=xcorr(signal,ref{2}); [match t]=xcorr(signal,ref{1}); %绘制在存在噪声和回声的情况下的非匹配和匹配序列 ax=[(-N+1)(N-1)-0.2 0.2]; figure;plot(t,noMatch);axis(ax); print(gcf,′depsc2′,′noMatchEcho.eps′); figure;plot(t,match);axis(ax); print(gcf,′depsc2′,′matchEcho.eps′); 图3a(非匹配)和图3b(匹配)中示出的相应结果具有与图2中所使用的相同的刻度。
在存在噪声和回声的情况下,所要解决的问题是定义可以在非匹配情况和匹配情况之间进行可靠地区分的判决量度。典型地,如果在声学路径上传输被打上水印的音频信号或音轨,将发生这些类型的信号干扰。
判决理论 由m表示的可靠判决度量(也称之为“测试统计量”)应该使判决中涉及的误差最小化。针对基于相关的处理,将适当的测试统计量m定义为相关结果值的幅度函数。用公式表达“检验假设”H0和“备择假设”H1。随机变量m遵循两种不同的分布原始(即,未标记)情况下的f(m|H0)和被标记情况下的f(m|H1),通过与阈值t相比较,在两者之间进行区分。可以如下对这种检验假设判决基础进行公式表示 H0在测试统计量遵循分布f(m|H0)的情况下,音轨不携带水印。
H1在测试统计量不遵循分布f(m|H0)的情况下,音轨携带水印。
由于相应的两个概率密度函数的交叠,可能有相对于所限定的阈值t的四种不同的判决,参见表1和图8,图8中横轴对应于m而纵轴对应于pdf(m)。
表1真状态、判决和相应的概率 检测处理基于测试统计量m相对于阈值或“临界值”t的运算。并入假设检验中的两种误差类型是误报误差和漏报(遗漏)误差。
(I型误差或“误报误差”)(1) (II型误差或“漏报误差”)(2) PF是针对误报的条件概率,并对应于函数f(m|H0)以下m=t右侧的区域I,该函数下总的区域被归一化为“1”。PM是针对检测遗漏的条件概率,并对应于函数f(m|H1)以下m=t左侧的区域II,该函数下总的区域被归一化为“1”。根据应用,由期望的判决误差率推得阈值t。通常,这要求事先知道分布函数f(m|H0)和f(m|H1)。
可以对属于未标记情形的分布函数f(m|H0)进行建模(参见若干观测一节),然而分布函数f(m|H1)取决于音频信号中水印的嵌入和检测期间可能发生的处理,因而事先并不知道。因此,针对给定的误检概率PF,根据公式(1)计算阈值t的导数,并且根据本发明的处理不使用分布函数f(m|H1)。
以下两节描述了定义用于水印检测的合适的判决度量m的已知方法。
最大峰 最简单和最常用的解决方案是计算N个候选相关xxi的绝对最大结果值mi=max(|xxi|),其中,i=1、…、N,接下来搜索这些最大值中的最大值与具有该最大值mm的相关相对应的符号被用作结果检测符号。
在这种情况下,所要确定的度量m应该满足下面的等式(3)和(4),其中,mx是相关数x的度量,且ax是相关数x的最大幅度 针对一些纠错处理,除结果符号之外,使用通常在“0”到“1”的范围内的“检测强度”(即,加权)是有帮助的。在该情况下,纠错可以利用与使用低检测强度检测到的符号相比,使用高强度值检测到的符号的确具有较低的被检测为错误值的概率这一事实。
可以使用绝对最大值与理论上可能的最大值之比,或mi中最大的绝对最大值与第二大的绝对最大值之比。参照申请PCT/US2007/014037,由于其值无界,后者将被钳位至“1”。
在该“最大峰”处理中,假定最大相关与嵌入的序列相对应,Npeaks的最大峰值属于不同的序列。该处理非常容易,并且对于如mp3编码音频信号这样的“攻击”非常简单有效。然而,如果在相关结果中不仅显现一个而是若干属于同一个序列的峰值(例如如果用麦克风捕捉被打上水印的信号,则由于回声将出现这样的情况),该处理示出了其局限性。
峰积累 参照申请EP08100694.2,在峰积累处理中,试图通过考虑一个相关结果中的多个峰克服最大峰技术的缺陷。该处理非常有效,然而为了区分噪声和“真实的”峰,需要很多阈值或常数值。可以通过基于很多记录的最优化处理确定这些常数值,然而最终将任意地选择这些常数值,并且永远不知道对于所有种类的音轨或音频信号,这些参数是否同样有效。此外,单个相关值的含义是意义明确的,然而,不存在如何将若干相关值合并为具有类似清楚含义的单个检测强度值的明确的数学方法。
统计检测器 本节描述新的解决方案以及对以上已知的解决方案的改进,用于针对被打上水印的音频内容在声学路径上的传输来检测水印。
本发明的统计检测器合并了“最大峰”处理和极少的任选常数值的优势以及“峰积累”处理的优势,导致在存在属于同一个嵌入序列的多个相关结果峰值的情况下非常好的检测。
若干观测 非相关白化信号的循环相关的幅度分布显现为均值为零的高斯分布 rand(′seed′,0) N=16*1024; stepSize=0.0001; signal=sign(rfft(rand(N,1))); edges=(-0.03):stepSize:0.03; hist=zeros(size(edges′)); numTest=1000; st=0; mm=0; 其中,‘edges’代表用于柱状图计算的柱矢量。
%将信号与numRef个随机参考信号相关 tor k=1:numTest s2=sign(rfft(rand(N,1))); xx=irfft(s2.*signal); mm=mm+mean(xx); st=st+xx′*xx; %对落在边缘矢量中元素之间的xx中值的数目进行计数 hist=hist+histc(xx,edges);end %估计标准方差并计算高斯密度函数 st=st/(numTest*N-1); gauss=1/sqrt(2*pi*st)*exp(edges.^2/-2/st); %计算所测量的幅度分布的柱状图,并将其与高斯密度函数相比较 hist=hist/numTest/N/stepSize; figure;plot(edges,hist,edges,gauss); print(gcf,′-depsc2′,′gauss.eps′); 图4中示出了相应的结果,并且该结果表明所测量的函数近乎完美地与高斯密度函数相匹配。如果仅考虑相关中部的一小部分值,这对于标准的非循环相关也是正确的。
当然,两个匹配序列的相关的结果幅度值并非高斯分布,这是因为针对Δt=0(在此,t表示时间),该结果幅度值是“1”而在其它任何位置该结果幅度值是“0”。然而,如果两个序列仅轻微相关,即当将参考序列与使用该参考序列打上水印的音频信号进行相关时的情况,相关结果幅度值的分布是近似高斯分布的。参见图5b,当进行放大时,这种情况很明显。
rand(′seed′,0) N=16*1024; stepSize=0.001; numTest=1000; timeSignal=rand(N,1); specSignal=conj(sign(rfft(timeSignal))); edges=(-0.1):stepSize:0.1; hist=zeros(size(edges′)); st=0; %将信号与包含部分参考信号的numTest个信号相关 for k=1:numTest s2=sign(rfft(rand(N,1)+0.1*timeSignal)); xx=irfft(s2.*specSignal); mm=mm+mean(xx); st=st+xx ′*xx; %对落在边缘矢量中元素之间的xx中值的数目进行计数 hist=hist+histc(xx,edges); end %估计标准偏差并计算高斯密度函数 st=st/(numTest*N-1); st=stOrig; gauss=1/sqrt(2*pi*st)*exp(edges.^2/-2/st); %计算所测量的幅度分布的柱状图,并将其与高斯密度函数相比较 hist=hist/numTest/N/stepSize; figure;plot(edges,hist,edges,gauss); print(gcf,′-depsc2′,′gaussMatch.eps′); axis([min(edges)max(edges)0 0.1]) print(gcf,′-depsc2′,′gaussMatchZoom.eps′); 相应的结果在图5a和图5b中示出。图5a以较粗糙的水平刻度示出了图4,图5b以垂直方向上剧烈放大的方式示出了图5a。由于这种放大,两条曲线之间的显著差异在大约+0.06到+0.1的水平范围内变为可见。本发明使用这种差异来改进检测可靠性。
χ2测试是用于测试给定采样值是否遵循给定分布(即采样值和给定分布之间的差异是否显著)的一种众所周知的数学算法。基本上,通过将位于给定的幅度范围内的采样值的实际数量和使用给定分布计算出的期望数量相比较来执行该测试。问题在于,为了应用χ2测试,该幅度范围必须包括至少一个期望采样值,这意味着该测试不能区分峰值高度为0.9的相关和峰值高度为0.4的相关,因为(对于真实世界的相关长度)无论在0.9的邻域还是在0.4的邻域,理论都没有预期任何峰值。
统计处理 与使用如χ2测试的取值范围不同,本发明的统计检测器针对相关结果中数量为Npeaks的显著(即,最大)峰,计算显著峰是否与未标记情况下理论上的期望(即,预定的)峰分布相匹配。具有标准偏差σ并且均值为“0”的高斯分布具有以下概率密度函数 这意味着,峰具有≥m的幅度的概率是 其中,“erf”表示误差函数 然后,针对N个值,幅度≥m的期望峰的个数ne(m)是 ne(m)=Np(m)(9) 如果信号模型已知并且执行了一些归一化步骤,可以预先计算标准偏差σ,或者可以实时计算标准偏差σ,例如对所有候选序列的所有相关计算标准偏差σ。
作为备选,对于当前输入信号部分,可以根据与错误参考数据序列进行相关的相关结果值的集合,来计算针对未标记情况的分布。
接下来的小节描述了两种新的解决方案,所述新的解决方案通过将误检概率(等式8中的p(m))和对应的阈值(等式10中的m)合并,利用未标记分布和已标记分布之间的比较。两种解决方案都使用给定的峰数量Npeaks,以在存在附加噪声和回声的情况下对判决进行改进。
比较差异幅度 因为幅度的概率密度函数的差异非常小,另一种解决方案是,将针对不同参考序列的用于获得指定数量的峰的幅度
与未标记情况进行比较。为了控制误报率,即检测器确定未标记内容中存在标记的百分比,希望设置预定阈值t。例如,阈值tf=0.01意味着在一百次测试中,有一次
个峰具有大于
的值并且未标记信号将被归类为已标记。有利地,可以轻易地将该阈值结合到等式(10)中 为了以相同的方式处理负峰和正峰,取峰的绝对值,这意味着绝对值
的峰值的期望数目如下 未标记情况下相应的幅度
是 其中,“erf-1”表示反误差函数。
例如,针对标准偏差σ=0.01、N=16000以及误报阈值tf=1,图6中描述了作为峰数量的函数m(Npeaks)的幅度值m。
对于每一个序列k,获得Npeaks个最大峰值的绝对值ri,i=1、2、…、Npeaks。将这些排序值与未标记情况下排序后的理论值mi,i=1、2、、Npeaks(参见等式14)相比较,以获得相应的、针对每一个序列的Npeaks个最大峰之差的总和ck。
此后,将具有所有差值ck的最大值的序列k选择为所嵌入的序列。
计算误报概率 如针对先前描述的处理一样,针对这种类型的处理,假定在具有非常低信噪比的环境中使用传输系统。附加地,传输信道包括多径接收。由于该物理事实,已知只有三个最大的回声是有关的。例如,相关块长度是4096个采样。针对未标记情况,后处理保证了相关值的高斯分布具有“零”均值和σ=0.01562的标准偏差。传输系统分别使用两个参考序列“A”和“B ”用于传输“0”符号或“1”符号。当前,假定由这些序列的相关结果的三个最大(即,最显著)幅度值构成的组v具有以下的值
这些参考序列中哪一个应被选为正确的序列,即,应该对哪一个符号值进行解码? 在现有技术中,将选取具有最高值的序列,即
,并将对“0”符号进行解码。
然而,在本发明的统计检测器中,计算所有三个幅度的概率。以下给出了概率密度函数 如果取一个采样,可以根据等式(8)来计算幅度值大于或等于
或
(i=1、2、3)的峰的概率p(v)。以下的表列出了所有六种有关幅度的概率 幅度概率 0.070306.80 10-6 0.068781.07 10-5 0.064603.54 10-5 0.060809.92 10-5 0.058901.627 10-4 0.058521.793 10-4 因为不仅仅取单个采样而是检查整个相关块,因此可以使用二项式分布计算N个采样的组中出现
的峰的概率PkN(p(v)) 分别针对三个峰
或
(用v1、v2、v3表示,其中v1≥v2≥v3),相关块中有三个或更多个大于或等于这些峰值的值存在着四种不同的概率 P1三个或更多个值≥v1; P1两个值≥v1并且一个或更多个值在v3和v1之间; P3一个值≥v1并且两个或更多个值在v3和v2之间; P3一个值≥v1,一个值在v2和v1之间并且一个值在v3和v2之间。
那么,总概率Ptotal是 Ptotal=P1+P2+P3+P4。(20) 然后,针对序列
和
因此,
的三个峰出现在未标记内容中的误报概率低于
的三个峰值出现的概率,这意味着即使
比
包含更大的峰值,也应该选择
并且应该对“1”符号解码。
在同步和初始化阶段开启水印检测时,或者此外在正常操作模式期间,通过针对候选参考数据序列REFP中每一个,为当前信号部分计算例如三个最大(即,最显著)峰值的概率,可以以相似的方式确定未打上水印的音频信号部分,接下来执行以下步骤 -根据三个显著峰的数目,计算相关块中存在大于或等于这些显著峰的相应数目的值的、有关数目的概率; -针对每一个候选参考数据序列,累加有关数目的概率,以形成总的概率值; -如果针对所有候选参考数据序列的总概率值小于预定阈值(如10-3),将当前信号部分视为未标记。
在图7的水印解码器框图中,在接收部分步骤或单元RSU中,对接收到的打上水印的信号RWAS进行重采样,此后接收到的打上水印的信号RWAS可通过在其中执行谱成形和/或白化的预处理步骤或阶段PAPR。在接下来的相关步骤或阶段CORR中,与一个或更多个参考模式REFP逐部分地进行相关。判决步骤或阶段DC根据上述本发明的处理,确定是否存在相关结果峰以及相应的水印符号。在可选的下行纠错步骤或阶段ERRC中,可对这种符号的初步确定的水印信息比特INFB进行纠错,产生纠正的水印信息比特CINFB。
本发明可应用于所有使用基于相关的检测的技术领域,如水印技术或通信技术。
权利要求
1.一种重获通过与至少两个不同参考数据序列(REFP)有关地修改原始信号的部分而嵌入所述原始信号的水印数据(INFB)的方法,其中,将被修改的信号部分表示为“已标记”,而将原始的信号部分表示为“未标记”,所述方法包括以下步骤
-在每一种情况下,将所述打上水印的信号的接收版本(RWAS)的当前部分与所述参考数据序列的候选(REFP)进行相关(CORR),其中,所述接收到的打上水印的信号能够包括噪声和/或回声;
-基于针对所述当前信号部分的相关结果值,
可选地,确定(DC)所述当前信号部分是否是未标记的,并且如果不是,执行以下步骤;
针对所述候选参考数据序列(REFP)中的每一个,基于所述相关结果值中的两个或更多个显著的峰,确定(DC)误报误差,其中,所述误报误差由针对未标记信号部分的相关结果的幅度的功率密度函数(pdf)以及由与所述功率密度函数有关的第一阈值(t)导出;
为所述当前信号部分选择所述候选参考数据序列中具有最低误报误差的一个,以便提供所述水印数据(INFB)。
2.根据权利要求1所述的方法,其中,所述信号是音频信号或视频信号。
3.根据权利要求1或2所述的方法,其中,所述确定所述当前信号部分是否是未标记的步骤是通过针对所述候选参考数据序列(REFP)中的每一个,为所述当前信号部分计算所述两个或更多个最显著的峰的概率来执行的,接下来执行以下步骤
-根据所述两个或更多个最显著峰的数目,计算相关块中存在大于或等于这些显著峰的相应数目的两个或更多幅度值的、有关数目的概率;
-针对每一个候选参考数据序列(REFP),累加所述有关数目的概率,以形成总的概率值;
-如果针对所有候选参考数据序列的所述总概率值小于预定的第二阈值,则将所述当前信号部分视为未标记的。
4.根据权利要求3所述的方法,其中,未标记信号部分的所述确定只在水印数据的所述重获的同步或初始化阶段执行。
5.根据权利要求1至4中任一项所述的方法,其中,为了确定所述误报误差,针对所述相关结果值中所述两个或更多个最显著的峰,计算它们是否与针对未标记信号部分的对应数目的最显著峰的预定概率相匹配。
6.根据权利要求1至5中任一项所述的方法,其中,针对所述候选参考数据序列(REFP)的每一个,为所述当前信号部分计算所述两个或更多个最显著峰的概率,接下来执行以下步骤
-根据所述两个或更多个最显著峰的数目,计算相关块中存在大于或等于这些显著峰的相应数目的两个或更多个幅度值的、有关数目的概率;
-针对每一个候选参考数据序列(REFP),累加所述有关数目的概率,以形成总的概率值;
-将被分配以所述总概率值中最低的一个值的候选参考数据序列视为具有所述最低误报误差的一个。
7.根据权利要求1至6中任一项所述的方法,其中,针对所述当前信号部分
-针对未标记信号内容,获得相关结果值中预定数目(Npeaks)的最大幅度峰值(mi),并根据其大小对这些峰值进行排序,
并针对所述候选参考数据序列(REFP)中的每一个,获得相关结果值中所述预定数目(Npeaks)的最大幅度峰值(ri),并根据其大小对这些峰值进行排序;
-针对所述候选参考数据序列中的每一个,将所述预定的最大幅度峰值数目(Npeaks)的、当前候选参考数据序列的最大幅度值和针对未标记内容的最大幅度值的相应对之间的差值(ri-mi)进行累加;
-将计算出的差值(ri-mi)总和最大的候选参考数据序列选为用于标记所述当前信号部分的数据序列。
8.根据权利要求1至7中任一项所述的方法,其中,所述第二阈值小于所述第一阈值(t)。
9.一种重获通过与至少两个不同参考数据序列(REFP)有关地修改原始信号的部分而嵌入所述原始信号的水印数据(INFB)的设备,其中,将被修改的信号部分表示为“已标记”,而将原始的信号部分表示为“未标记”,所述设备包括适于执行以下操作的装置(CORR、DC)
-在每一种情况下,将所述打上水印的信号的接收版本(RWAS)的当前信号部分与所述参考数据序列的候选(REFP)进行相关,其中,所述接收到的打上水印的信号能够包括噪声和/或回声;
-基于针对所述当前信号部分的相关结果值,
可选地,确定所述当前信号部分是否是未标记的,并且如果不是,执行以下步骤;
针对所述候选参考数据序列(REFP)中的每一个,基于所述相关结果值中的两个或更多个显著的峰,确定误报误差,其中,所述误报误差由针对未标记信号部分的相关结果的幅度的功率密度函数(pdf)以及由与所述功率密度函数有关的第一阈值(t)导出;
为所述当前信号部分选择所述候选参考数据序列中具有最低误报误差的一个,以便提供所述水印数据(INFB)。
10.根据权利要求9所述的设备,其中,所述信号是音频信号或视频信号。
11.根据权利要求9或10所述的设备,其中,所述确定所述当前信号部分是否是未标记的步骤是通过针对所述候选参考数据序列(REFP)中的每一个,为所述当前信号部分计算所述两个或更多个最显著的峰的概率来执行的,接下来执行以下步骤
-根据所述两个或更多个最显著峰的数目,计算相关块中存在大于或等于这些显著峰的相应数目的两个或更多个幅度值的、有关数目的概率;
-针对每一个候选参考数据序列(REFP),累加所述有关数目的概率,以形成总的概率值;
-如果针对所有候选参考数据序列的所述总概率值小于预定的第二阈值,则将所述当前信号部分视为未标记的。
12.根据权利要求11所述的设备,其中,未标记信号部分的所述确定只在水印数据的所述重获的同步或初始化阶段执行。
13.根据权利要求9至12中任一项所述的设备,其中,为了确定所述误报误差,针对所述相关结果值中所述两个或更多个最显著的峰,计算它们是否与针对未标记信号部分的对应数目的最显著峰的预定概率相匹配。
14.根据权利要求9至13中任一项所述的设备,其中,针对所述候选参考数据序列(REFP)的每一个,为所述当前信号部分计算所述两个或更多个最显著峰的概率,接下来执行以下步骤
-根据所述两个或更多个最显著峰的数目,计算相关块中存在大于或等于这些显著峰的相应数目的两个或更多个幅度值的、有关数目的概率;
-针对每一个候选参考数据序列(REFP),累加所述有关数目的概率,以形成总的概率值;
-将被分配以所述总概率值中最低的一个值的候选参考数据序列视为具有所述最低误报误差的一个。
15.根据权利要求9至14中任一项所述的设备,其中,针对所述当前信号部分
-针对未标记信号内容,获得相关结果值中预定数目(Npeaks)的最大幅度峰值(mi),并根据其大小对这些峰值进行排序,
并针对所述候选参考数据序列(REFP)中的每一个,获得相关结果值中所述预定数目(Npeaks)的最大幅度峰值(ri),并根据其大小对这些峰值进行排序;
-针对所述候选参考数据序列中的每一个,将所述预定的最大幅度峰值数目(Npeaks)的、当前候选参考数据序列的最大幅度值和针对未标记内容的最大幅度值的相应对之间的差值(ri-mi)进行累加;
-将计算出的差值(ri-mi)总和最大的候选参考数据序列选为用于标记所述当前信号部分的数据序列。
16.根据权利要求9至15中任一项所述的设备,其中,所述第二阈值小于所述第一阈值(t)。
全文摘要
本发明公开了一种重获原始信号中的水印数据的方法和设备。每一个水印处理都需要检测度量以在解码器侧判决音频信号内容是否被标记了,以及哪一个符号被嵌入到音频信号内容中。本发明提供了一种在存在附加噪声和回声的情况下实现可靠的水印检测的新的检测度量。这是基于针对多个峰值计算参考序列的误报率,通过在判决度量中考虑接收到的音频信号的回声中包含的信息,并将其与通过对未标记音频信号进行解码所获得的相应的度量进行比较,来实现的。选择与具有最低的误报误差的参考序列相对应的水印符号作为嵌入的符号。
文档编号G10L19/018GK101751927SQ200910204670
公开日2010年6月23日 申请日期2009年10月10日 优先权日2008年10月10日
发明者彼得·乔治·鲍姆, 迈克尔·阿诺德 申请人:汤姆森许可贸易公司