再生装置及再生方法-品牌商务网

专利名称：再生装置及再生方法
技术领域：
本发明，涉及一种将帧化的音频信号解码并再生的音频再生装置，特别涉及一种再生装置及再生方法，在因编辑或通信错误导致音频信号的中途存在不连续点的情况、或属性变化的情况下，不会产生异音。
背景技术：
近年来，对被编码为数字代码列的音频编码信号进行解码的再生装置、和作为计算机程序来具体实现的再生方法越来越普及。在很多情况下，以MPEG格式(ISO11172-3、或ISO13818-3)为代表那样，声音信号被帧化为音频编码信号。各帧上被付加包含信号的属性信息的专用报头(private header)。另外，给音频编码信号付加用于误码检测的CRC位，可在解码时检测出传送通路中的数据的丢失或误码。
在传送通路中的数据的丢失过多、数据流不连续的情况下，无法通过纠错复原。如果对该不连续位置直接进行声音输出，则会混入异音。为了消除该异音，最好实施静音。
现有的再生装置的一例，记载于例如专利文献1(特开2000-259195号公报)中。该现有的再生装置，并不寻找不连续位置，而是在流的途中存在来自发送侧的设定变更、例如采样频率变更的情况下，检测出上述变更，并对变更后一定期间对声音输出实施静音。若存在变更，接收装置需要自动调整到变更后的设定，并对声音输出实施静音以使自动调整的期间不输出异音。该现有的装置，检测出正常报头(valid header)，并对由报头分析机构分析出的前一个正常报头中记录的采样频率、与当前正要进行解码处理的当前的正常报头中记录的采样频率进行比较，在当前的报头中记录的采样频率发生变化的情况下，对变化后的帧实施一定时间的静音来防止异音的产生。例如，在当前的报头中记录的采样频率发生变化的情况下，必须改变配置于解码机构的后段的DA转换器的设定。在实施DA转换器的设定变更的期间，由于无法生成正确的声音信号，因此变成包含异音的声音信号。因此，在实施DA转换器的设定变更的一定期间，对输出声音实施静音。从而，对记录有变更的当前报头以后的帧实施静音。
另外，报头的检测，通过对与报头同步设置的同步字(synchronizationword)进行检测来进行。
另外，关于同步字记载于专利文献2(特开2000-31942号公报)中。
另外，专利文献3(特开平10-209876号公报)，公开了一种通过进行数据量的比较、检测出存在丢失数据的位置、并实施静音处理的装置。在该专利文献3中记载的现有的位流再生装置，是对用MPEG1或者MPEG2音频格式编码的音频流进行解码的装置，在流的一部分因某些原因丢失的情况下，检测出解码器的帧缓存器的下溢(underflow)，并实施静音。即、检测出同步字后，寻找正常报头并用计数器计测正常报头与正常报头间的数据量。在计测的数据量F比预先决定的数据量小的情况下，判断位发生了数据丢失，实施静音处理。

发明内容
本申请发明中使用的基本流(elementary stream)中，不存在同步字，并且不存在CRC之类的用于进行误码检测的位。在使用这种基本流的情况下，存在以下要解决的课题如何在解码前发现不连续位置，以及在何时实施静音。
以上所说明的专利文献中，存在以下问题。
专利文献1、2中，由于首先检测出正常报头、并对正常报头的信息进行分析，因此不能发现报头与报头之间产生的不连续位置。
专利文献3中，也首先检测出正常报头，并检测出正常报头和下个正常报头之间的数据量。正常报头虽然能够用同步字找到，但在使用不具有同步字的流的本申请发明中，不能发现连续的两个正常报头。
另外，在专利文献1中，实施静音的时刻是检测出变更之后的帧。因此，不能对变更前产生的不连续位置实施静音。
另外，在专利文献3中，没有公开实施静音的时刻。
本发明中的再生装置，接收上位层的第1流中包含下位层的第2流的数据，其中，上位层的第1流中包含可检测出的报头信号；下位层的第2流的一帧中，包含音频编码信号和由所述音频编码信号的属性信息构成的专用报头、且不包含同步字，并将所述音频编码信号解码来输出声音，其特征在于，具备流分析机构，其对所述第1流进行分析、检测出所述报头信号，并且以检测出的报头信号为基准，分析所述第2流来输出所述音频编码信号和所述专用报头的位置信息；解码前缓存，其暂时保存从所述流分析机构中输出的所述音频编码信号和所述专用报头；解码机构，其对从所述解码前缓存中获取的所述音频编码信号进行解码并输出声音；第1报头分析机构，其对第1帧的专用报头中所包含的属性信息进行分析，并检测出表示接在专用报头之后的所述音频编码信号的数据长度的数据长信息；第2报头分析机构，其对给第1帧的专用报头的位置信息加上检测出的数据长所得到的位置之后给定量的目标数据进行分析，并判断分析出的目标数据是否为第2帧的专用报头中所包含的属性信息；以及，控制机构，在判断为分析出的目标数据不是包含在第2帧的专用报头中的属性信息的情况下，至少对第1帧的音频编码信号停止来自所述解码机构的声音输出另外，本发明中的再生装置的也可构成有如下特征所述第2报头分析机构，判断所述目标数据的至少一部分，是否与由所述第1报头分析机构分析出的属性信息的至少一部分相一致。
另外，本发明中的再生装置的也可构成有如下特征所述第2报头分析机构，判断所述目标数据的至少一部分，是否与预先保存的属性信息组之一的至少一部分相一致。
另外，本发明中的再生装置的也可构成有如下特征所述属性信息，为所述音频编码信号的采样频率、通道信息、样本位长、音频编码信号的数据长的至少之一。
另外，本发明中的再生装置的也可构成有如下特征所述流分析机构，检测出所述报头信号中包含的表示所述帧的长度的帧长数据，并在接着所述报头信号的一帧的数据与检测出的帧长数据不相等的情况下，丢弃所述帧，进行下一帧的分析。
另外，本发明中的再生装置的也可构成有如下特征所述第1流由多个包构成，所述流分析机构，检测出所述报头信号中包含的表示所述包的长度的包长数据，并在检测出的一个包的长度与检测出的包长数据不相等的情况下，丢弃所述包，进行下一个包的分析。
另外，本发明中的再生装置的也可构成有如下特征在所述第1流中产生不连续的位置上，插入不连续点明示包，并且所述流分析机构，检测出不连续点明示包，在输出给所述解码前缓存的不连续点明示包前的数据量不足预先定义的给定的数据量或者其整数倍时，对所述解码前缓存输出不足部分的补充数据。
另外，本发明中的再生装置的也可构成有如下特征在所述第1流中产生不连续的位置上，插入不连续点明示包，并且所述流分析机构，具备从检测出的报头信号起计数到不连续点明示包为止的计数器，还设有对计数的点中的地址进行计算后保存的地址存储机构，所述控制机构，移动读出指针，以使下个专用报头位于计算出的地址。
另外，本发明中的再生装置的也可构成有如下特征在所述解码前缓存与解码机构之间，设置延迟机构。
另外，本发明中的再生方法，接收上位层的第1流中包含下位层的第2流的数据，其中，上位层的第1流中包含可检测出的报头信号；下位层的第2流的一帧中，包含音频编码信号和由所述音频编码信号的属性信息构成的专用报头、且不包含同步字，并将所述音频编码信号解码来输出声音，其特征在于，具备流分析步骤，其对所述第1流进行分析、检测出所述报头信号，并且以检测出的报头信号为基准，分析所述第2流来输出所述音频编码信号和所述专用报头的位置信息；将从所述流分析步骤中输出的所述音频编码信号和所述专用报头暂时保存的步骤；解码步骤，对所述保存的音频编码信号进行解码并输出声音；第1报头分析步骤，其对第1帧的专用报头中所包含的属性信息进行分析，并检测出表示接在专用报头之后的所述音频编码信号的数据长度的数据长信息；第2报头分析步骤，其对给第1帧的专用报头的位置信息加上检测出的数据长所得到的位置之后给定量的目标数据进行分析，并判断分析出的目标数据是否为第2帧的专用报头中所包含的属性信息；以及，控制步骤，在判断为分析出的目标数据不是包含在第2帧的专用报头中的属性信息的情况下，至少对第1帧的音频编码信号停止来自所述解码步骤的声音输出。
另外，本发明中的再生方法，其特征在于所述第2报头分析步骤，判断所述目标数据的至少一部分，是否与由所述第1报头分析机构分析出的属性信息的至少一部分相一致。
另外，本发明中的再生方法，其特征在于所述第2报头分析步骤，判断所述目标数据的至少一部分，是否与预先保存的属性信息组之一的至少一部分相一致。
另外，本发明中的再生方法，其特征在于所述属性信息，为所述音频编码信号的采样频率、通道信息、样本位长、音频编码信号的数据长的至少之一。
另外，本发明中的再生方法，其特征在于所述流分析步骤，检测出所述报头信号中包含的表示所述帧的长度的帧长数据，并在接着所述报头信号的一帧的数据与检测出的帧长数据不相等的情况下，丢弃所述帧，进行下一帧的分析。
另外，本发明中的再生方法，其特征在于所述第1流由多个包构成，所述流分析步骤，检测出所述报头信号中包含的表示所述包的长度的包长数据，并在检测出的一个包的长度与检测出的包长数据不相等的情况下，丢弃所述包，进行下一个包的分析。
另外，本发明中的再生方法，其特征在于在所述第1流中产生不连续的位置上，插入不连续点明示包，并且所述流分析步骤，检测出不连续点明示包，在所述保存的不连续点明示包前的数据量不足预先定义的给定的数据量或者其整数倍时，对所述解码前缓存输出不足部分的补充数据。
另外，本发明中的再生方法，其特征在于在所述第1流中产生不连续的位置上，插入不连续点明示包，并且所述流分析步骤，从检测出的报头信号起计数到不连续点明示包为止，还设有对计数的点中的地址进行计算后保存的地址存储步骤，所述控制步骤，移动读出指针，以使下个专用报头位于计算出的地址。
另外，本发明中的再生方法，其特征在于在所述进行保存的步骤与解码步骤之间，设置延迟音频编码信号的延迟步骤。
另外，本发明为用于由计算机实行上述再生方法的程序。
另外，本发明是记录有用于由计算机实行上述再生方法的程序的、计算机可读取的记录媒体。
本发明中所述的再生装置，在对基本流中不存在同步字或CRC位的音频流实施解码时，即使存在因编辑产生的不连续点或因传送路径的错误引起的数据的丢失，也能够不产生异音地输出声音。

图1是表示本发明的第1实施方式中的音频再生装置的结构的框图。
图2A是表示本发明的第1实施方式中的音频的再生方法的流程图。
图2B是表示本发明的第1实施方式中的音频的再生方法的流程图。
图3是表示基于MPEG格式的流的结构的图。
图4是表示被以传输流包单位编辑的流的结构的图。
图5A是表示本发明的第1实施方式中的音频再生装置的结构的框图。
图5B是表示本发明的第1实施方式中的音频再生装置的结构的框图。
图6是表示本发明的第2实施方式中的音频再生装置的结构的框图。
图7A是表示本发明的第2实施方式中的音频的再生方法的流程图。
图7B是表示本发明的第2实施方式中的音频的再生方法的流程图。
图8是表示本发明的第3实施方式中的音频再生装置的结构的框图。
图9A是表示本发明的第3实施方式中的音频的再生方法的流程图。
图9B是表示本发明的第3实施方式中的音频的再生方法的流程图。
具体实施例方式
下面，采用图1、图2A、图2B、图3、图4、图5A、图5B，对本发明的第1实施方式进行说明。
图1是表示本实施方式的再生装置101的框图。另外，图2A、图2B是表示本实施方式的再生方法的各步骤的流程图。另外，图3是表示输入的流的结构的图，表示MPEG格式中的传输流(transport stream)和PES包、以及通过本发明期望实现防止产生异音效果的基本流的结构。图4是表示图3所说明的传输流被以传输包为单位进行编辑、且包含不完整的PES包的情况的图。
首先，简单地说明在发送侧生成传输流301的过程。音频信号，通过给定的编码技术变换为音频编码信号308，以每给定的字节数切断(每960字节或每1440字节)，并给切断片的前端付与4字节的专用报头307。设该音频编码信号，为未被压缩处理的PCM数据。被切断的各个音频编码信号308，包含长度约5msec的音频信号。专用报头307，包含音频编码信号308的属性信息，且不具有同步字。专用报头307和接着它的音频编码信号308共同构成一帧音频，将连续送来这种帧的流称作基本流306。属性信息，包含例如采样频率、通道分配、样本的位长、音频编码信号308的数据长的信息。只要属性(采样频率、通道分配信息、样本的位长、音频编码信号308的数据长)不变，这些属性信息就不变。因此，只要属性信息不变，第n(n为正整数)帧的专用报头307与第(n+1)帧的专用报头307就相同。通常，属性信息几乎不变。在广播系统改变的情况下，或者记录于光盘中的音轨改变的情况下，可能会改变。另外，在属性信息中，有的改变频度少(包含零)、有的多。即使在改变的情况下，也变为预先决定的多个选项的一个。例如，音频编码信号308的数据长变为作为预先决定的选项的、960字节或1440字节之一。
如上所述生成的基本流306，被一帧帧分开，作为964字节或者1444字节长的PES净荷(payload)305使用。给各PES净荷305添加PES报头304，生成一个PES包303。PES包303，被以每给定长度(例如每188字节长或每184字节长)切断，切断片被作为一个音频传输包302使用。音频传输包302，与视频传输包等其他的传输包混合连结，生成传输流301。传输流301，被从广播站广播。接收器，接收传输流301，并用音频再生装置101进行声音的再生。接收的传输流301，可直接发送给音频再生装置101，也可暂时记录在某处、将记录的传输流301发送给音频再生装置101。作为后者的情况，存在为了再生由记录再生装置以传输流的形式记录的声音、发送给再生装置101的情况，或者为了再生以传输流的形式记录于盘片(例如DVD)中的商业内容、发送给再生装置101的情况。
由以上可知，本发明中处理一种结构如下的数据1帧中包含音频编码信号和由音频编码信号的属性信息构成的专用报头、但不包含同步字的下位层的第2流(基本流)，包含在包含可检测出的报头信号(PES报头)的上位层的第1流(由PES包构成的流)中。
接收的流，在不连续检测部100中，对流中的包或者包的一部分中是否存在不连续、即数据的一部分是否丢失进行检测，如果检测出不连续，则插入不连续点明示包401。
音频再生装置101，是输入包含音频的传输包302的传输流301，并解码、输出声音信号的装置。输入给再生装置101的传输流301，被输入给流分析机构102(S201)。流分析机构102，分析传输流301，并抽出音频的传输包302来构成音频PES包303，再分析音频PES包303(S202)。
如图3所示，流分析机构102，只提取传输包内的音频传输包302，并生成PES包303的流。PES报头304中包含PES净荷305的数据长。如果流分析机构102检测出PES报头304，则紧接着PES报头之后，即从PES净荷的前端起开始计数，若发现下个包(PES包或后文中说明的不连续点明示包)则结束计数。如果数据中不存在不连续，则计数值与PES净荷305的数据长相等。将计数值与PES报头中包含的数据长相比较，判断计数值与预先定义的正常值是否一致(S203)。不一致的情况下，即上述值异常的情况(S203中异常)下，丢弃当前正在分析的PES包，转至下个PES包的分析。上述PES净荷的数据长，是指用预定规格定义的多种长度的任意一个，例如为964字节、1444字节之一。
另一方面，在上述值为正常的情况(S203中正常)下，从PES净荷305中提取专用报头307以及音频编码信号308，并存放到解码前缓存103中(S204)。这里，PES净荷305也称作音频的基本流306。另外，专用报头307包含音频编码信号308的属性信息，且不具有同步字。专用报头307的检测，例如从检测出PES报头304起延迟给定时间来实施。虽然图3所示的例子中表示的是，专用报头307紧接着PES报头304后的情况，但专用报头307，也可配置在位于从PES报头304的末端起给定量之后的位置上。在这种情况下，也可令EPS报头中具有给定量的信息。
由以上可知，流分析机构102的目的在于对作为第1流的包含PES包的流进行分析，检测出报头信号即PES报头，并且以检测出的报头信号为基准，对作为第2流的基本流进行分析，来输出上述音频编码信号和上述专用报头的位置信息。
在此，虽然输入给音频再生装置101的是传输流301，但并不限于此，也可输入音频PES包303。这种情况下，流分析机构102，也将位于基本流306处的专用报头307和音频编码信号308存放到解码前缓存103中。再有，在图2A中，为了便于观察流程，用一个步骤S202表示传输流301的分析和PES包303的分析。
从解码前缓存103输出的音频编码信号308，被输入给第1报头分析机构105、第2报头分析机构106、帧延迟机构111。帧延迟机构111，使送来的音频编码信号308延迟至少一帧，并发送给解码机构104。
第1报头分析机构105，检测出并读取存放在解码前缓存103中的第1帧的专用报头307，并对专用报头307中所包含的信息进行分析后输出给控制机构107(S205)。专用报头307的检测，例如在用流分析机构102检测出的PES报头304的时刻起、给定时间后的时刻进行。专用报头307中所包含的信息，是音频编码信号的属性信息，例如采样频率、通道分配信息、样本的位长、音频编码信号308的数据长。属性信息的一部分或者全部，被输出给控制机构107。
第1报头分析机构105，检测出第n个专用报头307(4字节)，并将检测出的第n个专用报头307发送给控制机构107。控制机构107，将第n个专用报头307的信息(采样频率、通道分配信息、样本的位长、音频编码信号308的数据长)的全部或者一部分，存储在专用报头存储器110中。再有，第1报头分析机构105，从检测出的第n个专用报头307的前端起，计数相当于1帧的时间Tf，并将触发(trigger)信号发送给第2报头分析机构106。再有，代替一个帧，也可计数m个(m是比1大的正整数)帧来输出触发信号。时间Tf，通过将专用报头长(4字节)与作为属性信息之一的音频编码信号308的数据长相加求得。这里的计数，也可从专用报头307的末端起对音频编码信号308的数据长进行计数。
由以上可知，第1报头分析机构105的目的在于对第1帧的专用报头中所包含的属性信息进行分析，并对表示接着专用报头之后的音频编码信号的数据长度的数据长信息进行检测。
第2报头分析机构106，响应触发信号，读取从解码前缓存103中输出的基本流的一部分的数据(4字节)、即目标数据。如果音频编码信号中不存在不连续，则读取的目标数据相当于第(n+1)的专用报头。如果第n个帧数据中存在不连续，由于读取的目标数据不是第(n+1)个专用报头，因此无法正确读出第(n+1)个专用报头。
第2报头分析机构106，对已读取的4字节的目标数据与存储在专用报头存储器110中的专用报头进行比较，如果相同，则判断第(n+1)个专用报头存在于正确的位置上，即判断为第n帧与正确的帧相同。基于该判断，控制机构107实施声音的解码。
但是，如果目标数据与存放在专用报头存储器110中的专用报头不一致，则第2报头分析机构106判断为第(n+1)个专用报头没有存在于正确的位置，并在该情况下，判断为音频编码信号中存在不连续、丢失了声音数据。在这种情况下，控制机构107对解码机构104输出静音信号，从而对接着第n个专用报头的音频编码信号实施静音。由于设置了帧延迟机构111，因此输出静音信号的时刻，处于即将由解码机构104对接着第n个专用报头的音频编码信号实施声音输出之前。从而，解码机构104，对接着第n个专用报头的音频编码信号实施静音，指示停止声音输出。静音信号，为对一帧期间实施静音的信号。从而，从接着第(n+1)个专用报头的音频编码信号起实施声音的再生输出。
由以上可知，第2报头分析机构106的目的在于对位于给第1帧的专用报头的位置信息上加上被检测出的数据长得到的位置之后的给定量的目标数据进行分析，并判断分析的目标数据是否为第2帧的专用报头中所包含的属性信息。
再有，目标数据是否为第2帧的专用报头中所包含的属性信息的判断，也可按照判断目标数据的至少一部分是否与第1报头分析机构105所分析的属性信息的至少一部分一致的方式来进行。
这里，静音信号，也可是对多帧期间、例如两帧期间实施静音的信号。如果是对两帧期间实施静音的信号，则对接着第(n+1)个专用报头的音频编码信号实施静音，并指示停止声音输出，从接着第(n+2)个专用报头的音频编码信号起实施声音的再生输出。另外，专用报头存储器110，也可设置于第1报头分析机构105中。
当然，也可由控制机构107实施地址的计算，来代替第1报头分析机构105。
第2报头分析机构106，与第1报头分析机构105同样，对专用报头307进行分析，将其中包含的信息输出给控制机构107(S207)。第2报头分析机构106与第1报头分析机构105不同点在于通过来自第1报头进行机构105的触发信号实施数据的读取这点，和对与第1报头分析机构105所分析的专用报头相比更后的时刻的帧、例如下一帧的专用报头进行分析这点。即，对由后文所述的解码机构104解码的当前帧的下面一帧的专用报头进行分析。
解码机构104，是读出从解码前缓存103中输出、且被延迟一定时间的音频编码信号308，并输出声音的机构(S209)。解码机构104，接受由控制机构107作出的解码的开始或停止、或者静音处理等与声音输出相关的控制。
控制机构107，通过第1报头分析机构105及第2报头分析机构106，分别获取当前帧以及下一帧的专用报头中所包含的信息，并将这些信息相互比较(S208)，如果存在差异，则对解码机构104指示静音(S210)。
还有，本实施方式中的再生装置及再生方法，在输出第1帧的音频信号后，判定解码前缓存中是否积存了比音频编码信号的一帧足够多的给定量的数据以便进行下一帧的解码(S211)。如果已积存，则返回到由第1报头分析机构105执行的第1帧的属性信息的分析(S205)的处理，继续解码。在解码前缓存中没有积存给定量的数据的情况下，从外部输入流(S201)，并实施由上述流分析机构102执行的流分析(S202)以后的处理。
下面，参照图4，对以传输包为单位编辑传输流301的情况进行说明。在音频再生装置101中输入的传输流因编辑等产生不连续的情况下，在不连续检测部100中，在检测出不连续点的位置上插入不连续点明示包401。流分析机构102如上述那样对输入的流进行分析(S202)，将音频的基本流存放在解码前缓存103中(S204)。这里，如果存在不连续点明示包401，则从流中提取的音频编码信号会成为数据的后半部分丢失的不完整的音频编码信号403。第1报头分析机构105，将第1报头分析机构105中所包含的原来的音频编码信号的数据长，加在当前专用报头的末端位置的地址上，算出地址B(407)(S206)。由于存在不完整的音频编码信号403，因此该地址B，成为比作为实际的下个专用报头的地址的地址A(406)向前推进的点。第1报头分析机构105，在地址B的时刻生成触发信号。第2报头分析机构106，响应触发信号，从地址B的时刻起读取给定量(4字节)的数据，并预测为下个专用报头，进行专用报头分析的处理(S207)。由于从地址B起给定量中存放的是音频编码信号的一部分、或者专用报头的一部分和音频编码信号的一部分的数据，因此无法进行正确的分析。从而，第2报头分析机构106的分析结果的信息，与由第1报头分析机构105取得、且被专用报头存储器110保管的属性信息不一致，生成不一致信息。如果音频编码信号为PCM数据，虽然也存在偶然与第1帧的专用报头一致的可能性，但这种可能性非常低。
根据生成的不一致信息，在从解码机构104输出声音前，对与当前专用报头404关联的当前帧实施静音(S210)。从而，对不完整的音频编码信号403不进行解码以及输出，且如果必要，对接着它的下一帧的音频编码信号也不进行解码以及输出，因而可以防止异音的产生。
再有，关于控制机构107中的其他判别方法，用图5A、图5B进行说明。专用报头存储器110，不是对检测出的专用报头中所包含的属性信息(采样频率、通道分配信息、样本的位长、音频编码信号308的数据长)进行存储，而是预先存储包含变形的可选属性信息组的全部。即、专用报头存储器110，例如记录下表1的信息。
表1

实际上，在专用报头中包含的信息，是来自a列的一个信息、来自b列的一个信息、来自c列的一个信息、来自d列的一个信息，例如包含(a2，b1，c1，d2)的信息。
控制机构107，对由当前专用报头检测出的属性信息、和在专用报头存储器110中预先保存的属性信息组(表1的数据)进行比较，判定存储器110中是否包含与检测出的属性信息一致的信息(S507)。即、如果检测出的全部属性信息(a2，b1，c1，d2)包含于被保存在存储器110中的属性信息组中，则判断为为全部正常的信息；另一方面，如果检测出的属性信息(xx、b1、c1、d2)(这里，xx表示不能分析的信息)的任一个，不包含于被保存在存储器110中的属性信息组中，则判断专用报头为不正确的信息。
接着，对位于从当前专用报头的末端起音频编码信号308的数据长之后的4字节的目标数据、即从应存在下个专用报头的位置中检测出的属性信息，和被预先保存的属性信息进行比较，并进行与上述相同的判定(S508)。在两个检测出的属性信息，均包含与预先保存的属性信息相一致的信息的情况下，再生音频(S509)；另一方面，在两个检测出的属性信息的任意一方中，包含与被预先保存的属性信息不相一致的信息的情况下，对解码机构104指示静音(S510)。再有，在图5A中为了便于观察流程，虽然省略了用图2A说明的PES净荷长度是否为正常的判断步骤(S203)，但当然也可在流分析(S502)之后进行相同的判定。另外，由于是否应当实施静音，也可判断下个专用报头是否是否位于正确的位置上来决定，因此也可省略判定步骤S507，只对下个专用报头检测出属性信息，并判定是否包含与预先被保存的属性信息相一致的信息(S508)。对当前专用报头进行检测、分析，是为了获取用于计数到下个专用报头的起点、和到下个报头为止的间隔。另外，对下个专用报头进行分析，是为了对作为下个专用报头检测出的数据是否为正常专用报头进行判断。
由以上可知，虽然第2报头分析机构，是对目标数据是否为包含于第2帧的专用报头的属性信息进行判断，但该判断，也以是判断上述目标数据的至少一部分是否与预先被保存的属性信息组的任一个的至少一部分相一致。
如果将表1中所示的属性信息组预先保存，则能够避免属性信息在允许的范围内变更时被判断为错误的属性信息。
再有，一般来说，由于被帧化的音频流的专用报头307，包含其后接着的音频编码信号308的属性信息，因此在流的最终帧中，可能不存在应当由第2报头分析机构分析的数据。
在这种情况下，流分析机构102在流的末端上付加预先定义的特定的虚拟数据、例如表1的代表性的属性信息的组合(a1、b1、c1、d1)。如果由第2报头分析机构106取得的下一帧的属性信息全都与上述预先定义的位列一致，则控制机构107可不对解码机构104下达静音的指示。该动作是有效的控制，在输入的流的末端中，第2报头分析机构106要分析的地址中不存在数据，解码机构从解码前缓存103中读出数据时发生下溢的情况下，能够避免第2报头分析机构106不能取得任何信息。即、流分析机构102，通过付加由预先定义的正常的属性信息构成的专用报头，可避免下溢，并对最终帧进行解码处理后输出。预先定义的属性信息，是指例如采样频率只为48kHz；另外，样本的位长为16位、20位或者24位之一；另外，通道分配信息为单声道、立体声或双声道之一；另外，音频编码信号的数据长为960字节或者1440字节之一的属性信息。另外，付加于末端的特定的位列，可定义为与表示以上的属性信息的位列不同。另外，付加于末端的特定位列，也可由上述预先定义的正常的属性信息构成。
根据上述，本实施方式中，即使在作为第1帧的专用报头和第2帧的专用报头之间的数据的第1帧的音频编码信号的一部分，因流的传送错误等而丢失的情况下，也可通过对第1帧的音频编码信号实施静音，来防止异音的产生。
接下来，用图6以及图7A、图7B，对本发明的第2实施方式进行说明。
第2实施方式与第1实施方式的不同点在于，具备包长计数机构608。包长计数机构608，逐次计数存放在解码前缓存103中的数据量(S705)，在计数的PES净荷的数据量不满第1给定长度的情况(S706否)下，返回到流输入(S701)的步骤。第2实施方式中，在传输流TS以及PES报头的分析(S702)后，判断是否存在不连续点明示包(S703)。在存在不连续点明示包的情况下(S703是)，判定往解码前缓存103的基本流的存储量是否为第2给定长度的整数倍(S707)。在不为整数倍的情况下，将特定长度的补充数据存放到解码前缓存中使其成为整数倍(S708)，并将包长计数机构复位(S716)，返回到流输入步骤(701)。在不存在不连续点明示包的情况下(S703否)，实施往解码前缓存103的基本流的存储(S704)，包长计数机构608，对存储的数据量进行计数(S705)。
包长计数机构608，对PES净荷长度进行计数(S705)。PES净荷长度，是指从流分析机构102检测出音频的PES包的报头(以下，称作PES报头)(S702)、到检测出下个PES报头为止，存放在解码前缓存103中的数据量。
流分析机构102，在传输流TS或PES报头的分析中检测出不连续点明示包(S703的是)，在该时刻判定去往解码前缓存103的数据存储量是否为第2给定长度的整数倍(S707)。在上述判定(S707)为否的情况下，将补充数据存放到解码前缓存中，以使去往解码前缓存103的数据存储量为第2给定长度的整数倍(S708)。接着，包长计数机构608的计数被复位(S716)，返回到流输入(S701)的处理。另外，往流输入(S701)返回处理时，将解码前缓存103中的、第1报头分析机构105的读出地址，往存储了上述补充数据的地址的下一个地址、即存储不连续点明示包后的数据的前端的地址移动。
这里，预先定义的第1给定长度，是指例如由4字节的第1专用报头、960字节或者1440字节的音频编码信号、和4字节的第2专用报头构成的数据量，即，为968字节或者1448字节。
另外，第2给定长度是，是指在第1报头分析机构105、第2报头分析机构106以及解码机构104读出存放在解码前缓存103中的数据时，能够访问的数据的最小单位(通称字)，例如4字节。
从解码前缓存103中输出的基本流，与上述同样，被由第1报头分析机构105分析(S709)，并算出第2报头的位置(S710)，对位于第2报头的位置中的目标数据(被预测为第2报头的数据)进行分析(S711)。对分析出的目标数据的内容，与第1报头的内容进行比较，执行是否相一致的判断(S712)。如果相同，判断为目标数据的内容为正常的第2报头，并执行音频再生(S713)。若第2报头的内容中，即使一处位置与第1报头的内容不同，则判断为目标数据的内容不为正常的第2报头，即第2报头的位置位于偏离了算出位置的位置，与第1实施方式相同，对接在第1报头后的音频编码信号执行静音处理(S714)。之后，判断解码前缓存103中是否存储有给定量(第1给定长度以上)的数据(S715)，如果存储有，则返回到步骤S709，如果没有存储则返回到步骤S701。
虽然步骤S712中的判断，将分析的目标数据的内容和被分析的第1报头的内容进行比较，并执行是否相一致的判断，但也可将分析的目标数据的内容和预先保存的表1的内容进行比较。
由此，由于在流被以传输包为单位编辑的情况下，后半部分数据丢失的PES净荷、即不完整的音频的专用报头以及音频编码信号也没有被解码，因此能够防止编辑点前的不完整的音频编码信号以及接着它的数据被输入给解码机构104而产生异音。
再有，虽然若不完整的音频编码信号没被解码机构104解码，则由第2报头分析机构106实施的下一帧的报头分析(S711)以及控制机构107中的下一帧的属性信息的确认(S712)没有必要，但实际上，为了在检测出流分析机构102和解码前缓存103之间的数据传送中的数据的丢失、或者因其他的因素使原本异常的音频编码信号被以正确的包长PES化后输入之类的情况下也能防止异音的产生，安装第2报头分析机构106。
另外，作为第2实施方式中的流分析机构102的另一控制，在由包长计数机构608计数的包长不为特定的数据长的整数倍的情况下(S707的否)，流分析机构102通过付加不足部分的数据使其成为特定数据长的整数倍(S708)来实施字调整(word alignment)，将其存放在解码前缓存103中。一般来说，在解码机构104、第1报头分析机构105以及第2报头分析机构106从解码前缓存103中读出数据时，以预先决定的字单位来读出。例如以4字节为一个字来读出数据。
在实施传输包单位的编辑的情况下，一般来说，编辑点的地址不为4字节单位，编辑点后的帧没有随后实施字调整，直接存放在解码前缓存中。在这种情况下，第1报头分析机构105以及第2报头分析机构106所读出的编辑点后的专用报头附近的数据会偏移1至3个字节，控制机构107无法取得正确的属性信息。其原因在于，由于在本实施方式中，作为对象的基本流中不存在同步字，因此第1报头分析机构105或者第2报头分析机构106不能检测出这1到3字节的数据偏移来修正读出位置。因此，通过在流分析机构102将数据存储在解码前缓存103中时存储补充数据(S708)，从而能够实施编辑点后的解码以及声音输出。
图7A、图7B对以上处理进行归总，首先，在PES包分析中检测出不连续点明示包401的情况下，处理返回到PES包分析步骤(S702)。另外，在向解码前缓存存储的PES包的数据量与第1给定的长度、即基本流306的1帧长的整数倍不一致的情况下(S706的否)，返回到流输入步骤(S701)。另外，在解码前缓存中存储的数据量与第2给定长度的整数倍不一致的情况(S707的否)下，将补充数据存放到解码前缓存中(S708)，对用于对解码前缓存中存储的数据进行访问的指针进行字调整。
如上所述，根据本发明，可用流分析机构检测出流的不连续点，防止产生异音。另外，通过在不连续点中执行字调整，可实施不连续点后的解码以及音频的再生。
再有，虽然图7A中为了便于观察流程，省略了用图2A说明的PES净荷长度是否为正常的判定(S203)，但当然也可在流分析(S702)之后实施同样的判定。
接下来，对本发明的第3实施方式，用图8、图9A、图9B以及图4进行说明。在第3实施方式中，对实现编辑点后声音输出的恢复的例子进行说明。
第3实施方式与第1实施方式或者第2实施方式不同的地方在于，流分析机构102具备存储解码前缓存103中存放的专用报头的地址(S904)的地址存储机构808(图8)。
输入流(S901)，实施传输流TS以及PES报头的分析(S902)。实施PES报头的分析，并在下个PES报头的检测中，对是否为不连续点明示包401进行判断(S903)。在发现不连续点明示包401的情况下，前进到步骤S904；另一方面，在没有发现不连续点明示包401、发现了下个PES报头的情况下(或者，从前一个PES报头起完成给定量的计数的情况)，前进到步骤S905。步骤S905中，将基本流存储到解码前缓存103中。
这里，用图4对步骤S903、S904进行说明。步骤S903中，流分析机构102对PES报头进行检测、分析。设置于流分析机构102中的计数器，从PES报头的末端起开始计数，并计数到发现下一个包(在数据中产生不连续的情况下，为不连续点明示包；在数据中没有产生不连续的情况下，为下一个PES包)为止。也可在分析PES报头时，对接着PES报头的PES净荷的数据长进行检测，并对其数据长进行计数。然后，计算出计数结束点的地址A。将该地址A存储在地址存储机构808中(S904)。即，编辑点后的前端的专用报头的前端地址，被存储在地址存储机构808中。
从解码前缓存103中输出的基本流，与上述同样，由第1报头分析机构105分析(S906)，并计算出第2报头的位置(S907)，对位于第2报头的位置的目标数据(被预测为第2报头的数据)进行分析(S908)。将分析出的目标数据的内容，与第1报头的内容进行比较，并判断是否一致(S909)。如果相同，则判断目标数据的内容为正常的第2报头，实施音频再生(S910)。如果第2报头的内容中，即使一处位置与第1报头的内容不同，也判断为目标数据的内容不为正常的第2报头、即第2报头的位置位于偏离算出位置的位置，与第1实施方式相同，对接着第1报头后的音频编码信号实施静音处理(S911)。再有，移动数据读出指针，以使下一个专用报头405的前端位于存储在上述地址存储机构808中的地址A(S912)，并继续解码处理。即，从地址存储机构808中读出地址A，并将第1报头分析机构105以及解码机构104的读出指针，分别往下个报头以及帧前端地址移动(S912)。通过该数据读出指针的移动，将下个专用报头405作为上述的当前专用报头404、并将再下个专用报头作为下个专用报头来进行处理。
此后，判断解码前缓冲103中是否存储了给定量(第1给定长度以上)的数据(S913)，如果已存储，则返回到步骤S906，如果没有存储则返回到步骤S901。
虽然步骤S909的判断，对分析出的目标数据的内容、与分析出的第1报头的内容进行比较，并判断是否一致，但也可对分析出的目标数据的内容、与预先保存的表1的内容进行比较。
由以上可知，流分析机构102，具备计数器，从检测到的报头信号起到不连续点明示包为止进行计数；还设有对计数的点中的地址A计算后保存的地址存储机构808。上述控制机构107，移动读出指针，以使下个专用报头位于计算出的地址A。
再有，虽然图9A中为了便于观察流程，省略了用图2A说明的PES净荷长度是否为正常的判定(S203)，但当然也可在流分析(S902)之后进行同样的判定。
根据上述，在本实施方式中，能够对因编辑等产生的不连续点后的声音实施解码以及输出。
还有，虽然以上的实施方式，是作为对音频的再生装置及其处理进行说明的步骤来进行说明，但当然也可以将它们作为计算机程序的一部分或者其他装置的一部分的功能来进行说明。
另外，通过将用计算机的程序实现的本发明存储在磁盘或CD-ROM等的记录媒体中，能够由计算机系统方便地实施。
工业上的可利用性本发明，可应用到再生装置、再生方法之中。
权利要求
1.一种再生装置，接收上位层的第1流中包含下位层的第2流的数据，其中，上位层的第1流中包含可检测出的报头信号；下位层的第2流的一帧中，包含音频编码信号和由所述音频编码信号的属性信息构成的专用报头、且不包含同步字，并将所述音频编码信号解码来输出声音，其特征在于，具备流分析机构，其对所述第1流进行分析、检测出所述报头信号，并且以检测出的报头信号为基准，分析所述第2流来输出所述音频编码信号和所述专用报头的位置信息；解码前缓存，其暂时保存从所述流分析机构中输出的所述音频编码信号和所述专用报头；解码机构，其对从所述解码前缓存中获取的所述音频编码信号进行解码并输出声音；第1报头分析机构，其对第1帧的专用报头中所包含的属性信息进行分析，并检测出表示接在专用报头之后的所述音频编码信号的数据长度的数据长信息；第2报头分析机构，其对给第1帧的专用报头的位置信息加上检测出的数据长所得到的位置之后给定量的目标数据进行分析，并判断分析出的目标数据是否为第2帧的专用报头中所包含的属性信息；以及，控制机构，在判断为分析出的目标数据不是包含在第2帧的专用报头中的属性信息的情况下，至少对第1帧的音频编码信号停止来自所述解码机构的声音输出。
2.根据权利要求1所述的再生装置，其特征在于，所述第2报头分析机构，判断所述目标数据的至少一部分，是否与由所述第1报头分析机构分析出的属性信息的至少一部分相一致。
3.根据权利要求1所述的再生装置，其特征在于，所述第2报头分析机构，判断所述目标数据的至少一部分，是否与预先保存的属性信息组之一的至少一部分相一致。
4.根据权利要求1所述的再生装置，其特征在于，所述属性信息，为所述音频编码信号的采样频率、通道信息、样本位长、音频编码信号的数据长的至少之一。
5.根据权利要求1所述的再生装置，其特征在于，所述流分析机构，检测出所述报头信号中包含的表示所述帧的长度的帧长数据，并在接着所述报头信号的一帧的数据与检测出的帧长数据不相等的情况下，丢弃所述帧，进行下一帧的分析。
6.根据权利要求1所述的再生装置，其特征在于，所述第1流由多个包构成，所述流分析机构，检测出所述报头信号中包含的表示所述包的长度的包长数据，并在检测出的一个包的长度与检测出的包长数据不相等的情况下，丢弃所述包，进行下一个包的分析。
7.根据权利要求6所述的音频再生装置，其特征在于，在所述第1流中产生不连续的位置上，插入不连续点明示包，并且所述流分析机构，检测出不连续点明示包，在输出给所述解码前缓存的不连续点明示包前的数据量不足预先定义的给定的数据量或者其整数倍时，对所述解码前缓存输出不足部分的补充数据。
8.根据权利要求1所述的再生装置，其特征在于，在所述第1流中产生不连续的位置上，插入不连续点明示包，并且所述流分析机构，具备从检测出的报头信号起计数到不连续点明示包为止的计数器，还设有对计数的点中的地址进行计算后保存的地址存储机构，所述控制机构，移动读出指针，以使下个专用报头位于计算出的地址。
9.根据权利要求1所述的再生装置，其特征在于，在所述解码前缓存与解码机构之间，设置延迟机构。
10.一种再生方法，接收上位层的第1流中包含下位层的第2流的数据，其中，上位层的第1流中包含可检测出的报头信号；下位层的第2流的一帧中，包含音频编码信号和由所述音频编码信号的属性信息构成的专用报头、且不包含同步字，并将所述音频编码信号解码来输出声音，其特征在于，具备流分析步骤，其对所述第1流进行分析、检测出所述报头信号，并且以检测出的报头信号为基准，分析所述第2流来输出所述音频编码信号和所述专用报头的位置信息；将从所述流分析步骤中输出的所述音频编码信号和所述专用报头暂时保存的步骤；解码步骤，对所述保存的音频编码信号进行解码并输出声音；第1报头分析步骤，其对第1帧的专用报头中所包含的属性信息进行分析，并检测出表示接在专用报头之后的所述音频编码信号的数据长度的数据长信息；第2报头分析步骤，其对给第1帧的专用报头的位置信息加上检测出的数据长所得到的位置之后给定量的目标数据进行分析，并判断分析出的目标数据是否为第2帧的专用报头中所包含的属性信息；以及，控制步骤，在判断为分析出的目标数据不是包含在第2帧的专用报头中的属性信息的情况下，至少对第1帧的音频编码信号停止来自所述解码步骤的声音输出。
11.根据权利要求10所述的再生方法，其特征在于，所述第2报头分析步骤，判断所述目标数据的至少一部分，是否与由所述第1报头分析机构分析出的属性信息的至少一部分相一致。
12.根据权利要求10所述的再生方法，其特征在于，所述第2报头分析步骤，判断所述目标数据的至少一部分，是否与预先保存的属性信息组之一的至少一部分相一致。
13.根据权利要求10所述的再生方法，其特征在于，所述属性信息，为所述音频编码信号的采样频率、通道信息、样本位长、音频编码信号的数据长的至少之一。
14.根据权利要求10所述的再生方法，其特征在于，所述流分析步骤，检测出所述报头信号中包含的表示所述帧的长度的帧长数据，并在接着所述报头信号的一帧的数据与检测出的帧长数据不相等的情况下，丢弃所述帧，进行下一帧的分析。
15.根据权利要求10中所述的再生方法，其特征在于，所述第1流由多个包构成，所述流分析步骤，检测出所述报头信号中包含的表示所述包的长度的包长数据，并在检测出的一个包的长度与检测出的包长数据不相等的情况下，丢弃所述包，进行下一个包的分析。
16.根据权利要求15中所述的音频再生方法，其特征在于，在所述第1流中产生不连续的位置上，插入不连续点明示包，并且所述流分析步骤，检测出不连续点明示包，在所述保存的不连续点明示包前的数据量不足预先定义的给定的数据量或者其整数倍时，对所述解码前缓存输出不足部分的补充数据。
17.根据权利要求10中所述的再生方法，其特征在于，在所述第1流中产生不连续的位置上，插入不连续点明示包，并且所述流分析步骤，从检测出的报头信号起计数到不连续点明示包为止，还设有对计数的点中的地址进行计算后保存的地址存储步骤，所述控制步骤，移动读出指针，以使下个专用报头位于计算出的地址。
18.根据权利要求10中所述的再生方法，其特征在于，在所述进行保存的步骤与解码步骤之间，设置延迟音频编码信号的延迟步骤。
全文摘要
在基本流中，对不存在同步字或CRC的音频流进行解码时，防止异音的产生。在对当前帧进行解码时，对下一帧的专用报头进行分析，如果下一帧的专用报头异常，则对当前帧实施静音。另外，在因编辑产生的不连续点中，从由流分析机构通知的下一帧的前端地址起恢复解码。
文档编号G10L21/02GK1757059SQ200480005519
公开日2006年4月5日申请日期2004年2月26日优先权日2003年2月28日
发明者片山大朗, 则竹俊哉, 藤本和生申请人:松下电器产业株式会社

本文推荐再生装置及再生方法仅代表作者观点，不代表本网站立场。本站对作者上传的所有内容将尽可能审核来源及出处，但对内容不作任何保证或承诺。请读者仅作参考并自行核实其真实性及合法性。如您发现图文视频内容来源标注有误或侵犯了您的权益请告知，本站将及时予以修改或删除。未经允许不得转载：http://www.pinpai35.com/1656518052.html

当前位置：网站首页>专利 >正文

再生装置及再生方法

相关推荐