-
公开(公告)号:CN102915728B
公开(公告)日:2014-08-27
申请号:CN201110217652.7
申请日:2011-08-01
Applicant: 佳能株式会社
Abstract: 本发明提供一种声音分段设备和方法以及说话者识别系统。该声音分段方法包括多级分段步骤,所述多级分段步骤包括当前声音段分段步骤。所述当前声音段分段步骤包括:确定步骤,确定当前声音段关于分割分数序列是否满足规定条件,所述分割分数序列指示每个候选分割点的信息熵;以及分割步骤,如果确定所述当前声音段满足所述规定条件,则将所述当前声音段分割为至少两个下一级声音段。通过将通过所述分割步骤获得的所述下一级声音段中的每一个作为所述下一级中的当前声音段,以迭代方式执行所述当前声音段分段步骤,直到每一级中的未被分割的声音段都不满足所述规定条件为止。得益于本发明,不必设置固定的观察窗并且可以降低计算量。
-
公开(公告)号:CN103295583A
公开(公告)日:2013-09-11
申请号:CN201210043905.8
申请日:2012-02-24
Applicant: 佳能株式会社
Abstract: 本发明涉及一种用于提取声音的子带能量特征的方法和设备。这种用于提取声音的子带能量特征的方法,包括以下步骤:针对作为目标声音事件的训练数据而输入的声音信号,分离出多个滤波组;对于分离出的所有滤波组中的每一个计算滤波组能量;计算所述滤波组能量的统计信息;通过对所述滤波组能量的统计信息进行聚类,把分离出的所有滤波组分组到子带中,其中在所述聚类结束后所述统计信息属于同一类的滤波组被分组到同一子带中;以及基于所述分组的结果,计算子带能量特征。
-
公开(公告)号:CN103165127B
公开(公告)日:2015-07-22
申请号:CN201110418846.3
申请日:2011-12-15
Applicant: 佳能株式会社
Abstract: 本发明提供一种声音分段设备和方法以及声音检测系统。所述声音分段方法包括:非静音检测步骤,从声音序列中检测非静音声音段;特征提取步骤,从所述非静音声音段中提取特征序列;第一检测步骤,如果特征序列的处理窗中的点集满足规定条件,则将该处理窗确定为候选区域;第二检测步骤,在所述候选区域内检测分割点;以及第一处理窗调整步骤,如果在所述第一检测步骤中所述处理窗中的点集不满足所述规定条件或者如果在所述第二检测步骤中没有检测到分割点,则调整所述处理窗,其中,对于在第一处理窗调整步骤中经调整的处理窗,再次执行所述第一检测步骤和第二检测步骤。得益于本发明,可以获得好的性能而无需大的计算量。
-
公开(公告)号:CN103366738B
公开(公告)日:2016-08-03
申请号:CN201210093171.4
申请日:2012-04-01
Applicant: 佳能株式会社
Abstract: 本公开涉及生成声音分类器和检测异常声音的方法和设备及监视系统。声音分类器包括至少一个分类器级。对于生成每个分类器级,声音分类器生成方法包括以下步骤:基于输入的声音样本生成正常声音模型;基于输入的声音样本和正常声音模型计算第一阈值,其中输入的声音样本根据正常声音模型和第一阈值被切分成第一正常声音样本和第一异常声音样本;基于特定的异常声音样本和第一异常声音样本生成异常声音模型;和基于第一正常声音样本和异常声音模型计算第二阈值,其中第一正常声音样本根据异常声音模型和第二阈值被切分成第二正常声音样本和第二异常声音样本;其中,该分类器级包括正常声音模型、第一阈值、异常声音模型和第二阈值。
-
公开(公告)号:CN103295583B
公开(公告)日:2015-09-30
申请号:CN201210043905.8
申请日:2012-02-24
Applicant: 佳能株式会社
Abstract: 本发明涉及一种用于提取声音的子带能量特征的方法和设备。这种用于提取声音的子带能量特征的方法,包括以下步骤:针对作为目标声音事件的训练数据而输入的声音信号,分离出多个滤波组;对于分离出的所有滤波组中的每一个计算滤波组能量;计算所述滤波组能量的统计信息;通过对所述滤波组能量的统计信息进行聚类,把分离出的所有滤波组分组到子带中,其中在所述聚类结束后所述统计信息属于同一类的滤波组被分组到同一子带中;以及基于所述分组的结果,计算子带能量特征。
-
公开(公告)号:CN103366738A
公开(公告)日:2013-10-23
申请号:CN201210093171.4
申请日:2012-04-01
Applicant: 佳能株式会社
Abstract: 本公开涉及生成声音分类器和检测异常声音的方法和设备及监视系统。声音分类器包括至少一个分类器级。对于生成每个分类器级,声音分类器生成方法包括以下步骤:基于输入的声音样本生成正常声音模型;基于输入的声音样本和正常声音模型计算第一阈值,其中输入的声音样本根据正常声音模型和第一阈值被切分成第一正常声音样本和第一异常声音样本;基于特定的异常声音样本和第一异常声音样本生成异常声音模型;和基于第一正常声音样本和异常声音模型计算第二阈值,其中第一正常声音样本根据异常声音模型和第二阈值被切分成第二正常声音样本和第二异常声音样本;其中,该分类器级包括正常声音模型、第一阈值、异常声音模型和第二阈值。
-
公开(公告)号:CN103165127A
公开(公告)日:2013-06-19
申请号:CN201110418846.3
申请日:2011-12-15
Applicant: 佳能株式会社
Abstract: 本发明提供一种声音分段设备和方法以及声音检测系统。所述声音分段方法包括:非静音检测步骤,从声音序列中检测非静音声音段;特征提取步骤,从所述非静音声音段中提取特征序列;第一检测步骤,如果特征序列的处理窗中的点集满足规定条件,则将该处理窗确定为候选区域;第二检测步骤,在所述候选区域内检测分割点;以及第一处理窗调整步骤,如果在所述第一检测步骤中所述处理窗中的点集不满足所述规定条件或者如果在所述第二检测步骤中没有检测到分割点,则调整所述处理窗,其中,对于在第一处理窗调整步骤中经调整的处理窗,再次执行所述第一检测步骤和第二检测步骤。得益于本发明,可以获得好的性能而无需大的计算量。
-
公开(公告)号:CN102915728A
公开(公告)日:2013-02-06
申请号:CN201110217652.7
申请日:2011-08-01
Applicant: 佳能株式会社
Abstract: 本发明提供一种声音分段设备和方法以及说话者识别系统。该声音分段方法包括多级分段步骤,所述多级分段步骤包括当前声音段分段步骤。所述当前声音段分段步骤包括:确定步骤,确定当前声音段关于分割分数序列是否满足规定条件,所述分割分数序列指示每个候选分割点的信息熵;以及分割步骤,如果确定所述当前声音段满足所述规定条件,则将所述当前声音段分割为至少两个下一级声音段。通过将通过所述分割步骤获得的所述下一级声音段中的每一个作为所述下一级中的当前声音段,以迭代方式执行所述当前声音段分段步骤,直到每一级中的未被分割的声音段都不满足所述规定条件为止。得益于本发明,不必设置固定的观察窗并且可以降低计算量。
-
-
-
-
-
-
-