-
公开(公告)号:CN104143330A
公开(公告)日:2014-11-12
申请号:CN201310163355.8
申请日:2013-05-07
Applicant: 佳能株式会社
Abstract: 一种语音识别方法和语音识别系统。该语音识别方法包括:针对第一语音识别引擎的词汇表中的每个词条生成用于第二语音识别引擎的对应词条;把所生成的对应词条添加到第二引擎的词汇表中,以与第二引擎的词汇表中的原有词条一起生成组合词汇表;使用第一引擎通过第一引擎的词汇表来识别输入语音;使用第二引擎通过组合词汇表来识别输入语音,以生成与原有词条有关的识别结果和与对应词条有关的识别结果;使用从第二引擎输出的与对应词条有关的识别结果,对第一引擎的识别结果与第二引擎的与原有词条有关的识别结果进行比较并输出比较结果。第一引擎和第二引擎的每个识别结果包括识别出的单词和对应的识别分数。
-
公开(公告)号:CN109858312A
公开(公告)日:2019-06-07
申请号:CN201711240964.3
申请日:2017-11-30
Applicant: 佳能株式会社
IPC: G06K9/00
Abstract: 本发明公开了一种人体部件检测装置和方法以及图像处理系统。所述人体部件检测装置包括:检测单元,被构造为从输入图像中检测与待检测人体部件相邻的物体;获取单元,被构造为基于检测到的物体,获取所述人体部件的特征点和所述检测到的物体的特征点;及更新单元,被构造为通过至少更新获取的所述检测到的物体的特征点,来更新获取的所述人体部件的特征点。根据本发明,将提高人体部件检测的准确性。
-
公开(公告)号:CN104167206B
公开(公告)日:2017-05-31
申请号:CN201310182399.5
申请日:2013-05-17
Applicant: 佳能株式会社
IPC: G10L15/14 , G10L15/187
Abstract: 本发明涉及声学模型合并方法和设备以及语音识别方法和系统。一种声学模型合并方法,用于合并包括第一和第二声学模型的多个声学模型,包括:分布信息获取步骤,获得至少第一和/或第二声学模型的建模单元的分布信息,其中,所述分布信息能够反映所述建模单元在要识别的语言中的重要程度;距离计算步骤,分别计算由第一声学模型和第二声学模型的同一类的模型构成要素所组成的该类模型构成要素的对的距离;加权步骤,利用所述分布信息来对于各相应的该类模型构成要素的对的距离进行加权;排序步骤,根据加权后的距离来排序各该类模型构成要素的对;以及合并步骤,根据排序的结果,将第一声学模型与第二声学模型合并,得到合并的声学模型。
-
公开(公告)号:CN102915728B
公开(公告)日:2014-08-27
申请号:CN201110217652.7
申请日:2011-08-01
Applicant: 佳能株式会社
Abstract: 本发明提供一种声音分段设备和方法以及说话者识别系统。该声音分段方法包括多级分段步骤,所述多级分段步骤包括当前声音段分段步骤。所述当前声音段分段步骤包括:确定步骤,确定当前声音段关于分割分数序列是否满足规定条件,所述分割分数序列指示每个候选分割点的信息熵;以及分割步骤,如果确定所述当前声音段满足所述规定条件,则将所述当前声音段分割为至少两个下一级声音段。通过将通过所述分割步骤获得的所述下一级声音段中的每一个作为所述下一级中的当前声音段,以迭代方式执行所述当前声音段分段步骤,直到每一级中的未被分割的声音段都不满足所述规定条件为止。得益于本发明,不必设置固定的观察窗并且可以降低计算量。
-
公开(公告)号:CN102915729A
公开(公告)日:2013-02-06
申请号:CN201110217287.X
申请日:2011-08-01
Applicant: 佳能株式会社
Abstract: 本申请涉及语音关键词检出系统。其包括:输入单元,用于接收输入语音信号;特征提取单元,用于从输入语音信号提取至少一个特征;分类器单元,用于基于至少一个特征和词典将输入语音信号分类为目标关键词或者集外词;和输出单元,用于输出分类的结果。该词典包括:语法,包括目标关键词列表和用于集外词的两个标识符的至少一个序列;和词库,包括代表目标关键词列表中的一个或更多个目标关键词的音子序列的所有候选关键词的发音以及代表所述至少一个序列的发音,其中一个标识符表示第一类音子,另一个标识符表示第二类音子。第一类音子和第二类音子是基于音子的固有特征聚类的。第一类音子、第二类音子和目标关键词的音子由模型描述。
-
公开(公告)号:CN104167206A
公开(公告)日:2014-11-26
申请号:CN201310182399.5
申请日:2013-05-17
Applicant: 佳能株式会社
IPC: G10L15/14 , G10L15/187
Abstract: 本发明涉及声学模型合并方法和设备以及语音识别方法和系统。一种声学模型合并方法,用于合并包括第一和第二声学模型的多个声学模型,包括:分布信息获取步骤,获得至少第一和/或第二声学模型的建模单元的分布信息,其中,所述分布信息能够反映所述建模单元在要识别的语言中的重要程度;距离计算步骤,分别计算由第一声学模型和第二声学模型的同一类的模型构成要素所组成的该类模型构成要素的对的距离;加权步骤,利用所述分布信息来对于各相应的该类模型构成要素的对的距离进行加权;排序步骤,根据加权后的距离来排序各该类模型构成要素的对;以及合并步骤,根据排序的结果,将第一声学模型与第二声学模型合并,得到合并的声学模型。
-
公开(公告)号:CN105869641A
公开(公告)日:2016-08-17
申请号:CN201510032839.8
申请日:2015-01-22
Applicant: 佳能株式会社
Inventor: 郭莉莉
IPC: G10L15/26
Abstract: 本发明公开了语音识别装置及语音识别方法。所述语音识别装置包括:被构造为获得由当前用户输入的语音的单元;被构造为分割所获得的语音并输出至少两个声音命令段的单元;被构造为通过使用与说话者无关的声学模型、来从声音命令段中识别预定义的第一声音命令的单元;被构造为基于被识别为所述预定义的第一声音命令的声音命令段、来计算针对所述当前用户的变换矩阵的单元;被构造为基于所计算出的变换矩阵、来从注册在所述语音识别装置中的声学模型中选择针对所述当前用户的声学模型的单元;以及被构造为通过使用所选择的声学模型、来从声音命令段中识别第二声音命令的单元。根据本发明,通过使用所选择的AM能够提高语音识别性能。
-
公开(公告)号:CN103165127B
公开(公告)日:2015-07-22
申请号:CN201110418846.3
申请日:2011-12-15
Applicant: 佳能株式会社
Abstract: 本发明提供一种声音分段设备和方法以及声音检测系统。所述声音分段方法包括:非静音检测步骤,从声音序列中检测非静音声音段;特征提取步骤,从所述非静音声音段中提取特征序列;第一检测步骤,如果特征序列的处理窗中的点集满足规定条件,则将该处理窗确定为候选区域;第二检测步骤,在所述候选区域内检测分割点;以及第一处理窗调整步骤,如果在所述第一检测步骤中所述处理窗中的点集不满足所述规定条件或者如果在所述第二检测步骤中没有检测到分割点,则调整所述处理窗,其中,对于在第一处理窗调整步骤中经调整的处理窗,再次执行所述第一检测步骤和第二检测步骤。得益于本发明,可以获得好的性能而无需大的计算量。
-
公开(公告)号:CN102915729B
公开(公告)日:2014-11-26
申请号:CN201110217287.X
申请日:2011-08-01
Applicant: 佳能株式会社
Abstract: 本申请涉及语音关键词检出系统。其包括:输入单元,用于接收输入语音信号;特征提取单元,用于从输入语音信号提取至少一个特征;分类器单元,用于基于至少一个特征和词典将输入语音信号分类为目标关键词或者集外词;和输出单元,用于输出分类的结果。该词典包括:语法,包括目标关键词列表和用于集外词的两个标识符的至少一个序列;和词库,包括代表目标关键词列表中的一个或更多个目标关键词的音子序列的所有候选关键词的发音以及代表所述至少一个序列的发音,其中一个标识符表示第一类音子,另一个标识符表示第二类音子。第一类音子和第二类音子是基于音子的固有特征聚类的。第一类音子、第二类音子和目标关键词的音子由模型描述。
-
公开(公告)号:CN109858312B
公开(公告)日:2023-08-22
申请号:CN201711240964.3
申请日:2017-11-30
Applicant: 佳能株式会社
IPC: G06V40/16
Abstract: 本发明公开了一种人体部件检测装置和方法以及图像处理系统。所述人体部件检测装置包括:检测单元,被构造为从输入图像中检测与待检测人体部件相邻的物体;获取单元,被构造为基于检测到的物体,获取所述人体部件的特征点和所述检测到的物体的特征点;及更新单元,被构造为通过至少更新获取的所述检测到的物体的特征点,来更新获取的所述人体部件的特征点。根据本发明,将提高人体部件检测的准确性。
-
-
-
-
-
-
-
-
-