-
公开(公告)号:CN107038169B
公开(公告)日:2021-03-12
申请号:CN201610078101.X
申请日:2016-02-04
Applicant: 佳能株式会社
IPC: G06F16/435 , G06F16/9535
Abstract: 本申请涉及一种对象推荐方法和对象推荐设备,该对象推荐方法包括:特征矢量提取步骤,根据用户和对象的历史数据来提取至少一个表示对应用户特征的用户特征矢量和表示对应对象特征的对象特征矢量,在历史数据更新的情况下所述用户特征矢量中的每一个都彼此独立地更新并且所述对象特征矢量中的每一个都彼此独立地更新;权重矩阵生成步骤,使用历史数据来生成表示用户特征相对于对象特征的映射的权重矩阵;以及,推荐分数确定步骤,基于用户特征矢量、对象特征矢量和权重矩阵来确定用于被选定用户的多个候选对象的分数。
-
公开(公告)号:CN104167206B
公开(公告)日:2017-05-31
申请号:CN201310182399.5
申请日:2013-05-17
Applicant: 佳能株式会社
IPC: G10L15/14 , G10L15/187
Abstract: 本发明涉及声学模型合并方法和设备以及语音识别方法和系统。一种声学模型合并方法,用于合并包括第一和第二声学模型的多个声学模型,包括:分布信息获取步骤,获得至少第一和/或第二声学模型的建模单元的分布信息,其中,所述分布信息能够反映所述建模单元在要识别的语言中的重要程度;距离计算步骤,分别计算由第一声学模型和第二声学模型的同一类的模型构成要素所组成的该类模型构成要素的对的距离;加权步骤,利用所述分布信息来对于各相应的该类模型构成要素的对的距离进行加权;排序步骤,根据加权后的距离来排序各该类模型构成要素的对;以及合并步骤,根据排序的结果,将第一声学模型与第二声学模型合并,得到合并的声学模型。
-
公开(公告)号:CN102915728B
公开(公告)日:2014-08-27
申请号:CN201110217652.7
申请日:2011-08-01
Applicant: 佳能株式会社
Abstract: 本发明提供一种声音分段设备和方法以及说话者识别系统。该声音分段方法包括多级分段步骤,所述多级分段步骤包括当前声音段分段步骤。所述当前声音段分段步骤包括:确定步骤,确定当前声音段关于分割分数序列是否满足规定条件,所述分割分数序列指示每个候选分割点的信息熵;以及分割步骤,如果确定所述当前声音段满足所述规定条件,则将所述当前声音段分割为至少两个下一级声音段。通过将通过所述分割步骤获得的所述下一级声音段中的每一个作为所述下一级中的当前声音段,以迭代方式执行所述当前声音段分段步骤,直到每一级中的未被分割的声音段都不满足所述规定条件为止。得益于本发明,不必设置固定的观察窗并且可以降低计算量。
-
公开(公告)号:CN103295583A
公开(公告)日:2013-09-11
申请号:CN201210043905.8
申请日:2012-02-24
Applicant: 佳能株式会社
Abstract: 本发明涉及一种用于提取声音的子带能量特征的方法和设备。这种用于提取声音的子带能量特征的方法,包括以下步骤:针对作为目标声音事件的训练数据而输入的声音信号,分离出多个滤波组;对于分离出的所有滤波组中的每一个计算滤波组能量;计算所述滤波组能量的统计信息;通过对所述滤波组能量的统计信息进行聚类,把分离出的所有滤波组分组到子带中,其中在所述聚类结束后所述统计信息属于同一类的滤波组被分组到同一子带中;以及基于所述分组的结果,计算子带能量特征。
-
公开(公告)号:CN102915729A
公开(公告)日:2013-02-06
申请号:CN201110217287.X
申请日:2011-08-01
Applicant: 佳能株式会社
Abstract: 本申请涉及语音关键词检出系统。其包括:输入单元,用于接收输入语音信号;特征提取单元,用于从输入语音信号提取至少一个特征;分类器单元,用于基于至少一个特征和词典将输入语音信号分类为目标关键词或者集外词;和输出单元,用于输出分类的结果。该词典包括:语法,包括目标关键词列表和用于集外词的两个标识符的至少一个序列;和词库,包括代表目标关键词列表中的一个或更多个目标关键词的音子序列的所有候选关键词的发音以及代表所述至少一个序列的发音,其中一个标识符表示第一类音子,另一个标识符表示第二类音子。第一类音子和第二类音子是基于音子的固有特征聚类的。第一类音子、第二类音子和目标关键词的音子由模型描述。
-
公开(公告)号:CN1835072B
公开(公告)日:2010-04-28
申请号:CN200510054836.0
申请日:2005-03-17
Applicant: 佳能株式会社
Abstract: 本发明公开一种波三角变换的方法及其装置、以及基于该波三角变换的语音检测方法及其装置。本发明所公开的用于分析波形顶点并提取的方法和装置能够满足实时语音识别应用中提出的低时延的要求。更进一步,本发明还提供一种采用音频信号的WTT变换的语音检测方法及其装置,其无需考虑音频信号或背景噪声的水平。根据本发明的方法及装置,由于逐帧提取顶点,并且当顶点提取到达帧的末尾时,该帧的结束信息自然累积给下一帧。此外,由于一个三角包括三个顶点,因此末端的两个顶点也自然累积给下一帧。顶点和三角的提取都是实时进行的,因此实时进行的WTT变换具有良好的性能和准确度,从而能够应用在许多领域。
-
公开(公告)号:CN100410852C
公开(公告)日:2008-08-13
申请号:CN02159546.1
申请日:2002-12-27
Applicant: 佳能株式会社
IPC: G06F3/023
Abstract: 本发明公开了一种汉字拼音的处理方法、装置以及存储介质。该方法包括,输入步骤,用于输入文件中每个汉字的拼音;计算步骤,用于计算每个韵母和每个声母与声调的组合的出现概率;以及编码步骤,用于根据每个韵母以及每个声母与声调的组合的出现概率,对文件中每个汉字的拼音进行编码。本方法也可基于每个声母和每个韵母与声调的组合的出现概率,对汉字拼音进行处理。根据本发明,可以得到一种可靠的和快速的处理汉字拼音的方法。拼音的压缩率能够得到极大地改善,需要较少的空间存储文件中的拼音。
-
-
-
-
-
-