-
公开(公告)号:CN104298683A
公开(公告)日:2015-01-21
申请号:CN201310303056.X
申请日:2013-07-18
Applicant: 佳能株式会社
IPC: G06F17/30
CPC classification number: G06F17/30646 , G06F2216/03
Abstract: 本发明涉及主题挖掘方法和设备及查询扩展方法和设备。该主题挖掘方法包括:获取步骤,从至少一个知识库中获取多个句子;识别步骤,对于所获取的多个句子中的每个句子,识别与其关联的实体,其中该实体指示物理物体或物理物体属性;生成步骤,从与每个句子关联的实体中各提取一个实体生成一个或更多个实体组;选择步骤,从该一个或更多个实体组中选择具有最大区别度的一个实体组;以及用户可见区别性物体主题输出步骤,输出与所获取的多个句子对应的用户可见区别性物体主题,其中每个用户可见区别性物体主题通过利用所获取的多个句子中的一个句子及其在所选的实体组中的对应实体来表示。得益于本发明,可以挖掘出隐含的用户查询主题从而提高召回率。
-
公开(公告)号:CN103942232A
公开(公告)日:2014-07-23
申请号:CN201310026233.4
申请日:2013-01-18
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 本发明提供了用于挖掘意图的方法和设备。该方法包括以下步骤:获取用户的查询;挖掘与所述查询有关的候选意图;以及在所挖掘出的候选意图之中构建至少一个排他合集,其中每个排他合集包括至少两个相互排他的候选意图。利用本发明,可以提高意图召回率。
-
公开(公告)号:CN103729381A
公开(公告)日:2014-04-16
申请号:CN201210392483.5
申请日:2012-10-16
Applicant: 佳能株式会社
CPC classification number: G06F17/30731 , G06F17/2765 , G06F17/2785 , G06Q10/10
Abstract: 本发明提供了用于识别系列文档中的语义信息的方法和设备。该方法包括:a)识别系列文档中的每个文档中的实体项;b)将所识别的实体项与其在系列文档中的其它文档中的对应的实体项映射;c)计算所映射的实体项之间的相似度;d)从序列关系结构中提取描述所映射的实体项中的至少一个实体项的稳定程度的语义信息;其中,所述序列关系结构由N个所映射的实体项以及所映射的实体项之间的N-1个关系构成;并且其中,所述关系由所映射的实体项之间的相似度度量,并且在每两个所映射的实体项之间存在不多于一个的关系。利用本发明,可以从系列文档中提取语义信息,这将有助于对系列文档的智能处理和分析。
-
公开(公告)号:CN103514165A
公开(公告)日:2014-01-15
申请号:CN201210201517.8
申请日:2012-06-15
Applicant: 佳能株式会社
CPC classification number: G10L15/18 , G06F17/2765 , G06F17/278 , G06F17/2785
Abstract: 本发明涉及一种用于识别对话中所提及的人的方法和装置。一种用于识别对话中所提及的人的方法,包括:识别与从所述对话获取的所提及的人名相关的至少一个人名实体;获取与所提及的人名相关的一组候选标识符;从内部资源和外部资源为每个候选标识符获取至少一个关系特征,其中所述关系特征表示所述候选标识符与所述至少一个人名实体之间的关系;以及基于所述至少一个关系特征,从该组候选标识符中选择一个标识符作为所提及的人名的标识符。根据本发明的方法和装置,能够准确地识别所提及的人。
-
-
-