-
公开(公告)号:CN103942198A
公开(公告)日:2014-07-23
申请号:CN201310018519.8
申请日:2013-01-18
IPC: G06F17/30
CPC classification number: G06F17/30657 , G06F17/30864
Abstract: 本发明公开了用于挖掘意图的方法和设备。一种用于挖掘意图的方法,包括:获取查询和要被获得的意图的数量n,其中n为自然数;针对所输入的查询挖掘一组候选意图;从至少一个数据搜索资源获取与所输入的查询和挖掘出的候选意图相关的一组搜索结果;以及基于合计的非重叠率选择n个意图,所述合计的非重叠率是针对n个候选意图、基于n个候选意图中的各候选意图不与任意其它n-1个候选意图重叠的非重叠搜索结果的数量计算的。
-
公开(公告)号:CN103577491A
公开(公告)日:2014-02-12
申请号:CN201210281408.1
申请日:2012-08-09
Applicant: 佳能株式会社
CPC classification number: G06Q10/10 , G06F17/278
Abstract: 本发明提供了用于表征文档中的功能实体的方法和设备以及用于将文档中的功能实体消歧的方法和设备。用于表征在包括关于对装置进行操作的信息的文档中的功能实体的方法包括:识别该文档中的功能实体;以及对于每个功能实体,从该文档中提取至少一个装置状态转移;以及其中该装置状态转移由与装置的状态相关的实体和该实体之间的关系构成。这种表征方法可以被用于将文档中的功能实体消歧,并且可以被用于聚类/归类/搜索功能实体/文档。本发明对于其名字在多个版本间已经发生变化的功能实体的消歧而言是尤其有利的。
-
公开(公告)号:CN107229609B
公开(公告)日:2021-08-13
申请号:CN201610177984.X
申请日:2016-03-25
Applicant: 佳能株式会社
IPC: G06F40/205 , G06F16/35 , G06N20/00
Abstract: 本发明提供了用于分割文本的方法和设备。一种用于分割包括多个句子的文本的方法包括:从所述文本中提取多个证据和多个推论;对于所述多个推论中的每一个推论,基于所述文本和/或分割历史来确定所述多个证据中的每一个证据的优先位置,其中所述优先位置表示该证据在用来作出该推论的证据的序列中最可能处于的位置;以及通过基于证据的优先位置将所述文本中的每两个连续句子之间的边界中的一个或更多个边界确定为片段边界,来将所述文本分割成多个片段。通过利用本发明,分割将更为准确。
-
-
公开(公告)号:CN103942232A
公开(公告)日:2014-07-23
申请号:CN201310026233.4
申请日:2013-01-18
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 本发明提供了用于挖掘意图的方法和设备。该方法包括以下步骤:获取用户的查询;挖掘与所述查询有关的候选意图;以及在所挖掘出的候选意图之中构建至少一个排他合集,其中每个排他合集包括至少两个相互排他的候选意图。利用本发明,可以提高意图召回率。
-
公开(公告)号:CN103729381A
公开(公告)日:2014-04-16
申请号:CN201210392483.5
申请日:2012-10-16
Applicant: 佳能株式会社
CPC classification number: G06F17/30731 , G06F17/2765 , G06F17/2785 , G06Q10/10
Abstract: 本发明提供了用于识别系列文档中的语义信息的方法和设备。该方法包括:a)识别系列文档中的每个文档中的实体项;b)将所识别的实体项与其在系列文档中的其它文档中的对应的实体项映射;c)计算所映射的实体项之间的相似度;d)从序列关系结构中提取描述所映射的实体项中的至少一个实体项的稳定程度的语义信息;其中,所述序列关系结构由N个所映射的实体项以及所映射的实体项之间的N-1个关系构成;并且其中,所述关系由所映射的实体项之间的相似度度量,并且在每两个所映射的实体项之间存在不多于一个的关系。利用本发明,可以从系列文档中提取语义信息,这将有助于对系列文档的智能处理和分析。
-
公开(公告)号:CN103514165A
公开(公告)日:2014-01-15
申请号:CN201210201517.8
申请日:2012-06-15
Applicant: 佳能株式会社
CPC classification number: G10L15/18 , G06F17/2765 , G06F17/278 , G06F17/2785
Abstract: 本发明涉及一种用于识别对话中所提及的人的方法和装置。一种用于识别对话中所提及的人的方法,包括:识别与从所述对话获取的所提及的人名相关的至少一个人名实体;获取与所提及的人名相关的一组候选标识符;从内部资源和外部资源为每个候选标识符获取至少一个关系特征,其中所述关系特征表示所述候选标识符与所述至少一个人名实体之间的关系;以及基于所述至少一个关系特征,从该组候选标识符中选择一个标识符作为所提及的人名的标识符。根据本发明的方法和装置,能够准确地识别所提及的人。
-
-
-
-
-
-