-
公开(公告)号:CN103942204B
公开(公告)日:2017-09-01
申请号:CN201310019620.5
申请日:2013-01-18
IPC: G06F17/30
Abstract: 本发明公开了用于挖掘意图的方法和设备。该用于挖掘意图的方法包括:接收步骤,接收输入的查询;预获取步骤,基于所接收到的查询来获取第一组候选意图;构建步骤,为所述查询构建至少一个临时意图模式;获取步骤,基于所述至少一个临时意图模式来获取第二组候选意图;以及组合步骤,将所述第一组候选意图和第二组候选意图进行组合以获得所述查询的候选意图;其中,所述临时意图模式包括所述查询和上下文字符。
-
公开(公告)号:CN103942198B
公开(公告)日:2017-07-28
申请号:CN201310018519.8
申请日:2013-01-18
IPC: G06F17/30
Abstract: 本发明公开了用于挖掘意图的方法和设备。一种用于挖掘意图的方法,包括:获取查询和要被获得的意图的数量n,其中n为自然数;针对所输入的查询挖掘一组候选意图;从至少一个数据搜索资源获取与所输入的查询和挖掘出的候选意图相关的一组搜索结果;以及基于合计的非重叠率选择n个意图,所述合计的非重叠率是针对n个候选意图、基于n个候选意图中的各候选意图不与任意其它n‑1个候选意图重叠的非重叠搜索结果的数量计算的。
-
公开(公告)号:CN107229609A
公开(公告)日:2017-10-03
申请号:CN201610177984.X
申请日:2016-03-25
Applicant: 佳能株式会社
IPC: G06F17/27
CPC classification number: G06F17/3071 , G06F17/2705
Abstract: 本发明提供了用于分割文本的方法和设备。一种用于分割包括多个句子的文本的方法包括:从所述文本中提取多个证据和多个推论;对于所述多个推论中的每一个推论,基于所述文本和/或分割历史来确定所述多个证据中的每一个证据的优先位置,其中所述优先位置表示该证据在用来作出该推论的证据的序列中最可能处于的位置;以及通过基于证据的优先位置将所述文本中的每两个连续句子之间的边界中的一个或更多个边界确定为片段边界,来将所述文本分割成多个片段。通过利用本发明,分割将更为准确。
-
公开(公告)号:CN105335416A
公开(公告)日:2016-02-17
申请号:CN201410380780.7
申请日:2014-08-05
Applicant: 佳能株式会社
Abstract: 本发明涉及内容提取方法、内容提取装置和用于内容提取的系统。内容提取方法包括:提取输入文档中的多个主题内容区域;对于至少一部分主题内容区域中的每个主题内容区域,确定该主题内容区域的结构类型,其中所述结构类型通过该主题内容区域中包含的元素确定;对于所述每个主题内容区域,根据该主题内容区域的结构类型识别该主题内容区域中的兴趣内容,其中该主题内容区域中的兴趣内容指示该主题内容区域中最可能被用户注意的至少一个元素;以及根据用户输入动作和所述每个主题内容区域中的兴趣内容,提取响应于用户输入动作的主题内容区域。通过使用主题内容区域和兴趣内容,可以在能够向用户提供有意义的内容的同时提高内容提取的准确度。
-
公开(公告)号:CN107239722A
公开(公告)日:2017-10-10
申请号:CN201610177996.2
申请日:2016-03-25
Applicant: 佳能株式会社
CPC classification number: G16H15/00 , G06F19/00 , G06K9/00469 , G06F17/271 , G06F17/277 , G06F17/2775
Abstract: 本发明提供了用于从医疗文档中提取诊断对象的方法和装置。该方法包括:从输入医疗文档中提取身体部位实体和至少一种类型的非身体部位实体以及身体部位实体与非身体部位实体之间的关系,其中对不少于两个非身体部位实体进行提取;对于所提取出的非身体部位实体的所有对中的每一对,取得一对中两个非身体部位实体之间的相关性评分,其中,该相关性评分基于历史医疗文档中的所述一对中的两个非身体部位实体与一个或多个身体部位实体之间的关系;基于所有对的相关性评分将输入医疗文档中的非身体部位实体聚类为一个或多个群集,及输出与被聚类在每个群集中的一个或多个非身体部位实体相关的一个或多个身体部位实体作为一个诊断对象。
-
公开(公告)号:CN104462083A
公开(公告)日:2015-03-25
申请号:CN201310416233.5
申请日:2013-09-13
Applicant: 佳能株式会社
IPC: G06F17/30
CPC classification number: G06F17/30699
Abstract: 本公开内容涉及用于内容比较的方法、装置和信息处理系统。该方法包括:识别至少两个待比较对象中包含的项目,所述项目包括短语、句子、段落、表格和图像中的至少一项;将所识别的项目进行配对以产生候选项目对,每个候选项目对包括至少两个项目,所述至少两个项目分别来自不同的待比较对象;基于第一预定义规则、第一用户历史行为和待比较对象的文本内容中的至少一项,确定所产生的候选项目对中的每一个候选项目对的特征;以及基于所确定的特征,将所产生的候选项目对中的至少一个候选项目对确定为可比项目对,其中每个可比项目对中包含的项目为可比项目。通过上述方案,能够自动且有效地识别出比较对象中的可比项目。
-
公开(公告)号:CN103942198A
公开(公告)日:2014-07-23
申请号:CN201310018519.8
申请日:2013-01-18
IPC: G06F17/30
CPC classification number: G06F17/30657 , G06F17/30864
Abstract: 本发明公开了用于挖掘意图的方法和设备。一种用于挖掘意图的方法,包括:获取查询和要被获得的意图的数量n,其中n为自然数;针对所输入的查询挖掘一组候选意图;从至少一个数据搜索资源获取与所输入的查询和挖掘出的候选意图相关的一组搜索结果;以及基于合计的非重叠率选择n个意图,所述合计的非重叠率是针对n个候选意图、基于n个候选意图中的各候选意图不与任意其它n-1个候选意图重叠的非重叠搜索结果的数量计算的。
-
公开(公告)号:CN103577491A
公开(公告)日:2014-02-12
申请号:CN201210281408.1
申请日:2012-08-09
Applicant: 佳能株式会社
CPC classification number: G06Q10/10 , G06F17/278
Abstract: 本发明提供了用于表征文档中的功能实体的方法和设备以及用于将文档中的功能实体消歧的方法和设备。用于表征在包括关于对装置进行操作的信息的文档中的功能实体的方法包括:识别该文档中的功能实体;以及对于每个功能实体,从该文档中提取至少一个装置状态转移;以及其中该装置状态转移由与装置的状态相关的实体和该实体之间的关系构成。这种表征方法可以被用于将文档中的功能实体消歧,并且可以被用于聚类/归类/搜索功能实体/文档。本发明对于其名字在多个版本间已经发生变化的功能实体的消歧而言是尤其有利的。
-
公开(公告)号:CN107239722B
公开(公告)日:2021-11-12
申请号:CN201610177996.2
申请日:2016-03-25
Applicant: 佳能株式会社
IPC: G06K9/00 , G06F40/284 , G06F40/289 , G06F40/211 , G16H10/60 , G16H15/00 , G16H50/70
Abstract: 本发明提供了用于从医疗文档中提取诊断对象的方法和装置。该方法包括:从输入医疗文档中提取身体部位实体和至少一种类型的非身体部位实体以及身体部位实体与非身体部位实体之间的关系,其中对不少于两个非身体部位实体进行提取;对于所提取出的非身体部位实体的所有对中的每一对,取得一对中两个非身体部位实体之间的相关性评分,其中,该相关性评分基于历史医疗文档中的所述一对中的两个非身体部位实体与一个或多个身体部位实体之间的关系;基于所有对的相关性评分将输入医疗文档中的非身体部位实体聚类为一个或多个群集,及输出与被聚类在每个群集中的一个或多个非身体部位实体相关的一个或多个身体部位实体作为一个诊断对象。
-
公开(公告)号:CN105335416B
公开(公告)日:2018-11-02
申请号:CN201410380780.7
申请日:2014-08-05
Applicant: 佳能株式会社
Abstract: 本公开涉及内容提取方法、内容提取装置和用于内容提取的系统。内容提取方法包括:提取输入文档中的多个主题内容区域;对于至少一部分主题内容区域中的每个主题内容区域,确定该主题内容区域的结构类型,其中所述结构类型通过该主题内容区域中包含的元素确定;对于所述每个主题内容区域,根据该主题内容区域的结构类型识别该主题内容区域中的兴趣内容,其中该主题内容区域中的兴趣内容指示该主题内容区域中最可能被用户注意的至少一个元素;以及根据用户输入动作和所述每个主题内容区域中的兴趣内容,提取响应于用户输入动作的主题内容区域。通过使用主题内容区域和兴趣内容,可以在能够向用户提供有意义的内容的同时提高内容提取的准确度。
-
-
-
-
-
-
-
-
-