建立分类模型的方法和装置

    公开(公告)号:CN114328936B

    公开(公告)日:2022-08-30

    申请号:CN202210191386.3

    申请日:2022-03-01

    Inventor: 林昊

    Abstract: 本说明书实施例提供了一种建立分类模型的方法及装置。其中方法包括:首先获取待分类数据样本,并获取所述待分类数据样本对应的分类标签样本;然后将待分类数据样本及其对应的分类标签样本作为训练样本以构建训练集和回测集,所述训练集和所述回测集均包含多个训练样本;利用所述训练集训练分类模型;从所述回测集中选择对训练得到的分类模型产生满足预设要求的效果增益的训练样本;再获取对选择的训练样本中的待分类数据样本进行人工标注之后得到的分类标签样本,将所选择的训练样本中的待分类数据样本及其人工标注的分类标签样本构成新的训练样本加入所述训练集,转至利用所述训练集训练分类模型的步骤,直至达到预设的结束条件。

    融合知识图谱数据的方法及装置

    公开(公告)号:CN117235285B

    公开(公告)日:2024-02-02

    申请号:CN202311491095.7

    申请日:2023-11-09

    Inventor: 林昊

    Abstract: 多到一的数据融合处理问题。本说明书实施例提供一种融合知识图谱数据的方法及装置,用于将多源异构的多个知识图谱进行融合。为了完成多个知识图谱之间的节点大规模融合,采用将待融合的各个知识图谱逐个向目标知识图谱融合的技术构思。其中,目标知识图谱对应有预设的实体属性和融合策略,融合策略可以描述实体属性的融合规则,以及节点间连接关系的选择规则。针对待融合的当前知识图谱,可以逐个节点向目标知识图谱融合,并在融

    一种基于知识图谱的相同实体识别方法和系统

    公开(公告)号:CN114417845B

    公开(公告)日:2022-07-12

    申请号:CN202210321327.3

    申请日:2022-03-30

    Abstract: 本说明书实施例公开了一种基于知识图谱的相同实体识别方法和系统。其中,该方法包括:分别获取待识别的两个或更多个对象的多个特征;多个特征包括图表征特征以及图结构特征,其中,图表征特征反映对象在图谱中对应节点的表征信息,图结构特征反映对象在图谱中对应节点的至少部分关联节点的信息;确定两个或更多个对象的多个特征的联合相似度;基于联合相似度,确定两个或更多个对象是否对应于相同实体。

    一种基于知识图谱的相同实体识别方法和系统

    公开(公告)号:CN114417845A

    公开(公告)日:2022-04-29

    申请号:CN202210321327.3

    申请日:2022-03-30

    Abstract: 本说明书实施例公开了一种基于知识图谱的相同实体识别方法和系统。其中,该方法包括:分别获取待识别的两个或更多个对象的多个特征;多个特征包括图表征特征以及图结构特征,其中,图表征特征反映对象在图谱中对应节点的表征信息,图结构特征反映对象在图谱中对应节点的至少部分关联节点的信息;确定两个或更多个对象的多个特征的联合相似度;基于联合相似度,确定两个或更多个对象是否对应于相同实体。

    建立分类模型的方法和装置

    公开(公告)号:CN114328936A

    公开(公告)日:2022-04-12

    申请号:CN202210191386.3

    申请日:2022-03-01

    Inventor: 林昊

    Abstract: 本说明书实施例提供了一种建立分类模型的方法及装置。其中方法包括:首先获取待分类数据样本,并获取所述待分类数据样本对应的分类标签样本;然后将待分类数据样本及其对应的分类标签样本作为训练样本以构建训练集和回测集,所述训练集和所述回测集均包含多个训练样本;利用所述训练集训练分类模型;从所述回测集中选择对训练得到的分类模型产生满足预设要求的效果增益的训练样本;再获取对选择的训练样本中的待分类数据样本进行人工标注之后得到的分类标签样本,将所选择的训练样本中的待分类数据样本及其人工标注的分类标签样本构成新的训练样本加入所述训练集,转至利用所述训练集训练分类模型的步骤,直至达到预设的结束条件。

    融合知识图谱数据的方法及装置

    公开(公告)号:CN117235285A

    公开(公告)日:2023-12-15

    申请号:CN202311491095.7

    申请日:2023-11-09

    Inventor: 林昊

    Abstract: 本说明书实施例提供一种融合知识图谱数据的方法及装置,用于将多源异构的多个知识图谱进行融合。为了完成多个知识图谱之间的节点大规模融合,采用将待融合的各个知识图谱逐个向目标知识图谱融合的技术构思。其中,目标知识图谱对应有预设的实体属性和融合策略,融合策略可以描述实体属性的融合规则,以及节点间连接关系的选择规则。针对待融合的当前知识图谱,可以逐个节点向目标知识图谱融合,并在融合过程中经由实体链指进行节点消歧。这种实施方式可以解决多类型实体在异构知识图谱下的多到一的数据融合处理问题。

    事件推理方法和装置
    8.
    发明授权

    公开(公告)号:CN114357197B

    公开(公告)日:2022-07-26

    申请号:CN202210218758.7

    申请日:2022-03-08

    Inventor: 林昊

    Abstract: 本说明书实施例提供了一种事件推理方法和装置。根据该实施例的方法,首先从事件相关文本中抽取事件信息和关联实体信息;利用事件信息和关联实体信息构成第一子图,第一子图中的节点包括事件和关联实体,边体现事件与关联实体之间的关系;然后查询与事件类型相关的知识图谱,以确定知识图谱中各关联实体的第二子图,第二子图中的节点包括关联实体和与关联实体在预设关系范围内的其他实体,边体现实体之间的关系;其中,知识图谱的节点中包括目标类型的实体;再将第一子图和第二子图进行融合得到事件子图信息;最后将事件子图信息输入预先训练得到的事件影响预测模型,得到事件对目标类型的实体的影响信息。

    事件推理方法和装置
    9.
    发明公开

    公开(公告)号:CN114357197A

    公开(公告)日:2022-04-15

    申请号:CN202210218758.7

    申请日:2022-03-08

    Inventor: 林昊

    Abstract: 本说明书实施例提供了一种事件推理方法和装置。根据该实施例的方法,首先从事件相关文本中抽取事件信息和关联实体信息;利用事件信息和关联实体信息构成第一子图,第一子图中的节点包括事件和关联实体,边体现事件与关联实体之间的关系;然后查询与事件类型相关的知识图谱,以确定知识图谱中各关联实体的第二子图,第二子图中的节点包括关联实体和与关联实体在预设关系范围内的其他实体,边体现实体之间的关系;其中,知识图谱的节点中包括目标类型的实体;再将第一子图和第二子图进行融合得到事件子图信息;最后将事件子图信息输入预先训练得到的事件影响预测模型,得到事件对目标类型的实体的影响信息。

Patent Agency Ranking