-
公开(公告)号:CN114153990B
公开(公告)日:2024-10-22
申请号:CN202111488612.6
申请日:2021-12-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/36 , G06F16/25 , G06F16/2458 , G06F16/28 , G06F40/289 , G06F40/247 , G06F40/30 , G06Q50/04
Abstract: 本说明书实施例提供了一种知识生产管线的构建方法、系统及装置,所述方法包括:获取知识算子;所述知识算子具有预设的标准化接口,所述知识算子包括以下算子中的一种或多种:抽取算子、映射算子、标化算子、链指算子、融合算子;获取知识加工流向图;所述知识加工流向图至少反映各知识算子之间的数据依赖关系;将所述知识算子按照所述知识加工流向图进行装载,以得到所述知识生产管线;所述知识生产管线用于接收实例数据,并对其进行加工以生成知识图谱。
-
公开(公告)号:CN114328936B
公开(公告)日:2022-08-30
申请号:CN202210191386.3
申请日:2022-03-01
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 林昊
IPC: G06F16/35 , G06F40/242 , G06F40/30
Abstract: 本说明书实施例提供了一种建立分类模型的方法及装置。其中方法包括:首先获取待分类数据样本,并获取所述待分类数据样本对应的分类标签样本;然后将待分类数据样本及其对应的分类标签样本作为训练样本以构建训练集和回测集,所述训练集和所述回测集均包含多个训练样本;利用所述训练集训练分类模型;从所述回测集中选择对训练得到的分类模型产生满足预设要求的效果增益的训练样本;再获取对选择的训练样本中的待分类数据样本进行人工标注之后得到的分类标签样本,将所选择的训练样本中的待分类数据样本及其人工标注的分类标签样本构成新的训练样本加入所述训练集,转至利用所述训练集训练分类模型的步骤,直至达到预设的结束条件。
-
公开(公告)号:CN117235285B
公开(公告)日:2024-02-02
申请号:CN202311491095.7
申请日:2023-11-09
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 林昊
Abstract: 多到一的数据融合处理问题。本说明书实施例提供一种融合知识图谱数据的方法及装置,用于将多源异构的多个知识图谱进行融合。为了完成多个知识图谱之间的节点大规模融合,采用将待融合的各个知识图谱逐个向目标知识图谱融合的技术构思。其中,目标知识图谱对应有预设的实体属性和融合策略,融合策略可以描述实体属性的融合规则,以及节点间连接关系的选择规则。针对待融合的当前知识图谱,可以逐个节点向目标知识图谱融合,并在融
-
公开(公告)号:CN114417845B
公开(公告)日:2022-07-12
申请号:CN202210321327.3
申请日:2022-03-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/279 , G06N5/02
Abstract: 本说明书实施例公开了一种基于知识图谱的相同实体识别方法和系统。其中,该方法包括:分别获取待识别的两个或更多个对象的多个特征;多个特征包括图表征特征以及图结构特征,其中,图表征特征反映对象在图谱中对应节点的表征信息,图结构特征反映对象在图谱中对应节点的至少部分关联节点的信息;确定两个或更多个对象的多个特征的联合相似度;基于联合相似度,确定两个或更多个对象是否对应于相同实体。
-
公开(公告)号:CN114417845A
公开(公告)日:2022-04-29
申请号:CN202210321327.3
申请日:2022-03-30
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/279 , G06N5/02
Abstract: 本说明书实施例公开了一种基于知识图谱的相同实体识别方法和系统。其中,该方法包括:分别获取待识别的两个或更多个对象的多个特征;多个特征包括图表征特征以及图结构特征,其中,图表征特征反映对象在图谱中对应节点的表征信息,图结构特征反映对象在图谱中对应节点的至少部分关联节点的信息;确定两个或更多个对象的多个特征的联合相似度;基于联合相似度,确定两个或更多个对象是否对应于相同实体。
-
公开(公告)号:CN114328936A
公开(公告)日:2022-04-12
申请号:CN202210191386.3
申请日:2022-03-01
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 林昊
IPC: G06F16/35 , G06F40/242 , G06F40/30
Abstract: 本说明书实施例提供了一种建立分类模型的方法及装置。其中方法包括:首先获取待分类数据样本,并获取所述待分类数据样本对应的分类标签样本;然后将待分类数据样本及其对应的分类标签样本作为训练样本以构建训练集和回测集,所述训练集和所述回测集均包含多个训练样本;利用所述训练集训练分类模型;从所述回测集中选择对训练得到的分类模型产生满足预设要求的效果增益的训练样本;再获取对选择的训练样本中的待分类数据样本进行人工标注之后得到的分类标签样本,将所选择的训练样本中的待分类数据样本及其人工标注的分类标签样本构成新的训练样本加入所述训练集,转至利用所述训练集训练分类模型的步骤,直至达到预设的结束条件。
-
公开(公告)号:CN117235285A
公开(公告)日:2023-12-15
申请号:CN202311491095.7
申请日:2023-11-09
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 林昊
Abstract: 本说明书实施例提供一种融合知识图谱数据的方法及装置,用于将多源异构的多个知识图谱进行融合。为了完成多个知识图谱之间的节点大规模融合,采用将待融合的各个知识图谱逐个向目标知识图谱融合的技术构思。其中,目标知识图谱对应有预设的实体属性和融合策略,融合策略可以描述实体属性的融合规则,以及节点间连接关系的选择规则。针对待融合的当前知识图谱,可以逐个节点向目标知识图谱融合,并在融合过程中经由实体链指进行节点消歧。这种实施方式可以解决多类型实体在异构知识图谱下的多到一的数据融合处理问题。
-
公开(公告)号:CN114357197B
公开(公告)日:2022-07-26
申请号:CN202210218758.7
申请日:2022-03-08
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 林昊
Abstract: 本说明书实施例提供了一种事件推理方法和装置。根据该实施例的方法,首先从事件相关文本中抽取事件信息和关联实体信息;利用事件信息和关联实体信息构成第一子图,第一子图中的节点包括事件和关联实体,边体现事件与关联实体之间的关系;然后查询与事件类型相关的知识图谱,以确定知识图谱中各关联实体的第二子图,第二子图中的节点包括关联实体和与关联实体在预设关系范围内的其他实体,边体现实体之间的关系;其中,知识图谱的节点中包括目标类型的实体;再将第一子图和第二子图进行融合得到事件子图信息;最后将事件子图信息输入预先训练得到的事件影响预测模型,得到事件对目标类型的实体的影响信息。
-
公开(公告)号:CN114357197A
公开(公告)日:2022-04-15
申请号:CN202210218758.7
申请日:2022-03-08
Applicant: 支付宝(杭州)信息技术有限公司
Inventor: 林昊
Abstract: 本说明书实施例提供了一种事件推理方法和装置。根据该实施例的方法,首先从事件相关文本中抽取事件信息和关联实体信息;利用事件信息和关联实体信息构成第一子图,第一子图中的节点包括事件和关联实体,边体现事件与关联实体之间的关系;然后查询与事件类型相关的知识图谱,以确定知识图谱中各关联实体的第二子图,第二子图中的节点包括关联实体和与关联实体在预设关系范围内的其他实体,边体现实体之间的关系;其中,知识图谱的节点中包括目标类型的实体;再将第一子图和第二子图进行融合得到事件子图信息;最后将事件子图信息输入预先训练得到的事件影响预测模型,得到事件对目标类型的实体的影响信息。
-
公开(公告)号:CN114153990A
公开(公告)日:2022-03-08
申请号:CN202111488612.6
申请日:2021-12-07
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/36 , G06F16/25 , G06F16/2458 , G06F16/28 , G06F40/289 , G06F40/247 , G06F40/30 , G06Q50/04
Abstract: 本说明书实施例提供了一种知识生产管线的构建方法、系统及装置,所述方法包括:获取知识算子;所述知识算子具有预设的标准化接口,所述知识算子包括以下算子中的一种或多种:抽取算子、映射算子、标化算子、链指算子、融合算子;获取知识加工流向图;所述知识加工流向图至少反映各知识算子之间的数据依赖关系;将所述知识算子按照所述知识加工流向图进行装载,以得到所述知识生产管线;所述知识生产管线用于接收实例数据,并对其进行加工以生成知识图谱。
-
-
-
-
-
-
-
-
-