用于知识图谱的数据预处理方法及装置

    公开(公告)号:CN111309823A

    公开(公告)日:2020-06-19

    申请号:CN202010089110.5

    申请日:2020-02-12

    Abstract: 本说明书实施例提供一种用于知识图谱的数据预处理方法和装置,在确定知识图谱中的节点及连接关系类别的向量表达时,以三元组中首节点对应的第一节点向量与首节点和尾节点之间的连接关系类别对应的第一关系向量的哈达玛积融合得到中间向量,并将中间向量与尾节点对应的第二节点向量的距离作为参考评价指标,基于对正负样本在参考评价指标上的取值的调整,更新相应的节点向量及关系向量。这种方式在节约参数的基础上,能够同时表达诸如对称关系、相反关系、组合关系等常见关联关系,提升知识图谱的表达能力。

    一种知识图谱处理方法和系统

    公开(公告)号:CN113886605B

    公开(公告)日:2025-01-24

    申请号:CN202111243147.X

    申请日:2021-10-25

    Abstract: 本说明书实施例提供了一种知识图谱处理方法和系统,方法包括:基于目标业务域涉及的一个或多个实体类型从共享知识图谱中选取若干节点及其边,得到目标子图谱;所述共享知识图谱基于一个或多个业务域的知识图谱融合得到;对所述目标子图谱进行处理,以提取一种或多种图谱特征,所述图谱特征包括以下中的部分或全部:节点表征向量、边表征向量、图结构特征、图谱中文本信息的语义特征、图谱规则特征;将所述图谱特征提供给目标业务域的目标数据处理任务;其中,所述图谱特征用于与任务定制化特征一同作为所述目标数据处理任务的输入特征,以实现目标数据处理任务。

    对支付指标波动进行归因的方法及装置

    公开(公告)号:CN113705818B

    公开(公告)日:2024-04-19

    申请号:CN202111023551.6

    申请日:2021-08-31

    Abstract: 本说明书实施例提供一种对支付指标波动进行归因的方法。该方法包括:首先,获取多个训练样本,其中各个训练样本包括在对应的时间切片下,与支付相关的多个因子的多个因子值以及支付指标的指标值;接着,利用所述多个训练样本构建第一贝叶斯网络,以及针对所述多个因子中任一的目标因子,将第一训练样本中对应的第一因子值替换为第二训练样本中对应的第二因子值,得到第一反事实样本;进一步,基于该第一贝叶斯网络处理该第一反事实样本,得到针对所述支付指标的第一预测结果;然后,基于所述第一预测结果和所述第二训练样本中对应所述支付指标的第二指标值,确定所述目标因子针对所述支付指标的影响系数。

    事件抽取方法、装置、计算机程序产品、存储介质及设备

    公开(公告)号:CN115048486A

    公开(公告)日:2022-09-13

    申请号:CN202210580427.8

    申请日:2022-05-24

    Abstract: 本申请公开了一种事件抽取方法、装置、计算机程序产品、存储介质及设备,其中方法包括:识别目标文本中的至少一个触发词,获取至少一个触发词分别对应的触发词向量,基于各触发词对应的触发词向量、各触发词对应的事件类型向量以及各触发词对应的相对位置向量,在目标文本中确定与各触发词对应的事件类型相关联的要素词信息,要素词信息包括至少一个要素词中各要素词对应的位置信息和各要素词之间的要素关系,基于各要素词的位置信息以及各要素词之间的要素关系,生成目标文本对应的事件抽取结果,各触发词对应的事件类型向量表示目标触发词对应的事件类型,各触发词对应的相对位置向量表示目标文本中各单词和各触发词之间的相对位置关系。

    一种知识图谱的表示学习方法和系统

    公开(公告)号:CN114610899A

    公开(公告)日:2022-06-10

    申请号:CN202210222332.9

    申请日:2022-03-07

    Abstract: 本说明书涉及图数据处理领域,特别涉及一种知识图谱的表示学习方法和系统。该方法包括进行一轮或多轮迭代更新,以获得知识图谱中节点和/或边的向量表示,其中一轮迭代更新包括:基于所述知识图谱中的一个或多个三元组,获取一个或多个正样本;基于知识图谱中不存在的一个或多个三元组,获取一个或多个负样本;基于各样本中的向量表示确定各样本对应的预测值;确定损失函数值,所述损失函数值反映各样本对应的预测值与其标签值的差异;调整样本中节点的第一向量表示、边的向量表示以及所述字典矩阵中的元素,以减小各样本对应的预测值与其标签值的差异。

    机器阅读理解中的数值推理方法和装置

    公开(公告)号:CN111737419B

    公开(公告)日:2020-12-04

    申请号:CN202010759810.0

    申请日:2020-07-31

    Abstract: 本说明书实施例提供一种机器阅读理解中的数值推理方法和装置。方法包括:获取当前问题和当前文本;确定当前问题和当前文本中包括的各实体和各数字,以及各数字分别对应的类型;构建关系网络图,包括对应于各实体的实体节点,和对应于各数字的数字节点,在相同类型的数字节点之间,以及具有预设关系的实体节点和数字节点之间,通过连接边形成邻居;确定当前问题对应的第一问题表征向量,以及关系网络图中各节点的初始表征向量;基于各节点的初始表征向量,对所述关系网络图中的各节点进行预定次数的迭代,以得到各节点的更新表征向量。能够提高机器阅读理解中的数值推理处理复杂问题的能力。

    一种文本内容修正的方法和系统

    公开(公告)号:CN111291552A

    公开(公告)日:2020-06-16

    申请号:CN202010384219.1

    申请日:2020-05-09

    Abstract: 本说明书实施例公开了一种文本内容修正的方法及系统。所述方法包括:获取待检测文本;生成所述待检测文本中各个字符对应的语义向量;对于每个所述语义向量,确定该语义向量在修正矩阵中对应的修正向量,进而将所述修正向量对应的字符作为修正后的字符;所述修正矩阵包括所述字符集中各字符的修正向量,其基于词嵌入矩阵和混淆特征矩阵生成;所述混淆特征矩阵基于所述词嵌入矩阵和混淆关系图,通过混淆模型获得;所述混淆关系图表示字符之间的符号近似关系;所述词嵌入矩阵包括字符集中各字符的词嵌入向量。

Patent Agency Ranking