实体关系联合抽取方法及电子设备

    公开(公告)号:CN114357179A

    公开(公告)日:2022-04-15

    申请号:CN202111509942.9

    申请日:2021-12-10

    Abstract: 本申请提供了实体关系联合抽取方法及电子设备。本申请实施例中,在从目标文本抽取实体关系时,需要依赖于用于反映实体之间关联信息的句子依存分析树,并在预测出目标文本中的潜在三元组后基于句子依存分析树以及全局主客实体对约束矩阵生成模型对潜在三元组进行筛减,以过滤掉冗余三元组,得到最终真实的实体关系三元组信息,这提高了实体关系抽取结果的准确度,并有效解决错误累积、冗余实体以及重叠关系等问题。

    图神经网络任务的执行方法、装置、电子设备及存储介质

    公开(公告)号:CN117807246A

    公开(公告)日:2024-04-02

    申请号:CN202311845287.3

    申请日:2023-12-28

    Abstract: 本申请公开了一种图神经网络任务的执行方法、装置、电子设备及存储介质。其中,该方法包括:将待划分的知识图谱,采用边划分方式随机划分为多个子图,每个子图对应一个分区;根据下游图神经网络任务中节点特征的构建方式,确定邻居边的扩张方向;针对每个分区,基于邻居边的扩张方向,调用分区对应的进程,对分区进行基于邻居扩张的迭代操作,得到分区对应的迭代扩张结果,将多个分区的迭代扩张结果确定为知识图谱的边划分结果,转换得到知识图谱的节点划分结果,基于节点划分结果执行下游图神经网络任务。本申请提高了划分效率,减少了下游GNN任务执行的等待时间,减少了下游GNN任务执行过程中进程间的通信消耗。

    一种标注数据的扩充方法、装置及电子设备

    公开(公告)号:CN115905550A

    公开(公告)日:2023-04-04

    申请号:CN202110984163.8

    申请日:2021-08-25

    Inventor: 龙铭刚

    Abstract: 本发明实施例提供了一种标注数据的扩充方法、装置及电子设备,涉及知识图谱技术领域。该方法包括:获取待扩充的各个基础标注数据,并确定预设的属于各类元素的各个替换数据;针对每个基础标注数据,确定该基础标注数据所包括的各组替换内容;针对每组替换内容,在各个替换数据中确定多组与该组替换内容相匹配的目标内容;针对每组目标内容,利用该组目标内容中的各个目标数据,替换与该组目标内容对应的替换内容所在的基础标注数据中,属于该组替换内容且与该目标数据相匹配的基础数据,得到目标标注数据。与现有技术相比,应用本发明实施例提供的方案,可以实现利用较少的人工标注的标注数据,对标注数据进行扩充,以得到大量的标注数据。

    一种知识图谱构建方法、装置及电子设备

    公开(公告)号:CN115470356A

    公开(公告)日:2022-12-13

    申请号:CN202110653469.5

    申请日:2021-06-11

    Abstract: 本发明实施例提供了一种知识图谱构建方法、装置及电子设备。其中,所述方法包括:对目标文本进行属性标记,确定所述目标文本中存在的各个属性以及所述各个属性的类别;在所述各个属性中确定类别为预设类别的属性,作为实体提及,其中,所述预设类别的属性为预先设置的能够唯一标识所描述的实体的属性;针对每个实体提及,确定在所述目标文本中与该实体提及关联且不为实体提及的属性,得到该实体提及所标识的实体的属性;确定各实体提及在所述目标文本中的关联关系,得到各实体提及所标识的实体之间的关系;根据各实体提及所标识的实体的属性以及各实体提及所标识的实体之间的关系构建知识图谱。可以使得构建得到的知识图谱中信息更加全面。

    一种数据处理方法、装置、系统、电子设备和存储介质

    公开(公告)号:CN118277624B

    公开(公告)日:2024-08-27

    申请号:CN202410702438.8

    申请日:2024-05-31

    Abstract: 本申请实施例提供一种数据处理方法,涉及数据处理技术领域。包括:通过多个分布式计算节点并行读取图结构数据;每个计算节点确定读取的批数据中每个顶点的原始id对应的目标计算节点,并将其发送至对应的目标计算节点进行存储;每个计算节点对自身存储的原始id进行去重处理,并确定出未编码的原始id;每个计算节点基于对应的编码id区间对自身存储的未编码的原始id进行连续编码;多个计算节点对应的编码id区间连续,且编码id区间中的可编码id数量与未编码的原始id数量相同,每个计算节点将读取的批数据中点数据和/或边数据的顶点的原始id替换为编码id,得到编码后的点数据和/或边数据,并将其存储在自身的存储空间中。

    一种数据处理方法、装置、系统、电子设备和存储介质

    公开(公告)号:CN118277624A

    公开(公告)日:2024-07-02

    申请号:CN202410702438.8

    申请日:2024-05-31

    Abstract: 本申请实施例提供一种数据处理方法,涉及数据处理技术领域。包括:通过多个分布式计算节点并行读取图结构数据;每个计算节点确定读取的批数据中每个顶点的原始id对应的目标计算节点,并将其发送至对应的目标计算节点进行存储;每个计算节点对自身存储的原始id进行去重处理,并确定出未编码的原始id;每个计算节点基于对应的编码id区间对自身存储的未编码的原始id进行连续编码;多个计算节点对应的编码id区间连续,且编码id区间中的可编码id数量与未编码的原始id数量相同,每个计算节点将读取的批数据中点数据和/或边数据的顶点的原始id替换为编码id,得到编码后的点数据和/或边数据,并将其存储在自身的存储空间中。

Patent Agency Ranking