一种基于自适应负采样的知识图谱嵌入方法

    公开(公告)号:CN109376249A

    公开(公告)日:2019-02-22

    申请号:CN201811042565.0

    申请日:2018-09-07

    Abstract: 本发明提出一种基于自适应负采样的知识图谱嵌入方法,包括以下步骤:步骤1、根据实体间的相似性对实体向量进行分组;步骤2、利用同一分组内的相似实体进行相互替换并生成与正例三元组相似的负例三元组;步骤3、将所述正例三元组与所述负例三元组作为知识图谱嵌入模型中的训练输入;步骤4、利用所述知识图谱嵌入模型的损失函数优化更新实体向量与关系向量。本发明提高了替换实体与被替换实体之间的相似度,从而提高负例三元组质量;根据实体在知识图谱中出现的频率对实体进行采用,提高了高频实体被训练的次数;通过提高负例三元组的质量,有效的实现了知识图谱中实体与关系的嵌入。

    基于自适应权重的多源信息融合知识图谱表示学习方法

    公开(公告)号:CN109033129B

    公开(公告)日:2021-08-03

    申请号:CN201810563786.6

    申请日:2018-06-04

    Abstract: 本发明公开一种基于自适应权重的多源信息融合知识图谱表示学习方法,首先考虑了文本信息和结构化信息的融合,采用实体向量和关系向量之间基于翻译的模型,通过调节两者之间的权重来优化得分函数,并通过对前期已经分类好的结构化信息进行类型约束训练,且无需引入更多的参数;然后利用损失函数将实体向量和关系向量关联起来,并优化了该损失函数,当达到优化目标时,就可以学得知识图谱中每个实体的向量和关系的向量。本发明解决了知识库中文本信息和结构化信息融合没有考虑权重的问题,并利用了知识库中结构化信息已有的层次信息,更精确地表示实体和关系之间的相互联系,并将其应用于大规模知识图谱中。

    一种基于实体和关系结构信息的知识图谱表示学习方法

    公开(公告)号:CN109165278A

    公开(公告)日:2019-01-08

    申请号:CN201811042564.6

    申请日:2018-09-07

    Abstract: 本发明提出一种基于实体和关系结构信息的知识图谱表示学习方法,包括以下步骤:获取知识图谱中实体的结构语义信息与关系的结构语义信息;根据所述实体的结构语义信息与关系的结构语义信息,构建实体目标向量与目标关系向量;根据所述实体目标向量与目标关系向量,构建得分函数;根据所述得分函数构建损失函数,通过最小化所述损失函数,学习实体与关系的最佳向量表示。本发明充分地利用了实体和关系周围的结构信息来对实体和关系的表示进行丰富和约束。本发明有效地增强了对实体和关系的表达能力,构造了全新的目标函数,从而更好的对实体和关系进行表示,并保存实体和关系之间的联系,从而能够很好的应用于大规模的知识图谱补全当中。

    一种基于自适应负采样的知识图谱嵌入方法

    公开(公告)号:CN109376249B

    公开(公告)日:2021-11-30

    申请号:CN201811042565.0

    申请日:2018-09-07

    Abstract: 本发明提出一种基于自适应负采样的知识图谱嵌入方法,包括以下步骤:步骤1、根据实体间的相似性对实体向量进行分组;步骤2、利用同一分组内的相似实体进行相互替换并生成与正例三元组相似的负例三元组;步骤3、将所述正例三元组与所述负例三元组作为知识图谱嵌入模型中的训练输入;步骤4、利用所述知识图谱嵌入模型的损失函数优化更新实体向量与关系向量。本发明提高了替换实体与被替换实体之间的相似度,从而提高负例三元组质量;根据实体在知识图谱中出现的频率对实体进行采用,提高了高频实体被训练的次数;通过提高负例三元组的质量,有效的实现了知识图谱中实体与关系的嵌入。

    一种基于实体和关系结构信息的知识图谱表示学习方法

    公开(公告)号:CN109165278B

    公开(公告)日:2021-11-09

    申请号:CN201811042564.6

    申请日:2018-09-07

    Abstract: 本发明提出一种基于实体和关系结构信息的知识图谱表示学习方法,包括以下步骤:获取知识图谱中实体的结构语义信息与关系的结构语义信息;根据所述实体的结构语义信息与关系的结构语义信息,构建实体目标向量与目标关系向量;根据所述实体目标向量与目标关系向量,构建得分函数;根据所述得分函数构建损失函数,通过最小化所述损失函数,学习实体与关系的最佳向量表示。本发明充分地利用了实体和关系周围的结构信息来对实体和关系的表示进行丰富和约束。本发明有效地增强了对实体和关系的表达能力,构造了全新的目标函数,从而更好的对实体和关系进行表示,并保存实体和关系之间的联系,从而能够很好的应用于大规模的知识图谱补全当中。

    一种多层次命名实体识别方法

    公开(公告)号:CN110008469A

    公开(公告)日:2019-07-12

    申请号:CN201910207179.0

    申请日:2019-03-19

    Abstract: 本发明提出一种多层次命名实体识别方法,包括:S1对数据文本进行预处理,得到词汇表C;S2利用预训练好的词向量,结合文本的字符特征信息序列,得到的文本的向量表示;S3对所述文本的向量表示进行编码,得到编码后的文本特征向量序列;S4把所述文本特征向量序列用CRF模型进行解码,标注出所述文本特征向量序列中的实体;S5把标记处的实体的前文信息、后文信息以及该实体的信息作为后续的识别过程的候选序列;S6将所述文本特征向量序列以及所述候选序列,输入到基于注意力机制的推理单元,计算得到注意力向量;S7把所述注意力向量和所述文本特征向量序列输入到CRF模型中,标注出序列中的实体。

    一种多层次命名实体识别方法

    公开(公告)号:CN110008469B

    公开(公告)日:2022-06-07

    申请号:CN201910207179.0

    申请日:2019-03-19

    Abstract: 本发明提出一种多层次命名实体识别方法,包括:S1对数据文本进行预处理,得到词汇表C;S2利用预训练好的词向量,结合文本的字符特征信息序列,得到的文本的向量表示;S3对所述文本的向量表示进行编码,得到编码后的文本特征向量序列;S4把所述文本特征向量序列用CRF模型进行解码,标注出所述文本特征向量序列中的实体;S5把标记处的实体的前文信息、后文信息以及该实体的信息作为后续的识别过程的候选序列;S6将所述文本特征向量序列以及所述候选序列,输入到基于注意力机制的推理单元,计算得到注意力向量;S7把所述注意力向量和所述文本特征向量序列输入到CRF模型中,标注出序列中的实体。

    基于自适应权重的多源信息融合知识图谱表示学习方法

    公开(公告)号:CN109033129A

    公开(公告)日:2018-12-18

    申请号:CN201810563786.6

    申请日:2018-06-04

    Abstract: 本发明公开一种基于自适应权重的多源信息融合知识图谱表示学习方法,首先考虑了文本信息和结构化信息的融合,采用实体向量和关系向量之间基于翻译的模型,通过调节两者之间的权重来优化得分函数,并通过对前期已经分类好的结构化信息进行类型约束训练,且无需引入更多的参数;然后利用损失函数将实体向量和关系向量关联起来,并优化了该损失函数,当达到优化目标时,就可以学得知识图谱中每个实体的向量和关系的向量。本发明解决了知识库中文本信息和结构化信息融合没有考虑权重的问题,并利用了知识库中结构化信息已有的层次信息,更精确地表示实体和关系之间的相互联系,并将其应用于大规模知识图谱中。

Patent Agency Ranking