-
公开(公告)号:CN119990286A
公开(公告)日:2025-05-13
申请号:CN202411955094.8
申请日:2024-12-27
Applicant: 北京师范大学
IPC: G06N5/025 , G06N5/02 , G06F18/22 , G06N3/0499 , G06N3/084
Abstract: 本发明提供一种知识图谱对齐方法、装置、设备、存储介质及程序产品,应用于自然语言处理技术领域。该方法包括:获取第一图谱,所述第一图谱包括实体名称、关系三元组和属性三元组;将所述实体名称、所述关系三元组和所述属性三元组编辑为文本序列,并根据头实体与尾实体指向关系的唯一性,确定关系和属性的排序方式,得到目标文本序列;将所述目标文本序列输入预设语言模型中,根据所述预设语言模型的输出隐藏层开始位置的CLS向量,生成多维度实体编码;根据所述多维度实体编码计算与第二图谱的实体编码的余弦相似度,以得到对齐结果。
-
公开(公告)号:CN108228877A
公开(公告)日:2018-06-29
申请号:CN201810059641.2
申请日:2018-01-22
Applicant: 北京师范大学
IPC: G06F17/30
Abstract: 本发明实施例公开一种基于学习排序算法的知识库补全方法及装置,能提高知识库补全的正确率。方法包括:对于待补全的知识库中的每一个待预测关系的头尾实体对,基于目标关系类型构建该头尾实体对对应比例的负实体对,对该头尾实体对和所述负实体对抽取关系路径,根据所述关系路径确定所述头尾实体对和所述负实体对的关系路径特征向量;将所述关系路径特征向量输入预先训练的学习排序模型,获得该头尾实体对和所述负实体对的得分排序,其中,所述学习排序模型采用学习排序算法进行训练;若根据所述得分排序判断获知该头尾实体对排序在第一位,则确定该头尾实体对属于该目标关系类型,通过将该头尾实体对补入该目标关系类型下的三元组中,对该知识库进行补全。
-
公开(公告)号:CN116402129A
公开(公告)日:2023-07-07
申请号:CN202310239978.2
申请日:2023-03-06
Applicant: 北京师范大学
IPC: G06N5/01 , G06N3/042 , G06N3/0455 , G06N3/08 , G06F18/214 , G06F18/22
Abstract: 本发明提供一种实体对齐方法、装置、设备、存储介质及产品,该方法包括:获取包含目标实体的至少一个待对齐实体对,计算出待对齐实体对的实体相似度分数;将每个待对齐实体对确定的一组知识图谱实体关系路径输入至关系路径实体对齐模型中,得到每个待对齐实体对的路径相似度分数,其中,关系路径实体对齐模型是采用堆叠transformer模型对知识图谱实体关系路径进行结构嵌入确定;确定实体相似度分数与路径相似度分数的综合得分最高的待对齐实体对为对齐结果。也即,在实体对齐过程中引入实体关系路径嵌入信息,能够通过分析连接它们的重要路径来解释对齐结果具备一定的可解释性,更好的利用了知识图谱结构信息,提高实体对齐效果。
-
公开(公告)号:CN108228877B
公开(公告)日:2020-08-04
申请号:CN201810059641.2
申请日:2018-01-22
Applicant: 北京师范大学
IPC: G06F16/36 , G06F16/383
Abstract: 本发明实施例公开一种基于学习排序算法的知识库补全方法及装置,能提高知识库补全的正确率。方法包括:对于待补全的知识库中的每一个待预测关系的头尾实体对,基于目标关系类型构建该头尾实体对对应比例的负实体对,对该头尾实体对和所述负实体对抽取关系路径,根据所述关系路径确定所述头尾实体对和所述负实体对的关系路径特征向量;将所述关系路径特征向量输入预先训练的学习排序模型,获得该头尾实体对和所述负实体对的得分排序,其中,所述学习排序模型采用学习排序算法进行训练;若根据所述得分排序判断获知该头尾实体对排序在第一位,则确定该头尾实体对属于该目标关系类型,通过将该头尾实体对补入该目标关系类型下的三元组中,对该知识库进行补全。
-
公开(公告)号:CN108304933A
公开(公告)日:2018-07-20
申请号:CN201810085005.7
申请日:2018-01-29
Applicant: 北京师范大学
Abstract: 本发明提供了一种知识库的补全方法及补全装置。方法包括:获取目标关系对应实体对集合中实体对的关系路径特征和关系路径特征向量;获取实体对中头实体对应的实体属性特征值和尾实体对应的实体属性特征值以及头实体的归一化实体属性特征值、尾实体的归一化实体属性特征值和归一化实体属性特征值的差值;头实体和尾实体的归一化实体属性特征值和差值形成实体属性特征向量;将关系路径特征向量和实体属性特征向量输入至分类器训练模型中,获取三元组的补全预测值;将补全预测值大于0.5的三元组确定为知识库的补全三元组。本发明通过将关系路径特征和实体属性特征结合并对知识库中实体关系进行预测,实现补全了知识库并提高了补全结果的准确性。
-
公开(公告)号:CN106960001A
公开(公告)日:2017-07-18
申请号:CN201710069468.X
申请日:2017-02-08
Applicant: 北京师范大学
IPC: G06F17/30
Abstract: 本发明提供一种检索词的实体链接方法及系统,利用训练语料生成实体提及字典和向量模型;对检索词进行切分,得到每一种切分后的多个词项;当词项为提及时,从实体提及字典中提取该提及的候选实体集合,遍历所有词项,得到每一种切分对应的多个候选实体组集;对每一种切分的所有候选实体集合中的实体进行全组合,形成多个实体链接候选结果,遍历每一种切分,得到检索词对应的所有的实体链接候选结果;计算实体链接候选结果的分值,将分值最高的实体链接候选结果确定为检索词的最佳实体链接结果。通过本发明提供的方法,能够更好的解决检索词的实体链接中出现的歧义性,使产生的实体链接结果具有较高的准确率和召回率。
-
公开(公告)号:CN119416777A
公开(公告)日:2025-02-11
申请号:CN202411408134.7
申请日:2024-10-10
Applicant: 北京师范大学
IPC: G06F40/279 , G06F40/284 , G06F16/35 , G06F40/30 , G06F18/25 , G06F18/241 , G06N3/045 , G06N3/08
Abstract: 本发明提供一种学术文献实体抽取方法、装置、设备及存储介质,其中方法包括:基于融合特征的语言模型,过滤学术文献的目标文本中的噪声语句,得到第一语句;基于关键词词库识别第一语句中的关键词,得到包含关键词的第二语句;基于第二语句和基于关键词注意力机制的语言模型,得到目标文本对应的实体抽取结果。基于融合特征的语言模型由BERT模块、字符特征模块和模式特征模块组成;关键词词库基于领域词典中的概念实体生成;基于关键词注意力的语言模型由BERT模型和关键词注意力层组成,关键词注意力层与BERT模型最后一个Transformer层并行堆叠。从而提高学术文献实体识别的准确率,提升学术文献分析的效率。
-
公开(公告)号:CN106960001B
公开(公告)日:2019-10-01
申请号:CN201710069468.X
申请日:2017-02-08
Applicant: 北京师范大学
Abstract: 本发明提供一种检索词的实体链接方法及系统,利用训练语料生成实体提及字典和向量模型;对检索词进行切分,得到每一种切分后的多个词项;当词项为提及时,从实体提及字典中提取该提及的候选实体集合,遍历所有词项,得到每一种切分对应的多个候选实体组集;对每一种切分的所有候选实体集合中的实体进行全组合,形成多个实体链接候选结果,遍历每一种切分,得到检索词对应的所有的实体链接候选结果;计算实体链接候选结果的分值,将分值最高的实体链接候选结果确定为检索词的最佳实体链接结果。通过本发明提供的方法,能够更好的解决检索词的实体链接中出现的歧义性,使产生的实体链接结果具有较高的准确率和召回率。
-
-
-
-
-
-
-