-
公开(公告)号:CN117874180A
公开(公告)日:2024-04-12
申请号:CN202311544030.4
申请日:2023-11-17
Applicant: 电信科学技术第五研究所有限公司
IPC: G06F16/332 , G06F16/36 , G06N5/022 , G06N5/04 , G06N3/0455
Abstract: 本发明公开了一种基于大语言模型和知识图谱的知识问答方法,其包括:给定问题,从知识图谱中获取问题得分最高的候选答案组成的集合;从文档库中获取与问题相关的文档集合作为问题的上下文,制作阅读理解的Prompt模板,利用问题、问题相关文档集合和候选答案集合填充Prompt模板,并将填充后的Prompt模板输入大语言模型LLM中,输出问题最终的答案集合。本发明能够更加准确地给出问题的答案。
-
公开(公告)号:CN115859996A
公开(公告)日:2023-03-28
申请号:CN202211528737.1
申请日:2022-11-30
Applicant: 电信科学技术第五研究所有限公司
IPC: G06F40/30 , G06F40/279 , G06N3/0455 , G06N3/094 , G06N3/084
Abstract: 本发明公开了一种实体关系抽取模型及其构建方法,属于知识图谱构建领域。所述实体关系抽取模型,包括:编码模块,用于提取待抽取句子的句子语义表示;潜在关系预测模块,用于根据所述句子语义表示进行关系类型的分类,得到待抽取句子的潜在关系集合;实体识别模块,用于识别所述潜在关系集合中的每个关系下的潜在实体;全局关联矩阵模块,用于根据所述句子语义表示得到全局关联矩阵,并根据全局关联矩阵识别待抽取句子在每个关系下对应的潜在实体中属于该关系下的实体。本发明解决了现有技术中实体关系抽取中存在的关系重叠和实体重叠问题。
-
公开(公告)号:CN119761496A
公开(公告)日:2025-04-04
申请号:CN202411552042.6
申请日:2024-11-01
Applicant: 电信科学技术第五研究所有限公司
IPC: G06N5/04 , G06N5/022 , G06F16/332 , G06F16/3331
Abstract: 本发明公开了一种知识图谱多跳路径推理方法、装置、设备及存储介质,包括:根据问题和相关文档段落填充第一Prompt模板,得到第一指令,将第一指令输入至大模型,得到问题的增强检索答案;使用问题和知识图谱的实体类型集合和关系类型集合填充第二Prompt模板,得到第二指令,将第二指令输入大模型得到问题在知识图谱上可能的推理路径集合;对路径集合与推理路径集合求并集,得到新路径集合,沿着新路径集合中的路径进行查询,得到查询后的路径遍历集合;对路径遍历集合文本化为字符串,得到文本表示;根据问题、文本表示填充第三Prompt模板得到第三指令,将第三指令输入大模型得到问题的多跳路径推理答案。本发明成本相对较低,推理效率更高,效果更佳。
-
公开(公告)号:CN115878813A
公开(公告)日:2023-03-31
申请号:CN202211474722.1
申请日:2022-11-23
Applicant: 电信科学技术第五研究所有限公司
IPC: G06F16/36 , G06F40/295 , G06F16/28 , G06F18/24 , G06F18/214 , G06N5/022 , G06N20/00
Abstract: 本发明公开了基于远程监督和提示学习的实体属性生成方法及系统,涉及知识图谱领域,方法包括S1构建知识图谱;S2实体e、e的ake、及ave组成的三元组,在开放文档库D中检索e和ave,召回文本集合De;S3将De中正确表达ake的de标注为正例文本se,集合C为三元组与se组成的四元组集合;S4获取文本x;S5识别x中e,抽取e的ake;S6将x、e和ake转化成xprompt;S7获得实体的属性值;系统包括知识图谱、开放文档数据库、提示学习模板引擎、预训练语言模块和实体识别模块;将提示学习用于实体属性抽取中,以有效解决了传统分类器存在的问题。
-
公开(公告)号:CN116719952A
公开(公告)日:2023-09-08
申请号:CN202310818124.X
申请日:2023-07-05
Applicant: 电信科学技术第五研究所有限公司
Abstract: 本发明公开了一种基于关系有向图的知识推理方法及装置,属于知识图谱领域。基于关系有向图的知识推理方法,包括:获取三元组数据集合;将所述三元组数据集合中的所有三元组作为正三元组样本,并对所述正三元组样本进行负采样得到负三元组样本;对三元组样本和正三元组样本分别进行关系有向图编码,得到子图编码向量;其中,三元组样本包括正三元组样本和负三元组样本;对子图编码向量表示的序列进行打分,根据打分确定属于尾实体的序列。本发明提升了三元组补全的精确率。
-
公开(公告)号:CN119761371A
公开(公告)日:2025-04-04
申请号:CN202411883141.2
申请日:2024-12-19
Applicant: 电信科学技术第五研究所有限公司
IPC: G06F40/295 , G06F40/216 , G06F16/36 , G06F18/22
Abstract: 本发明公开了一种基于大语言模型的实体链接方法、装置、设备及存储介质,包括:构建问题文本和知识图谱;根据知识图谱中的实体计算知识图谱中实体的实体嵌入表示和一阶子图嵌入表示;对问题文本进行编码,得到文本嵌入表示;将实体嵌入表示和一阶子图嵌入表示进行拼接,得到嵌入表示拼接;对知识图谱中所有实体对应的嵌入表示拼接和文本嵌入表示依次进行相似度计算,得到相似度计算结果;基于argmax函数对知识图谱中所有实体进行筛选,输出预设数量个相似度计算结果排名靠前的问题文本中实体作为候选实体;将候选实体输入大语言模型,输出与问题文本中的实体最相关的候选实体。本发明避免了额外模型进行实体识别、实体消歧操作以及大量数据训练。
-
-
-
-
-