-
公开(公告)号:CN116910271A
公开(公告)日:2023-10-20
申请号:CN202310931506.3
申请日:2023-07-27
Applicant: 杭州电子科技大学
IPC: G06F16/36 , G06F16/332 , G06F16/28 , G06F16/33 , G06N3/08
Abstract: 本发明公开了基于嵌入式学习的知识图谱的实体关系优化方法。本发明方法将原始知识图谱的三元组视作节点,并且添加了一组虚拟的关系节点;利用加权方法保证三元组线图中两个节点的三元组中的关系越相关,这些节点之间的边的权值就越高;将三元组通过深度学习模型所获的每一关系的置信度映射成每个三元组节点对于关系节点的权重,使得在拓扑结构中分布较远的三元组通过同享相似的关系而变得更加接近。在嵌入空间中,能够捕捉实体与语义的相似性以及推断三元组关系的正确性,为可信性低的三元组进行关系推荐,并结合人机交互的方式进行三元组的关系校正,使用校正后数据对深度学习模型进行迭代优化,提升了深度学习模型的关系抽取结果的质量。
-
公开(公告)号:CN116702897A
公开(公告)日:2023-09-05
申请号:CN202310746512.1
申请日:2023-06-25
Applicant: 浙江浙能数字科技有限公司 , 杭州电子科技大学
IPC: G06N5/02 , G06F18/23213 , G06N3/0442 , G06N3/08 , G06F40/30 , G06Q50/06
Abstract: 本发明涉及一种基于文本挖掘的实体发现方法,包括:选择一个文本子集;进行实体抽取,并将抽取结果与真实标注进行比较;根据抽取结果和真实标注之间的差异,随机采样出需要进行人工标注的候选数据;人工打标候选数据;使用已标注数据训练实体抽取模型,并返回实体抽取步骤进行选代训练和标注。本发明的有益效果是:本发明在实体发现过程中,能够有效地选择需要标注的未标注语料样本,用于增加已标注数据,同时通过利用已有的标注数据,不断地迭代训练和标注实体抽取模型,以达到提高模型精度的目的;进而,本发明可以提高实体抽取模型的精度,减少人工标注数据的数量和时间成本,提高实体抽取的自动化程度。
-