-
公开(公告)号:CN116842949A
公开(公告)日:2023-10-03
申请号:CN202310612524.5
申请日:2023-05-29
Applicant: 北京大学
IPC: G06F40/295 , G06F40/216 , G06F40/30 , G06F16/35
Abstract: 本申请涉及数据处理技术领域,提供一种事件提取方法、装置、电子设备和存储介质,该方法包括:基于提示学习,确定候选触发词集合和论元集合;基于所述候选触发词集合和所述论元集合,构建事件异构图;对所述事件异构图中的节点进行聚类,并对聚类后的聚类簇进行标签命名,以生成事件模式;基于所述事件模式进行事件抽取。本申请基于提示学习直接生成事件的触发词和论元,无须外部知识库和人工规则,同时通过构建事件异构图强化事件内部和事件之间的信息交互,在不使用使用预定义事件模板的情况下,可以自动生成事件模式,提高了事件抽取的准确性和效率。
-
公开(公告)号:CN116049398A
公开(公告)日:2023-05-02
申请号:CN202211717078.6
申请日:2022-12-29
Applicant: 北京大学
Abstract: 本发明提供一种实体关系抽取方法、装置、设备及介质,包括:基于待识别文档的目标实体对以及待识别关系,确定包含所述目标实体对与所述待识别关系之间的映射关系的三维数据结构;基于所述三维数据结构,使用三重注意力机制分别捕获所述三维数据结构在不同语义空间下的交互特征;基于所述交互特征,确定所述目标实体对的关系类别概率;其中,所述关系类别概率用于确定所述目标实体对所属的语义关系类型,所述三重注意力机制的卷积层采用形变卷积。本发明用以解决现有技术中文档的实体关系推理的准确性不够高的缺陷,实现一种更准确的文档的实体关系抽取方法,提升文档的所有信息的关系推理能力。
-
公开(公告)号:CN115965024A
公开(公告)日:2023-04-14
申请号:CN202211669180.3
申请日:2022-12-23
Applicant: 北京大学
IPC: G06F40/295 , G06F40/30 , G06F16/33 , G06F16/335 , G06F16/35 , G06N3/044
Abstract: 本发明提供一种实体消歧方法、装置、设备及计算机可读存储介质,该方法包括:从自然语言文本中抽取命名实体;构建知识库中的候选实体与所述命名实体之间的实体链接;对各所述候选实体进行评分排序;基于排序结果确定各所述候选实体中的知识库实体,以消除所述命名实体的歧义。本发明提高了实体消歧的准确性,以及对语句进行语义理解的准确性。
-
公开(公告)号:CN115964511A
公开(公告)日:2023-04-14
申请号:CN202211667610.8
申请日:2022-12-23
Applicant: 北京大学
Abstract: 本发明提供一种知识图谱补全方法、装置、设备及计算机可读存储介质,该方法包括:基于待处理知识图谱确定实体和关系对应的空间向量;通过所述空间向量捕获语义信息,得到所述实体之间的新关系;基于所述实体之间的新关系补全所述待处理知识图谱。本发明通过待处理知识图谱确定实体和关系对应的空间向量,继而通过实体和关系对应的空间向量捕获语义信息,得到实体之间的新关系,最后基于实体之间的新关系补全待处理知识图谱,对现有的知识图谱进行完善,获得富含知识更加丰富的知识图谱。
-
-
-