-
公开(公告)号:CN119692329A
公开(公告)日:2025-03-25
申请号:CN202411529322.5
申请日:2024-10-30
Applicant: 北京理工大学
IPC: G06F40/205 , G06F40/226 , G06F40/284 , G06F40/117 , G06N5/04 , G06N3/08 , G06F16/35
Abstract: 一种基于平衡化标签的文档级关系抽取方法,属于自然语言处理领域中的关系抽取领域。本发明实现方法为:收集应用领域的文档数据和领域关注的实体间的关系。基于实体类型和实体在关系语义中的位置,排列组合得到平衡化关系标签加入关系标签集,标注文档数据集实体间存在的关系标签。搭建文档级关系抽取模型,选取基座编码模型,增加三线性池化模块融合主语实体、宾语实体和相关上下文的表示,提高上下文在推理时占的权重。构建改进文档级关系抽取模型训练的损失函数,提高文档级关系抽取模型推理得到的关系标签的置信分数。训练文档级关系抽取模型,选取表现最好的文档级关系抽取模型用于实际应用,提高文档级实体关系抽取的准确率。