-
公开(公告)号:CN118917306A
公开(公告)日:2024-11-08
申请号:CN202411026092.0
申请日:2024-07-30
Applicant: 重庆邮电大学
IPC: G06F40/279 , G06F40/289 , G06F40/126 , G06F40/30 , G06F16/36 , G06N3/084 , G06N20/00 , G06N5/022 , G06Q50/18
Abstract: 本发明属于文本处理技术领域,特别涉及一种基于全局指针的法律文书敏感关系识别方法,包括对法律文书数据进行分句处理,并对每一条文本进行实体关系抽取得到实体关系数据;对实体关系数据进行预处理和增强处理得到增强数据;采用数据加载器处理增强数据得到标准数据用于预训练BERT模型;将BERT模型参数作为GPLinker模型的初始参数,采用预训练的BERT模型编码标准数据去训练GPLinker模型;将BERT模型与GPLinker模型构建法律文书敏感关系识别模型;对法律文书敏感关系识别模型进行五折交叉验证得到最优模型,采用最优模型进行识别;本发明能够实现自动化地从大量法律文书中精准提取实体关系。