一种司法文本的实体和关系抽取方法、系统、介质、设备

    公开(公告)号:CN119848189A

    公开(公告)日:2025-04-18

    申请号:CN202411781069.2

    申请日:2024-12-05

    Inventor: 梁庆中 冷思涵

    Abstract: 本发明公开一种司法文本的实体和关系抽取方法、系统、介质、设备,涉及实体抽取技术领域,方法包括:对司法文本的实体进行标注,得到真值标签;构建实体抽取模块、事件抽取模块、微调大模型抽取模块;微调大模型抽取模块分为生成任务和分类任务,基于司法文本,分别得到实体补充数据和伪标签;实体抽取模块基于司法文本、补充数据,以真值标签和伪标签作为监督进行实体抽取;事件抽取模块根据实体抽取模块已抽取的实体、司法文本、补充数据,以真值标签和伪标签作为监督进行事件抽取,并提取事件中的关系,帮助案情分析。本发明能为低频实体类别提供更多样本,并提升模型对易混淆实体的区分能力,基于实体提取关系,便于快速分析案情。

Patent Agency Ranking