-
公开(公告)号:CN119848189A
公开(公告)日:2025-04-18
申请号:CN202411781069.2
申请日:2024-12-05
Applicant: 中国地质大学(武汉)
IPC: G06F16/3329 , G06F16/35 , G06F16/36 , G06N3/0442
Abstract: 本发明公开一种司法文本的实体和关系抽取方法、系统、介质、设备,涉及实体抽取技术领域,方法包括:对司法文本的实体进行标注,得到真值标签;构建实体抽取模块、事件抽取模块、微调大模型抽取模块;微调大模型抽取模块分为生成任务和分类任务,基于司法文本,分别得到实体补充数据和伪标签;实体抽取模块基于司法文本、补充数据,以真值标签和伪标签作为监督进行实体抽取;事件抽取模块根据实体抽取模块已抽取的实体、司法文本、补充数据,以真值标签和伪标签作为监督进行事件抽取,并提取事件中的关系,帮助案情分析。本发明能为低频实体类别提供更多样本,并提升模型对易混淆实体的区分能力,基于实体提取关系,便于快速分析案情。