基于领域全标签体系的法律文书要素信息提取方法和装置

    公开(公告)号:CN117236440A

    公开(公告)日:2023-12-15

    申请号:CN202311303656.6

    申请日:2023-10-09

    Applicant: 清华大学

    Abstract: 本申请提出了一种基于领域全标签体系的法律文书要素信息提取方法,涉及自然语言处理技术领域。其中,该方法包括:提取法律法规和关键法律文献中的要素信息,并基于提取出的要素信息构建标签体系;基于标签体系和要素信息建立要素之间的关系,并将要素之间的关系整合得到知识图谱;使用标注数据集训练事件抽取模型,并通过训练后的事件抽取模型提取法律文书的要素信息,其中,标注数据集是基于所述知识图谱、标注规则对已有公开法律文书数据集的文档进行标注后生成的。采用上述方案的本发明实现了法律文本的要素提取。

Patent Agency Ranking