-
公开(公告)号:CN112966525B
公开(公告)日:2023-02-10
申请号:CN202110349911.5
申请日:2021-03-31
Applicant: 上海大学
IPC: G06F40/30 , G06F16/906 , G06F16/951 , G06F40/211 , G06F40/284 , G06N3/04 , G06N3/08 , G06Q50/18
Abstract: 本发明公开了一种基于预训练模型和卷积神经网络算法的法律领域事件抽取方法,使用网络爬虫爬取公开法律文本语料,对原始语料进行文本预处理,获得可用的法律文本语料数据;获取法律领域的高频动词、关键名词,对词语进行聚类;构建原始法律事件知识库IE,在此基础上利用远程监督学习的方式实现法律事件语料数据的大规模自动标注;使用获得的大规模法律事件预料数据,实现基于NEZHA预训练语料模型和DMCNN卷积神经网络模型实现法律事件抽取系统。本发明通过基于远程监督学习的方式实现法律事件语料数据的大规模自动标注,利用预训练语言模型和卷积神经网络算法挖掘法律文本数据的深层语义信息,在法律事件抽取任务上的取得了较好的效果。
-
公开(公告)号:CN112966525A
公开(公告)日:2021-06-15
申请号:CN202110349911.5
申请日:2021-03-31
Applicant: 上海大学
IPC: G06F40/30 , G06F16/906 , G06F16/951 , G06F40/211 , G06F40/284 , G06N3/04 , G06N3/08 , G06Q50/18
Abstract: 本发明公开了一种基于预训练模型和卷积神经网络算法的法律领域事件抽取方法,使用网络爬虫爬取公开法律文本语料,对原始语料进行文本预处理,获得可用的法律文本语料数据;获取法律领域的高频动词、关键名词,对词语进行聚类;构建原始法律事件知识库IE,在此基础上利用远程监督学习的方式实现法律事件语料数据的大规模自动标注;使用获得的大规模法律事件预料数据,实现基于NEZHA预训练语料模型和DMCNN卷积神经网络模型实现法律事件抽取系统。本发明通过基于远程监督学习的方式实现法律事件语料数据的大规模自动标注,利用预训练语言模型和卷积神经网络算法挖掘法律文本数据的深层语义信息,在法律事件抽取任务上的取得了较好的效果。
-