-
公开(公告)号:CN112528676B
公开(公告)日:2022-07-08
申请号:CN202011506990.8
申请日:2020-12-18
Applicant: 南开大学
IPC: G06F40/30 , G06F40/211 , G06N3/04
Abstract: 本发明提出了一种文档级别的事件论元抽取方法,本发明公开的方法是以非结构化的文档文本作为输入数据,构建基于深度学习的文档级别事件论元抽取模型,包含两个阶段,一个预训练阶段用于微调训练好的文本表示模型,一个抽取模型的训练和预测阶段用于学习各类事件角色的特征和生成预测结果,在两个阶段中均利用了事件角色的语义信息作为文本特征的扩充,以生成更加准确的事件论元抽取结果。对于普遍使用的文档级别事件论元抽取数据集,本发明的方法效果显著优于目前现有的文档级别事件论元抽取方法,证明事件角色的语义信息有助于从文档中进行事件论元的抽取。
-
公开(公告)号:CN112528676A
公开(公告)日:2021-03-19
申请号:CN202011506990.8
申请日:2020-12-18
Applicant: 南开大学
IPC: G06F40/30 , G06F40/211 , G06N3/04
Abstract: 本发明提出了一种文档级别的事件论元抽取方法,本发明公开的方法是以非结构化的文档文本作为输入数据,构建基于深度学习的文档级别事件论元抽取模型,包含两个阶段,一个预训练阶段用于微调训练好的文本表示模型,一个抽取模型的训练和预测阶段用于学习各类事件角色的特征和生成预测结果,在两个阶段中均利用了事件角色的语义信息作为文本特征的扩充,以生成更加准确的事件论元抽取结果。对于普遍使用的文档级别事件论元抽取数据集,本发明的方法效果显著优于目前现有的文档级别事件论元抽取方法,证明事件角色的语义信息有助于从文档中进行事件论元的抽取。
-