-
公开(公告)号:CN109325228B
公开(公告)日:2023-02-10
申请号:CN201811093486.2
申请日:2018-09-19
Applicant: 苏州大学
IPC: G06F40/284 , G06F40/211 , G06F40/30
Abstract: 本发明涉及一种英文事件触发词抽取方法,包括:读取标注文档的实体标注信息和事件标注信息,对标注文档中的每一个事件句调用词形还原工具进行词形还原,分别得到标注语料实体集合、标注语料事件集合和词形还原文档集合;对标注语料事件集合中每个触发词,匹配词形还原文档集合中的词原形。上述英文事件触发词抽取方法,基于论元预测的事件触发词抽取系统和方法,将预测的论元和句子转化成词向量,利用循环神经网络自动的捕获触发词和论元之间的隐含特征,以及论元的深层语义信息。本发明的方法和系统,与现有方法和系统相比,触发词抽取性能得到了提升。
-
公开(公告)号:CN106055536B
公开(公告)日:2018-08-21
申请号:CN201610333246.X
申请日:2016-05-19
Applicant: 苏州大学
Abstract: 本发明提出篇章级别的中文事件联合推理方法和系统,该方法和系统能利用论元抽取中有价值的信息来反过来帮助触发词抽取,减少传统管道模型中的级联错误。在实现方法上,本发明采用机器学习和推理相结合的方法,利用各种语言知识来识别中文事件时序关系。本发明的方法和系统,与现有方法和系统相比,识别性能得到了一定提升。
-
公开(公告)号:CN105302794B
公开(公告)日:2018-08-07
申请号:CN201510726584.5
申请日:2015-10-30
Applicant: 苏州大学
IPC: G06F17/27
Abstract: 种中文同指事件识别方法及系统,所述方法包括:对同指标注文本和测试文本中每个包含事件的句子进行词语切分、实体识别和句法分析,得到预处理标注文本集合和预处理测试文本集合,并分别从预处理标注文本集合和预处理测试文本集合中以文档为单位抽取事件类型相同的事件对及其特征信息,得到标注文本特征集合和测试文本特征集合。根据标注文本特征集合中各个事件对的特征,训练个同指事件识别模型;再利用同指事件识别模型判别测试文本特征集合中每个特征对应的事件对是否存在同指关系,得到事件同指第集合。对事件同指第集合中初步识别的同指事件结果以文档为单位进行全局优化,得到事件同指集合。如此,提高了同指事件识别的性能。
-
-
公开(公告)号:CN102298635B
公开(公告)日:2013-09-04
申请号:CN201110269307.8
申请日:2011-09-13
Applicant: 苏州大学
IPC: G06F17/30
Abstract: 本发明公开了一种事件信息融合方法和系统,用于对事件信息进行抽取、补全、事件聚类和融合,形成事件信息完整度高的完备事件。本发明实施例方法包括:生成包括多个事件的初选事件集合;比较初选事件集中的事件与事件抽取模式的相似度,形成候选事件集合;甄别和标注候选事件集合,生成训练样本,通过训练样本生成相关事件推理规则、零指代消解模型、事件识别和抽取模型、论元识别和抽取模型;从待抽取完备事件的网页中获取网页正文,生成事件标注正文,对存在结构缺失的子句进行结构补全,生成事件补全标注正文;抽取事件补全标注正文的事件实例和事件论元,得到第一事件集合;对第一事件集合的事件实例进行聚类,再进行归一化,生成完备事件。
-
公开(公告)号:CN109359184A
公开(公告)日:2019-02-19
申请号:CN201811203139.0
申请日:2018-10-16
Applicant: 苏州大学
IPC: G06F16/332 , G06F16/35
Abstract: 本发明公开了一种英文事件同指消解方法和系统。本发明英文事件同指消解方法,包括:读取标注文档的事件标注信息,得到标注语料事件集合;统计标注语料事件集合中文档ID、同指ID、事件句ID、事件句类型、事件句子类型、事件句形态以及触发词的起始位置,得到事件句信息集合。本发明的有益效果:利用从事件句中抽取的信息特征和事件对匹配特征,采用循环神经网络对事件对之间的同指关系进行判定;本发明采用循环神经网络模型,利用深度学习来解决事件同指消解问题;本发明的方法和系统,与现有的方法和系统相比,英文事件同指消解性能得到了明显提升。
-
-
-
公开(公告)号:CN106021229A
公开(公告)日:2016-10-12
申请号:CN201610333173.4
申请日:2016-05-19
Applicant: 苏州大学
IPC: G06F17/27
CPC classification number: G06F17/271
Abstract: 本发明提出篇章级别的中文事件同指消解方法和系统,该方法和系统能利用篇章知识来识别文档中的事件同指关系。在实现方法上,本发明采用机器学习、全局优化和联合学习推理相结合的方法,利用中文语言知识进行事件同指消解。本发明的中文事件同指消解方法和系统,与现有方法和系统相比,消解性能得到了明显提升。
-
公开(公告)号:CN104331480A
公开(公告)日:2015-02-04
申请号:CN201410626003.6
申请日:2014-11-07
Applicant: 苏州大学
CPC classification number: G06F17/30731 , G06F17/271
Abstract: 本发明提供一种中文事件触发词的抽取系统及方法。所述系统包括句法和依存分析模块、核心和辅助角色定义模块、训练语料特征抽取模块、候选触发词抽取模块、基本特征抽取模块、训练集模板抽取模块、候选模板抽取模块、实体特征抽取模块及触发词识别模块。本发明根据角色语义是事件语义的表示形式之一,提供了利用核心角色和辅助角色来表示角色语义的方法,并用于中文事件触发词的抽取。与现有最好的中文事件抽取方法和系统相比,本发明提供的方法对于中文事件触发词的抽取性能有了明显提升。
-
-
-
-
-
-
-
-
-