英文事件触发词抽取方法和系统

    公开(公告)号:CN109325228B

    公开(公告)日:2023-02-10

    申请号:CN201811093486.2

    申请日:2018-09-19

    Applicant: 苏州大学

    Abstract: 本发明涉及一种英文事件触发词抽取方法,包括:读取标注文档的实体标注信息和事件标注信息,对标注文档中的每一个事件句调用词形还原工具进行词形还原,分别得到标注语料实体集合、标注语料事件集合和词形还原文档集合;对标注语料事件集合中每个触发词,匹配词形还原文档集合中的词原形。上述英文事件触发词抽取方法,基于论元预测的事件触发词抽取系统和方法,将预测的论元和句子转化成词向量,利用循环神经网络自动的捕获触发词和论元之间的隐含特征,以及论元的深层语义信息。本发明的方法和系统,与现有方法和系统相比,触发词抽取性能得到了提升。

    一种中文事件联合推理方法

    公开(公告)号:CN106055536B

    公开(公告)日:2018-08-21

    申请号:CN201610333246.X

    申请日:2016-05-19

    Applicant: 苏州大学

    Abstract: 本发明提出篇章级别的中文事件联合推理方法和系统,该方法和系统能利用论元抽取中有价值的信息来反过来帮助触发词抽取,减少传统管道模型中的级联错误。在实现方法上,本发明采用机器学习和推理相结合的方法,利用各种语言知识来识别中文事件时序关系。本发明的方法和系统,与现有方法和系统相比,识别性能得到了一定提升。

    一种中文同指事件识别方法及系统

    公开(公告)号:CN105302794B

    公开(公告)日:2018-08-07

    申请号:CN201510726584.5

    申请日:2015-10-30

    Applicant: 苏州大学

    Abstract: 种中文同指事件识别方法及系统,所述方法包括:对同指标注文本和测试文本中每个包含事件的句子进行词语切分、实体识别和句法分析,得到预处理标注文本集合和预处理测试文本集合,并分别从预处理标注文本集合和预处理测试文本集合中以文档为单位抽取事件类型相同的事件对及其特征信息,得到标注文本特征集合和测试文本特征集合。根据标注文本特征集合中各个事件对的特征,训练个同指事件识别模型;再利用同指事件识别模型判别测试文本特征集合中每个特征对应的事件对是否存在同指关系,得到事件同指第集合。对事件同指第集合中初步识别的同指事件结果以文档为单位进行全局优化,得到事件同指集合。如此,提高了同指事件识别的性能。

    一种中文事件事实性识别方法和系统

    公开(公告)号:CN106844448A

    公开(公告)日:2017-06-13

    申请号:CN201611170133.9

    申请日:2016-12-16

    Applicant: 苏州大学

    Abstract: 本发明涉及一种中文事件事实性识别方法和系统,利用事件事实性信息和它们之间的联系,采用机器学习和推理相结合的方法来识别中文事件的事实性。本发明的方法和系统,与现有的方法和系统相比,总体的识别性能有所提升,同时,在处理类别的不均衡问题上有更好的效果,尤其在事件数目较少的类别的事实性识别上有明显的性能提升。

    事件信息融合方法和系统

    公开(公告)号:CN102298635B

    公开(公告)日:2013-09-04

    申请号:CN201110269307.8

    申请日:2011-09-13

    Applicant: 苏州大学

    Abstract: 本发明公开了一种事件信息融合方法和系统,用于对事件信息进行抽取、补全、事件聚类和融合,形成事件信息完整度高的完备事件。本发明实施例方法包括:生成包括多个事件的初选事件集合;比较初选事件集中的事件与事件抽取模式的相似度,形成候选事件集合;甄别和标注候选事件集合,生成训练样本,通过训练样本生成相关事件推理规则、零指代消解模型、事件识别和抽取模型、论元识别和抽取模型;从待抽取完备事件的网页中获取网页正文,生成事件标注正文,对存在结构缺失的子句进行结构补全,生成事件补全标注正文;抽取事件补全标注正文的事件实例和事件论元,得到第一事件集合;对第一事件集合的事件实例进行聚类,再进行归一化,生成完备事件。

    英文事件同指消解方法和系统

    公开(公告)号:CN109359184A

    公开(公告)日:2019-02-19

    申请号:CN201811203139.0

    申请日:2018-10-16

    Applicant: 苏州大学

    Abstract: 本发明公开了一种英文事件同指消解方法和系统。本发明英文事件同指消解方法,包括:读取标注文档的事件标注信息,得到标注语料事件集合;统计标注语料事件集合中文档ID、同指ID、事件句ID、事件句类型、事件句子类型、事件句形态以及触发词的起始位置,得到事件句信息集合。本发明的有益效果:利用从事件句中抽取的信息特征和事件对匹配特征,采用循环神经网络对事件对之间的同指关系进行判定;本发明采用循环神经网络模型,利用深度学习来解决事件同指消解问题;本发明的方法和系统,与现有的方法和系统相比,英文事件同指消解性能得到了明显提升。

    一种中文事件同指消解方法

    公开(公告)号:CN106021229B

    公开(公告)日:2018-11-02

    申请号:CN201610333173.4

    申请日:2016-05-19

    Applicant: 苏州大学

    Abstract: 本发明提出篇章级别的中文事件同指消解方法和系统,该方法和系统能利用篇章知识来识别文档中的事件同指关系。在实现方法上,本发明采用机器学习、全局优化和联合学习推理相结合的方法,利用中文语言知识进行事件同指消解。本发明的中文事件同指消解方法和系统,与现有方法和系统相比,消解性能得到了明显提升。

    一种中文事件同指消解方法和系统

    公开(公告)号:CN106021229A

    公开(公告)日:2016-10-12

    申请号:CN201610333173.4

    申请日:2016-05-19

    Applicant: 苏州大学

    CPC classification number: G06F17/271

    Abstract: 本发明提出篇章级别的中文事件同指消解方法和系统,该方法和系统能利用篇章知识来识别文档中的事件同指关系。在实现方法上,本发明采用机器学习、全局优化和联合学习推理相结合的方法,利用中文语言知识进行事件同指消解。本发明的中文事件同指消解方法和系统,与现有方法和系统相比,消解性能得到了明显提升。

    一种中文事件触发词的抽取系统及方法

    公开(公告)号:CN104331480A

    公开(公告)日:2015-02-04

    申请号:CN201410626003.6

    申请日:2014-11-07

    Applicant: 苏州大学

    CPC classification number: G06F17/30731 G06F17/271

    Abstract: 本发明提供一种中文事件触发词的抽取系统及方法。所述系统包括句法和依存分析模块、核心和辅助角色定义模块、训练语料特征抽取模块、候选触发词抽取模块、基本特征抽取模块、训练集模板抽取模块、候选模板抽取模块、实体特征抽取模块及触发词识别模块。本发明根据角色语义是事件语义的表示形式之一,提供了利用核心角色和辅助角色来表示角色语义的方法,并用于中文事件触发词的抽取。与现有最好的中文事件抽取方法和系统相比,本发明提供的方法对于中文事件触发词的抽取性能有了明显提升。

Patent Agency Ranking