一种中文事件的处理方法及系统

    公开(公告)号:CN104156352B

    公开(公告)日:2017-04-19

    申请号:CN201410403486.3

    申请日:2014-08-15

    Applicant: 苏州大学

    Abstract: 本发明公开了一种中文事件的处理方法及系统,方法包括:对原始文本内文档的语句进行分析,得到依存和句法文档集合;依据事件抽取请求数据抽取种子事件模板,得到种子事件模板集合;在依存和句法文档集合中,依据触发词选取规则选择候选触发词,得到候选触发词集合;依据依存和句法文档集合中依存关系信息,将候选触发词集合的候选触发词与其所属语句中的实体进行两两组合,得到多个候选事件模板,所有候选事件模板组成候选事件模板集合;依据语义信息集合及种子事件模板集合,对候选事件模板集合中满足模板删除规则的候选事件模板进行删除,得到过滤模板集合;对过滤模板集合中的每个候选事件模板进行语句结构转换,得到最终候选事件模板集合。

    一种车辆到站时间的获取方法及系统

    公开(公告)号:CN104123841B

    公开(公告)日:2016-08-24

    申请号:CN201410399025.3

    申请日:2014-08-14

    Applicant: 苏州大学

    Abstract: 本发明公开了一种车辆到站时间的获取方法及系统,从日期、时段及路段三维信息入手,根据车辆到站时间波动性,将待预测的目标路段分成不同的路段,对每个路段进行车辆到站时间的分段预测,最终获取到待预测的目标线路在目标路段上车辆到达路段终点的时间,在达到本发明目的的同时,相对于现有的时间获取方案,基于车辆到站时间的波动性进行到站时间获取,明显提高时间获取的准确性,而且,本发明利用向量机对象对作为训练记录的路线记录生成每个路段的预测运行时间,进而得到车辆到站时间,简化方案的复杂度,降低方案运行时间,提高车辆到站时间的获取效率。

    一种面向云计算的租户调整方法及系统

    公开(公告)号:CN104135535A

    公开(公告)日:2014-11-05

    申请号:CN201410399793.9

    申请日:2014-08-14

    Applicant: 苏州大学

    Abstract: 本发明公开了一种面向云计算的租户调整方法及系统,通过基于SLA中多种效益的计算,当出现一个或多个虚拟机不满足负载需求时,对这些调整虚拟机上的租户的分布进行调整,在保证系统效益的情况下,将租户迁移至其他虚拟机上,实现本发明目的。本发明通过动态调整每个虚拟机中的租户,使得在有限数据库资源的情况下,保证租户的SLA质量需求及良好的系统效益。

    中文事件触发词的扩展方法及系统

    公开(公告)号:CN102831236A

    公开(公告)日:2012-12-19

    申请号:CN201210321193.1

    申请日:2012-09-03

    Applicant: 苏州大学

    Abstract: 本发明实施例公开了一种中文事件触发词的扩展方法及系统,本方法利用已知触发词形态结构,结合义原相似度来扩展未知触发词,这样待抽取事件的触发词就包括已知触发词以及扩展的未知触发词,这样在抽取事件实例时,不仅可以抽取已知触发词对应的事件实例,还可以抽取扩展的未知触发词对应的事件实例。进一步的,在抽取事件时,能够识别出更多的事件实例,提高事件抽取系统的召回率。

    文本信息抽取方法和系统

    公开(公告)号:CN102298642B

    公开(公告)日:2012-09-05

    申请号:CN201110273322.X

    申请日:2011-09-15

    Applicant: 苏州大学

    Abstract: 本发明实施例公开了一种文本信息抽取方法,实现从文本中抽取某种现象或某个事件产生的原因信息;其方法根据原因种子对对从互联网中采集的语句进行分析,生成原因句抽取模式,并利用依存关系和依存路径表示原因句的抽取模式,再基于该抽取模式来抽取原因信息,抽取过程大大减少了人工成本;且以抽取的原因句和非原因句作为训练样本,训练一个支持向量机分类器在未分类的语句中进一步识别原因句,从而提高了性能;本发明还公开了一种文本信息抽取系统,用于抽取文本中某种现象或某个事件产生的原因的信息。

    一种自然语言句子的语义关系树的构造和比较方法

    公开(公告)号:CN101446944A

    公开(公告)日:2009-06-03

    申请号:CN200810243607.7

    申请日:2008-12-10

    Applicant: 苏州大学

    Abstract: 本发明公开了一种自然语言句子的语义关系树的构造方法,其特征在于,对于句子中待建立语义关系树的两个实体,首先构建最短路径包含树;如果两实体之间的结构类型不是谓词结构,则最短路径包含树即为所需的语义关系树;如果两实体之间的结构类型是谓词链接结构,则扩展与谓词相关的上下文信息,得到上下文相关的路径包含树,作为语义关系树。本发明的方法获得的语义关系树,既能涵盖关键的结构化句法信息,又能减少不必要的噪音,能在基本不影响关系抽取速度的前提下,提高关系抽取的性能;采用该语义关系树进行比较,结果更具有普遍性。

    一种自然语言句子的语义角色标注方法

    公开(公告)号:CN101446942A

    公开(公告)日:2009-06-03

    申请号:CN200810243605.8

    申请日:2008-12-10

    Applicant: 苏州大学

    Abstract: 本发明公开了一种自然语言句子的语义角色标注方法,其特征在于:采用联合学习模型,同时实现中文句法分析和语义角色标注。本发明通过联合模型的使用,能够同时输出一个句子的句法分析结果和给定谓词的语义角色标注结果。在联合学习模型中,由于句法分析模型中增加了语义信息,使得训练出来的模型更适合于语义角色标注任务,因此由此模型输出的语义角色标注性能更高。同时联合模型输出的句法分析结果同单个句法分析模型的结果相比,两者性能不会有很大差别,甚至由于语义信息的加入,还能够提高句法分析的性能。

    一种基于历史信息的自然语言层次句法分析方法

    公开(公告)号:CN101446941A

    公开(公告)日:2009-06-03

    申请号:CN200810243604.3

    申请日:2008-12-10

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于历史信息的自然语言层次句法分析方法,其特征在于:对已完成分词的句子,首先将各个词看成是初始组块,采用分层方式,根据上下文信息进行组块识别,将可以组合的组块构成新的组块,获得中间结果,对中间结果重复根据上下文信息进行组块识别及组合,直至只包含一个组块为止,该组块为句法树的根结点,由此获得表达自然语言的句法树。本发明在每层处理过程中,优先识别出容易识别的组块,能提供更丰富的上下文信息进行复杂组块识别,提高决策预测的正确率,从而提高了句法分析的性能。

    英文事件同指消解方法和系统

    公开(公告)号:CN109359184B

    公开(公告)日:2020-08-18

    申请号:CN201811203139.0

    申请日:2018-10-16

    Applicant: 苏州大学

    Abstract: 本发明公开了一种英文事件同指消解方法和系统。本发明英文事件同指消解方法,包括:读取标注文档的事件标注信息,得到标注语料事件集合;统计标注语料事件集合中文档ID、同指ID、事件句ID、事件句类型、事件句子类型、事件句形态以及触发词的起始位置,得到事件句信息集合。本发明的有益效果:利用从事件句中抽取的信息特征和事件对匹配特征,采用循环神经网络对事件对之间的同指关系进行判定;本发明采用循环神经网络模型,利用深度学习来解决事件同指消解问题;本发明的方法和系统,与现有的方法和系统相比,英文事件同指消解性能得到了明显提升。

    一种中文事件事实性识别方法和系统

    公开(公告)号:CN106844448B

    公开(公告)日:2020-05-15

    申请号:CN201611170133.9

    申请日:2016-12-16

    Applicant: 苏州大学

    Abstract: 本发明涉及一种中文事件事实性识别方法和系统,利用事件事实性信息和它们之间的联系,采用机器学习和推理相结合的方法来识别中文事件的事实性。本发明的方法和系统,与现有的方法和系统相比,总体的识别性能有所提升,同时,在处理类别的不均衡问题上有更好的效果,尤其在事件数目较少的类别的事实性识别上有明显的性能提升。

Patent Agency Ranking