文本信息抽取方法和系统
    51.
    发明授权

    公开(公告)号:CN102298642B

    公开(公告)日:2012-09-05

    申请号:CN201110273322.X

    申请日:2011-09-15

    Applicant: 苏州大学

    Abstract: 本发明实施例公开了一种文本信息抽取方法,实现从文本中抽取某种现象或某个事件产生的原因信息;其方法根据原因种子对对从互联网中采集的语句进行分析,生成原因句抽取模式,并利用依存关系和依存路径表示原因句的抽取模式,再基于该抽取模式来抽取原因信息,抽取过程大大减少了人工成本;且以抽取的原因句和非原因句作为训练样本,训练一个支持向量机分类器在未分类的语句中进一步识别原因句,从而提高了性能;本发明还公开了一种文本信息抽取系统,用于抽取文本中某种现象或某个事件产生的原因的信息。

    基于微博的情感词提取收集方法

    公开(公告)号:CN102279890A

    公开(公告)日:2011-12-14

    申请号:CN201110258876.2

    申请日:2011-09-02

    Applicant: 苏州大学

    Abstract: 本发明实施例公开了一种基于微博的情感词提取收集方法,其步骤包括:接收情绪图标,并获取与所述情绪图标相对应的情绪图标极性;利用所述情绪图标以及主题关键词搜索并收集微博语料;根据所述情绪图标极性对微博语料进行情感分类;对所述微博语料进行分词,并获取所述词的词性标注;使用特征提取方法从所述微博语料中提取情感词,并收集;本实施例提供的提取收集方法利于保障提取收集的情感词的规模和时效性,同时也大大提高了收集的情感词的正确率。

    一种自然语言句子的语义关系树的构造和比较方法

    公开(公告)号:CN101446944A

    公开(公告)日:2009-06-03

    申请号:CN200810243607.7

    申请日:2008-12-10

    Applicant: 苏州大学

    Abstract: 本发明公开了一种自然语言句子的语义关系树的构造方法,其特征在于,对于句子中待建立语义关系树的两个实体,首先构建最短路径包含树;如果两实体之间的结构类型不是谓词结构,则最短路径包含树即为所需的语义关系树;如果两实体之间的结构类型是谓词链接结构,则扩展与谓词相关的上下文信息,得到上下文相关的路径包含树,作为语义关系树。本发明的方法获得的语义关系树,既能涵盖关键的结构化句法信息,又能减少不必要的噪音,能在基本不影响关系抽取速度的前提下,提高关系抽取的性能;采用该语义关系树进行比较,结果更具有普遍性。

    一种自然语言句子的语义角色标注方法

    公开(公告)号:CN101446942A

    公开(公告)日:2009-06-03

    申请号:CN200810243605.8

    申请日:2008-12-10

    Applicant: 苏州大学

    Abstract: 本发明公开了一种自然语言句子的语义角色标注方法,其特征在于:采用联合学习模型,同时实现中文句法分析和语义角色标注。本发明通过联合模型的使用,能够同时输出一个句子的句法分析结果和给定谓词的语义角色标注结果。在联合学习模型中,由于句法分析模型中增加了语义信息,使得训练出来的模型更适合于语义角色标注任务,因此由此模型输出的语义角色标注性能更高。同时联合模型输出的句法分析结果同单个句法分析模型的结果相比,两者性能不会有很大差别,甚至由于语义信息的加入,还能够提高句法分析的性能。

    一种基于历史信息的自然语言层次句法分析方法

    公开(公告)号:CN101446941A

    公开(公告)日:2009-06-03

    申请号:CN200810243604.3

    申请日:2008-12-10

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于历史信息的自然语言层次句法分析方法,其特征在于:对已完成分词的句子,首先将各个词看成是初始组块,采用分层方式,根据上下文信息进行组块识别,将可以组合的组块构成新的组块,获得中间结果,对中间结果重复根据上下文信息进行组块识别及组合,直至只包含一个组块为止,该组块为句法树的根结点,由此获得表达自然语言的句法树。本发明在每层处理过程中,优先识别出容易识别的组块,能提供更丰富的上下文信息进行复杂组块识别,提高决策预测的正确率,从而提高了句法分析的性能。

    基于大小导师知识蒸馏的少样本情感分类方法

    公开(公告)号:CN114722805B

    公开(公告)日:2022-08-30

    申请号:CN202210653730.6

    申请日:2022-06-10

    Applicant: 苏州大学

    Abstract: 本发明涉及一种基于大小导师知识蒸馏的少样本情感分类方法,包括收集大量情感分类任务上的未标注样本和有标注样本,使用有标注样本训练大导师模型和小导师模型;全部未标注样本经过小导师模型得到每个样本概率的不确定性,然后根据阈值筛选出样本概率高度不确定的样本再次经过大导师模型;结合大导师模型和小导师模型的概率输出形成软标签来蒸馏学生模型,使用蒸馏后的学生模型进行分类预测。本发明减少了访问大导师模型的频率,减少了训练学生模型过程中的蒸馏时间,减少资源消耗的同时提升了分类识别的正确率。

    一种基于微观话题结构的指代消解方法及系统

    公开(公告)号:CN106445911B

    公开(公告)日:2022-02-22

    申请号:CN201610156465.5

    申请日:2016-03-18

    Applicant: 苏州大学

    Abstract: 本发明涉及一种基于微观话题结构的指代消解方法及系统,首先获取文本并对文本进行篇章基本话题单元切割构成篇章微观话题结构;然后从篇章微观话题结构中识别主述位;再以主述位为连接端口识别篇章基本话题单元之间的衔接关系;最后根据识别的衔接关系,将照应语中候选先行语的范围落在与其所在主述位结构相衔接的前一个篇章基本话题的主位或述位中,减少消解对的数量,再提取限定范围内的名词所拥有的词性、句法及语义特征,最后利用最大熵分类算法完成消解单元的识别。该方法是基于主位和述位,以话题为中心,立足于小句层面的指代消解方法,利用主述位结构及主位推进模式,缩小了指代消解对的数量,降低计算的复杂度,从而提高指代消解性。

    基于融合模态内和模态间关系的数据处理方法及系统

    公开(公告)号:CN113254741A

    公开(公告)日:2021-08-13

    申请号:CN202110665991.5

    申请日:2021-06-16

    Applicant: 苏州大学

    Abstract: 本申请涉及基于融合模态内和模态间关系的数据处理方法及系统,包括:获取社交网络指向目标分类的样本数据,并将样本数据划分为训练集、验证集和测试集,获得训练集样本数据、验证集样本数据和测试集样本数据;构建预设分类模型,所述预设分类模型包括特征提取网络,与所述特征提取网络相连的目标分类主任务网络和多模态主题信息辅助任务网络;将所述训练集样本数据输入所述预设分类模型并利用预设的损失函数进行训练,使用门控机制融合主任务和辅助任务的输出,得到社交数据分类模型,所述社交数据分类模型用于对输入的待分类数据进行分类。本申请能够有效的提升社交网络数据指向目标分类的性能。

    融合局部特征与深度学习的事件联合抽取方法

    公开(公告)号:CN110134720B

    公开(公告)日:2021-02-09

    申请号:CN201910412962.0

    申请日:2019-05-17

    Applicant: 苏州大学

    Abstract: 本发明公开了一种融合局部特征与深度学习的事件联合抽取方法。本发明融合局部特征与深度学习的事件联合抽取方法,包括:抽取实体、词性与依存分析,利用PV‑DM模型训练文档向量;学习隐藏特征,进入GCN;再次,识别出事件元素与事件触发之间的记忆单元,帮助识别事件类型与事件论元;最后,使用CRF对最终的事件类型进行标注,全连接层中,用Softmax函数对事件元素进行识别。本发明的有益效果:借助文档向量学习文章中的主旨信息,其次利用图卷积网络挖掘事件之间的联系,最后利用记忆单元与局部特征学习事件类型与事件元素之间的信息,以此完成事件联合抽取,提高其识别性能。

    英文事件同指消解方法和系统

    公开(公告)号:CN109359184B

    公开(公告)日:2020-08-18

    申请号:CN201811203139.0

    申请日:2018-10-16

    Applicant: 苏州大学

    Abstract: 本发明公开了一种英文事件同指消解方法和系统。本发明英文事件同指消解方法,包括:读取标注文档的事件标注信息,得到标注语料事件集合;统计标注语料事件集合中文档ID、同指ID、事件句ID、事件句类型、事件句子类型、事件句形态以及触发词的起始位置,得到事件句信息集合。本发明的有益效果:利用从事件句中抽取的信息特征和事件对匹配特征,采用循环神经网络对事件对之间的同指关系进行判定;本发明采用循环神经网络模型,利用深度学习来解决事件同指消解问题;本发明的方法和系统,与现有的方法和系统相比,英文事件同指消解性能得到了明显提升。

Patent Agency Ranking