一种双语语义关系分类模型的建立方法和系统

    公开(公告)号:CN103559181A

    公开(公告)日:2014-02-05

    申请号:CN201310572760.5

    申请日:2013-11-14

    Applicant: 苏州大学

    Abstract: 本发明公开一种双语语义关系分类模型的建立方法及系统。所述方法包括:通过第一语言分类器对未标注语义关系的对应于第一语言的第一未标注语料进行语义关系分类,得到语义关系分类结果;将所述第一未标注语料翻译为对应于第二语言的第二未标注语料;保存所述第一未标注语料与所述语义关系分类结果的对应关系至所述第一语言分类器的第一训练集;保存所述第二未标注语料与所述语义关系分类结果的对应关系至第二语言分类器的第二训练集。采用本发明的方法或系统,可以减少对大规模训练语料的需求,提高双语语义关系分类模型的建立效率。

    一种不同语言间词汇相似度的获取方法及系统

    公开(公告)号:CN102567306A

    公开(公告)日:2012-07-11

    申请号:CN201110348222.9

    申请日:2011-11-07

    Applicant: 苏州大学

    Abstract: 本发明公开了一种不同语言间词汇相似度的获取方法及系统,可以根据源语言与目标语言中词汇的上下文词汇相似度和依存相似度为特征获得不同语言间词汇的相似度。由于本发明同时使用了上下文相似度和依存相似度对不同语言的词汇相似度进行评价,因此可以有效提高相似度的可靠性,提高翻译准确性。

    文本信息抽取方法和系统
    13.
    发明公开

    公开(公告)号:CN102298642A

    公开(公告)日:2011-12-28

    申请号:CN201110273322.X

    申请日:2011-09-15

    Applicant: 苏州大学

    Abstract: 本发明实施例公开了一种文本信息抽取方法,实现从文本中抽取某种现象或某个事件产生的原因信息;其方法根据原因种子对对从互联网中采集的语句进行分析,生成原因句抽取模式,并利用依存关系和依存路径表示原因句的抽取模式,再基于该抽取模式来抽取原因信息,抽取过程大大减少了人工成本;且以抽取的原因句和非原因句作为训练样本,训练一个支持向量机分类器在未分类的语句中进一步识别原因句,从而提高了性能;本发明还公开了一种文本信息抽取系统,用于抽取文本中某种现象或某个事件产生的原因的信息。

    生物医学事件组装方法、装置、设备及介质

    公开(公告)号:CN115687611A

    公开(公告)日:2023-02-03

    申请号:CN202211136811.5

    申请日:2022-09-19

    Applicant: 苏州大学

    Abstract: 本申请公开了一种生物医学事件组装方法、装置、设备及介质,涉及自然语言处理技术领域,该方法包括:基于待组装文本的触发词类型,将所述待组装文本的触发词和所述待组装文本的论元进行组合,以得到所述待组装文本的候选事件;利用嵌套标记法对所述候选事件的触发词和所述候选事件的论元进行标记,以得到候选实例;利用预设深度学习模型对所述候选实例进行编码,以得到所述候选实例的语义信息的输出表征;获取所述输出表征的预设合法类别的第一概率结果以及预设非法类别的第二概率结果,然后基于所述第一概率结果和所述第二概率结果从所述候选事件中确定出目标生物医学事件。能够提高生物医学事件组装的性能。

    一种分类模型建模方法、中文跨文本指代消解方法和系统

    公开(公告)号:CN103150405B

    公开(公告)日:2014-12-10

    申请号:CN201310108506.X

    申请日:2013-03-29

    Applicant: 苏州大学

    Abstract: 本申请提供一种分类模型建模方法、中文跨文本指代消解方法和系统。其中一种分类模型建模方法,包括:获取训练文本集;从训练文本集中选取实体表述对;获取每个实体表述对的特征项;选取正训练实例和负训练实例,将每个正训练实例和每个负训练实例的特征项分别加载到支持向量机的建模工具中,得到分类模型。对于待识别文本集中的实体表述对,在提取特征项后,可以使用分类模型判断是否具有指代关系,然后合并具有指代关系的实体表述对,构成跨文本指代链,从而达到跨文本指代消解的目的。由于上述方案获取的语义特征可以充分利用各种外部语义资源,挖掘实体表述对所具有的实际含义,从而提高分类模型及跨文本指代消解系统的准确度。

    一种人物关系抽取方法和装置

    公开(公告)号:CN104182535A

    公开(公告)日:2014-12-03

    申请号:CN201410436852.5

    申请日:2014-08-29

    Applicant: 苏州大学

    CPC classification number: G06F17/30979 G06F17/2785

    Abstract: 本发明公开了一种人物关系抽取方法和装置,该方法包括:确定待抽取的人物关系的基本模式,对人物关系的基本模式进行人称代词的泛化得到泛化模式;在语料库中匹配满足泛化模式的人物关系;在指代消解范围内确定泛化模式中的人称代词所指向的第一人名;抽取该第一人名及对应的泛化模式的人物关系后端的第二人名,得到第一人名和第二人名的人物关系。通过采用上述泛化基本模式的人物关系中前端的人名,然后依据该泛化模式在语料库中进行匹配将得到以泛化模式存在的待抽取的人物关系,使得在面对海量文本资源时,不仅限于基本模式的人物关系的抽取,满足泛化模式的人物关系也可以被抽取出来,大大提高了人物关系的抽取效率。

    文本信息抽取方法和系统
    17.
    发明授权

    公开(公告)号:CN102298642B

    公开(公告)日:2012-09-05

    申请号:CN201110273322.X

    申请日:2011-09-15

    Applicant: 苏州大学

    Abstract: 本发明实施例公开了一种文本信息抽取方法,实现从文本中抽取某种现象或某个事件产生的原因信息;其方法根据原因种子对对从互联网中采集的语句进行分析,生成原因句抽取模式,并利用依存关系和依存路径表示原因句的抽取模式,再基于该抽取模式来抽取原因信息,抽取过程大大减少了人工成本;且以抽取的原因句和非原因句作为训练样本,训练一个支持向量机分类器在未分类的语句中进一步识别原因句,从而提高了性能;本发明还公开了一种文本信息抽取系统,用于抽取文本中某种现象或某个事件产生的原因的信息。

    一种自然语言句子的语义关系树的构造和比较方法

    公开(公告)号:CN101446944A

    公开(公告)日:2009-06-03

    申请号:CN200810243607.7

    申请日:2008-12-10

    Applicant: 苏州大学

    Abstract: 本发明公开了一种自然语言句子的语义关系树的构造方法,其特征在于,对于句子中待建立语义关系树的两个实体,首先构建最短路径包含树;如果两实体之间的结构类型不是谓词结构,则最短路径包含树即为所需的语义关系树;如果两实体之间的结构类型是谓词链接结构,则扩展与谓词相关的上下文信息,得到上下文相关的路径包含树,作为语义关系树。本发明的方法获得的语义关系树,既能涵盖关键的结构化句法信息,又能减少不必要的噪音,能在基本不影响关系抽取速度的前提下,提高关系抽取的性能;采用该语义关系树进行比较,结果更具有普遍性。

    一种自然语言句子的语义角色标注方法

    公开(公告)号:CN101446942A

    公开(公告)日:2009-06-03

    申请号:CN200810243605.8

    申请日:2008-12-10

    Applicant: 苏州大学

    Abstract: 本发明公开了一种自然语言句子的语义角色标注方法,其特征在于:采用联合学习模型,同时实现中文句法分析和语义角色标注。本发明通过联合模型的使用,能够同时输出一个句子的句法分析结果和给定谓词的语义角色标注结果。在联合学习模型中,由于句法分析模型中增加了语义信息,使得训练出来的模型更适合于语义角色标注任务,因此由此模型输出的语义角色标注性能更高。同时联合模型输出的句法分析结果同单个句法分析模型的结果相比,两者性能不会有很大差别,甚至由于语义信息的加入,还能够提高句法分析的性能。

    一种基于历史信息的自然语言层次句法分析方法

    公开(公告)号:CN101446941A

    公开(公告)日:2009-06-03

    申请号:CN200810243604.3

    申请日:2008-12-10

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于历史信息的自然语言层次句法分析方法,其特征在于:对已完成分词的句子,首先将各个词看成是初始组块,采用分层方式,根据上下文信息进行组块识别,将可以组合的组块构成新的组块,获得中间结果,对中间结果重复根据上下文信息进行组块识别及组合,直至只包含一个组块为止,该组块为句法树的根结点,由此获得表达自然语言的句法树。本发明在每层处理过程中,优先识别出容易识别的组块,能提供更丰富的上下文信息进行复杂组块识别,提高决策预测的正确率,从而提高了句法分析的性能。

Patent Agency Ranking