中文篇章树的构建方法
    41.
    发明授权

    公开(公告)号:CN109977372B

    公开(公告)日:2023-06-27

    申请号:CN201910233095.4

    申请日:2019-03-26

    Applicant: 苏州大学

    Abstract: 本发明公开了一种中文篇章树的构建方法。本发明一种中文篇章树的构建方法,包括:依次将篇章中由人工分割字句得到的标准篇章基本单元的词向量和词性标记向量拼接并输入篇章基本单元编码器(EDU Encoder)以获取各个篇章基本单元的编码结果;将EDU Encoder编码得到的各个篇章基本单元的向量表征输入分割点编码器(Split Encoder)实现对相邻篇章基本单元之间的分割点的表征;将Split Encoder对各个分割点的编码结果输入一个编码器—解码器结构(Encoder‑Decoder),以编码—解码的形式进行分割点选择;本发明的有益效果:本发明首次采用了自顶向下的篇章解析模式,将传统的自底向上的篇章树节点的构建过程转换为自顶向下的分割点选择的过程。

    一种事件抽取方法、装置及存储介质

    公开(公告)号:CN114936563A

    公开(公告)日:2022-08-23

    申请号:CN202210453456.8

    申请日:2022-04-27

    Applicant: 苏州大学

    Abstract: 本发明首先将事件触发词抽取和论元抽取统一为一个独立的跨度检测和分类处理模式,针对处理模式分别设计了一个非限制性抽取问题、一个限制性抽取问题和一组限制性分类问题,我们利用这些问题完成相应的跨度检测和分类任务。其次,我们将统一处理模式转换为两轮问答组件,在第一轮中,通过一个非限制性问题获得所有可能的跨度。在第二轮中,利用每个得到的跨度作为约束迭代得到相应的类型。最后,我们将两个组件进行双向堆叠并用于事件抽取任务上(一个方向是依次提取事件触发词和论元,而另一个方向首先识别论元,然后识别事件触发词)。通过两个方向上的联合训练,减少了错误级联,并有效地利用了事件触发词和论元之间的互补性。

    基于联合学习的多回合对话回应选择方法

    公开(公告)号:CN112989006A

    公开(公告)日:2021-06-18

    申请号:CN202110418009.4

    申请日:2021-04-19

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于联合学习的多回合对话回应选择方法,包括:(1)将不同语言的对话上文与备选回应进行预处理,得到相应对话上文和备选回应文本的潜在语义表征;(2)对不同语言对话上文文本与备选回应文本的特征进行特征提取,得到不同语言对话上文文本与备选回应文本的潜在语义信息;(3)对于每一种语言的对话,匹配每一回合对话与备选回应,同时整合对话上文整体语义信息;之后整体语义信息与备选回应进行匹配,将匹配到的信息整合;(4)将不同语言的输出进行整合完成结果的有效预测。本发明的有益效果:利用对话语言结构的相通性以及不同语言的互补性提升多回合对话回应选择任务的性能。

    基于主述位理论的汉语基本篇章单元识别方法

    公开(公告)号:CN110210033A

    公开(公告)日:2019-09-06

    申请号:CN201910476073.0

    申请日:2019-06-03

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于主述位理论的汉语基本篇章单元识别方法。本发明基于主述位理论的汉语基本篇章单元识别方法,包括:通过确定EDU中主、述位的位置间接获得EDU的边界,因此可将EDU识别分成两个部分,首先进行主、述位识别,然后在识别主位和述位后再依据一定的规则合并得到EDU。本发明的有益效果:参考了英文基本篇章单元的识别方法,结合汉语实际情况,在使用深度学习方法的同时引入主述位结构,一方面将EDU识别当作关于主述位的序列化标注问题,实现了主述位结构与EDU的联合识别;另一方面从EDU内部构成的完整性角度进行EDU边界的识别,提升了EDU的识别性能。

    中文篇章树的构建方法
    45.
    发明公开

    公开(公告)号:CN109977372A

    公开(公告)日:2019-07-05

    申请号:CN201910233095.4

    申请日:2019-03-26

    Applicant: 苏州大学

    Abstract: 本发明公开了一种中文篇章树的构建方法。本发明一种中文篇章树的构建方法,包括:依次将篇章中由人工分割字句得到的标准篇章基本单元的词向量和词性标记向量拼接并输入篇章基本单元编码器(EDU Encoder)以获取各个篇章基本单元的编码结果;将EDU Encoder编码得到的各个篇章基本单元的向量表征输入分割点编码器(Split Encoder)实现对相邻篇章基本单元之间的分割点的表征;将Split Encoder对各个分割点的编码结果输入一个编码器—解码器结构(Encoder‑Decoder),以编码—解码的形式进行分割点选择;本发明的有益效果:本发明首次采用了自顶向下的篇章解析模式,将传统的自底向上的篇章树节点的构建过程转换为自顶向下的分割点选择的过程。

    基于成分句法压缩树的指代消解方法

    公开(公告)号:CN109960803A

    公开(公告)日:2019-07-02

    申请号:CN201910212932.5

    申请日:2019-03-20

    Applicant: 苏州大学

    Inventor: 孔芳 付建 周国栋

    Abstract: 本发明公开了一种基于成分句法压缩树的指代消解方法。本发明基于成分句法压缩树的指代消解方法,包括:(1)定义“压缩”操作;(2)针对成分句法树的压缩算法;(3)从成分句法压缩树上提取特征应用于指代消解任务。本发明的有益效果:减小了原始成分句法树的复杂结构,消除了对于指代消解任务无关的冗余结点的信息,为指代消解任务提供了简洁而精确的结构信息,增强了结构信息与层次关系在神经指代消解系统中的表达。

    基于结点表示法的指代消解方法

    公开(公告)号:CN109885841A

    公开(公告)日:2019-06-14

    申请号:CN201910212569.7

    申请日:2019-03-20

    Applicant: 苏州大学

    Inventor: 孔芳 付建 周国栋

    Abstract: 本发明公开了一种基于结点表示法的指代消解方法,包括:结点表示法:给定成分句法树,通过后序遍历得到其对应的结点序列,然后通过“字词嵌入替换法”获得其初始表示,通过双向长短时记忆网络获得其上下文表示;特征补充法:从成分句法树上提出每个结点的特征集加入初始表示中,丰富节点的表示;结点更新法:结合注意力机制与门控机制,利用孩子节点序列更新双亲结点的表示;结点枚举策略。本发明的有益效果:通过“结点表示法”、“特征补充法”、“节点更新法”与节点枚举策略,将整棵成分句法树的信息编码加入模型中,弥补了传统模型忽略结构信息与句法信息的不足,增强了句法结构信息在指代消解系统中的表达。

    基于统计机器翻译的语言生成方法

    公开(公告)号:CN107526727A

    公开(公告)日:2017-12-29

    申请号:CN201710637423.8

    申请日:2017-07-31

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于统计机器翻译的语言生成方法,将源端树形结构语义表达式转化为自然语言;将预处理后的语料作为基于层次短语的统计机器翻译的源端语言;利用基于层次短语的统计机器翻译解码器生成n-best翻译结果;再对上一步生成的n-best翻译结果进行过滤,得到与源端输入句子答案类型相同的翻译结果;在评测阶段,将中文和英文的参照语句从原来一个增加到了三个,使评测值更能反映真实地翻译效果,具有良好的应用前景。

    一种中文事件信息挖掘方法和系统

    公开(公告)号:CN103617280B

    公开(公告)日:2017-01-25

    申请号:CN201310664718.6

    申请日:2013-12-09

    Applicant: 苏州大学

    Abstract: 本发明公开一种中文事件信息挖掘方法和系统,该方法基于挖掘需求,定义事件样本模型,实例化事件样本模型,得到种子事件,该种子事件作为从原始文本中挖掘事件的依据。对原始文本进行预处理,得到候选模板集合;并对种子事件进行信息标注,基于标注信息对种子事件进行处理,得到种子模板集合。之后采用迭代方法,依据候选模板评级得分和候选模板与种子模板间的语义相似度对候选模板集合进行处理,得到挖掘事件锚集合,并依据该集合中每个挖掘事件锚和种子事件集合中任一种子事件锚的词汇语义相似度,获取挖掘事件锚对应的事件类型。可见本发明只需标注少量样本,即只需标注种子事件即可实现从原始文本中挖掘中文事件信息的目的,降低了挖掘成本。

    一种论元抽取方法和系统
    50.
    发明授权

    公开(公告)号:CN103530281B

    公开(公告)日:2016-06-22

    申请号:CN201310482550.7

    申请日:2013-10-15

    Applicant: 苏州大学

    Abstract: 本发明公开一种论元抽取方法和系统,所述方法基于标注信息对训练语料中标注事件实例进行处理,得到训练语料论元模式集合;基于测试语料中事件实例的角色集合对事件实例进行处理,得到测试语料候选论元模式集合;根据论元、触发词语义相似性及依存路径相似性,计算每一候选论元模式和训练语料论元模式集合中各论元模式的模式语义相似度,并基于此获取包含候选论元匹配事件实例中可匹配角色的匹配度信息的论元模式相似度集合;基于论元模式相似度集合,选取与事件实例中的角色匹配度最高且匹配度大于预设阈值的候选论元作为角色的论元。可见本发明基于语义特征对中文事件的论元进行提取,提高了中文事件论元提取的准确率和性能。

Patent Agency Ranking