-
公开(公告)号:CN107526727B
公开(公告)日:2021-01-19
申请号:CN201710637423.8
申请日:2017-07-31
Applicant: 苏州大学
Abstract: 本发明公开了一种基于统计机器翻译的语言生成方法,将源端树形结构语义表达式转化为自然语言;将预处理后的语料作为基于层次短语的统计机器翻译的源端语言;利用基于层次短语的统计机器翻译解码器生成n‑best翻译结果;再对上一步生成的n‑best翻译结果进行过滤,得到与源端输入句子答案类型相同的翻译结果;在评测阶段,将中文和英文的参照语句从原来一个增加到了三个,使评测值更能反映真实地翻译效果,具有良好的应用前景。
-
公开(公告)号:CN110147401A
公开(公告)日:2019-08-20
申请号:CN201910428092.6
申请日:2019-05-22
Applicant: 苏州大学
Abstract: 本发明公开了一种融合先验知识和上下文相关度的知识库抽取方法。本发明提出了一种融合先验知识和上下文相关度的知识库抽取方法,包括:多知识库生成候选集:为了获取适用于实体链接任务的知识库(即:抽取与语料相关领域的维基页面),通过统计维基百科(Wikipedia)、大型网络语料库Crosswikis(Spitkovsky and Chang)和Yago知识库(Hoffart et al.)中 共现的次数来生成每个mention的候选集以及mention与每个候选entity之间的先验概率 本发明的有益效果:先利用候选实体的先验知识抽取知识库,再利用候选实体的锚文本所对应的维基页面的上下文相关度来进一步抽取知识库,最终得到与实验语料领域相关的知识库,最大限度的减少知识库带来的噪声干扰与资源消耗。
-
公开(公告)号:CN105206123B
公开(公告)日:2018-06-29
申请号:CN201510706510.5
申请日:2015-10-27
Applicant: 苏州大学
Abstract: 本发明提供一种聋哑患者交流装置,包括主控单元、触摸显示屏、存储卡、麦克风、扬声器,所述主控单元连接触摸显示屏、存储卡、麦克风及扬声器,所述主控单元将从麦克风获取的音频转换为动画手语及文字输出在触摸显示屏上,或者从触摸显示屏获取文字信息或手语动画转换为语音从扬声器输出,可以使聋哑人与普通人方便地进行交流。同时,本装置还设有语音手语交流按钮、语音播放按钮、书写训练按钮及手语库按钮,扩展了装置不同方面的使用功能,使用时更加便捷。
-
公开(公告)号:CN104331480B
公开(公告)日:2017-09-29
申请号:CN201410626003.6
申请日:2014-11-07
Applicant: 苏州大学
Abstract: 本发明提供一种中文事件触发词的抽取系统及方法。所述系统包括句法和依存分析模块、核心和辅助角色定义模块、训练语料特征抽取模块、候选触发词抽取模块、基本特征抽取模块、训练集模板抽取模块、候选模板抽取模块、实体特征抽取模块及触发词识别模块。本发明根据角色语义是事件语义的表示形式之一,提供了利用核心角色和辅助角色来表示角色语义的方法,并用于中文事件触发词的抽取。与现有最好的中文事件抽取方法和系统相比,本发明提供的方法对于中文事件触发词的抽取性能有了明显提升。
-
公开(公告)号:CN104268214A
公开(公告)日:2015-01-07
申请号:CN201410494539.7
申请日:2014-09-24
Applicant: 苏州大学
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/3071
Abstract: 本发明提供一种基于微博用户关系的用户性别识别方法及系统,本发明方法包括以下步骤:S1.根据微博网站提供的API接口,收集微博用户的用户信息,并对不同用户进行分类。S2.根据已分类用户的userid获取其关注者和粉丝两者的userid,并将所述关注者和粉丝两者的userid整理成文本。S3.使用信息增益对训练样本进行特征提取,并使用最大熵分类器将待分类样本进行分类。本发明相比使用微博文本,具有更好的微博用户性别分类效果。
-
-
公开(公告)号:CN102298642A
公开(公告)日:2011-12-28
申请号:CN201110273322.X
申请日:2011-09-15
Applicant: 苏州大学
IPC: G06F17/30
Abstract: 本发明实施例公开了一种文本信息抽取方法,实现从文本中抽取某种现象或某个事件产生的原因信息;其方法根据原因种子对对从互联网中采集的语句进行分析,生成原因句抽取模式,并利用依存关系和依存路径表示原因句的抽取模式,再基于该抽取模式来抽取原因信息,抽取过程大大减少了人工成本;且以抽取的原因句和非原因句作为训练样本,训练一个支持向量机分类器在未分类的语句中进一步识别原因句,从而提高了性能;本发明还公开了一种文本信息抽取系统,用于抽取文本中某种现象或某个事件产生的原因的信息。
-
公开(公告)号:CN111488733B
公开(公告)日:2023-12-19
申请号:CN202010265414.2
申请日:2020-04-07
Applicant: 苏州大学
IPC: G06F40/211 , G06F40/221 , G06F40/253 , G06N3/044 , G06N3/084
Abstract: 本发明涉及一种基于Mask机制与孪生网络的汉语零指代消解方法及系统,包括在零代词所在的位置加“[MASK]”标记,得到补全后的零代词所在的句子,其中若先行词和[MASK]在同一句中,则不进行拼接处理,若所述先行词和[MASK]不在同一句中,将先行词所在的句子和补全后零代词所在的句子进行拼接处理;将上述预处理后的句子输入至预训练的BERT模型提取出第一先行词和第一零代词;将注意力机制融入至所述BERT模型中,对于第一先行词,通过第一线性函数处理得到第二先行词;对于第一零代词,结合预选的手工特征,分别通过各自线性函数处理得到第二零代词;计算所述第二先行词和第二零代词的相似度,输出相似度最高的先行词。本发明避免了信息的冗余及噪声。
-
公开(公告)号:CN110210033B
公开(公告)日:2023-08-15
申请号:CN201910476073.0
申请日:2019-06-03
Applicant: 苏州大学
IPC: G06F40/253 , G06N3/08
Abstract: 本发明公开了一种基于主述位理论的汉语基本篇章单元识别方法。本发明基于主述位理论的汉语基本篇章单元识别方法,包括:通过确定EDU中主、述位的位置间接获得EDU的边界,因此可将EDU识别分成两个部分,首先进行主、述位识别,然后在识别主位和述位后再依据一定的规则合并得到EDU。本发明的有益效果:参考了英文基本篇章单元的识别方法,结合汉语实际情况,在使用深度学习方法的同时引入主述位结构,一方面将EDU识别当作关于主述位的序列化标注问题,实现了主述位结构与EDU的联合识别;另一方面从EDU内部构成的完整性角度进行EDU边界的识别,提升了EDU的识别性能。
-
公开(公告)号:CN109885841B
公开(公告)日:2023-07-11
申请号:CN201910212569.7
申请日:2019-03-20
Applicant: 苏州大学
IPC: G06F40/211 , G06F40/289
Abstract: 本发明公开了一种基于结点表示法的指代消解方法,包括:结点表示法:给定成分句法树,通过后序遍历得到其对应的结点序列,然后通过“字词嵌入替换法”获得其初始表示,通过双向长短时记忆网络获得其上下文表示;特征补充法:从成分句法树上提出每个结点的特征集加入初始表示中,丰富节点的表示;结点更新法:结合注意力机制与门控机制,利用孩子节点序列更新双亲结点的表示;结点枚举策略。本发明的有益效果:通过“结点表示法”、“特征补充法”、“节点更新法”与节点枚举策略,将整棵成分句法树的信息编码加入模型中,弥补了传统模型忽略结构信息与句法信息的不足,增强了句法结构信息在指代消解系统中的表达。
-
-
-
-
-
-
-
-
-