-
公开(公告)号:CN106445911B
公开(公告)日:2022-02-22
申请号:CN201610156465.5
申请日:2016-03-18
Applicant: 苏州大学
IPC: G06F40/205
Abstract: 本发明涉及一种基于微观话题结构的指代消解方法及系统,首先获取文本并对文本进行篇章基本话题单元切割构成篇章微观话题结构;然后从篇章微观话题结构中识别主述位;再以主述位为连接端口识别篇章基本话题单元之间的衔接关系;最后根据识别的衔接关系,将照应语中候选先行语的范围落在与其所在主述位结构相衔接的前一个篇章基本话题的主位或述位中,减少消解对的数量,再提取限定范围内的名词所拥有的词性、句法及语义特征,最后利用最大熵分类算法完成消解单元的识别。该方法是基于主位和述位,以话题为中心,立足于小句层面的指代消解方法,利用主述位结构及主位推进模式,缩小了指代消解对的数量,降低计算的复杂度,从而提高指代消解性。
-
公开(公告)号:CN113362083A
公开(公告)日:2021-09-07
申请号:CN202110626365.5
申请日:2021-06-04
Applicant: 苏州科达科技股份有限公司 , 苏州大学
Abstract: 本发明涉及信息技术领域,具体涉及报修方法、装置、电子设备及存储介质,所述方法包括:获取报修文件;对所述报修文件进行语句处理,提取出相应的报修描述;将所述报修描述输入故障处理模型中,确定故障类别。由于报修描述是通过语句处理得到的,可以准确地表征报修文件的内容,同时利用故障处理模型对报修描述进行故障类别的预测,可以得到准确的故障类别,即,通过数据自动处理实现故障类别的准确确定,提高了报修效率。
-
公开(公告)号:CN110134720B
公开(公告)日:2021-02-09
申请号:CN201910412962.0
申请日:2019-05-17
Applicant: 苏州大学
IPC: G06F16/2458 , G06F16/28 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种融合局部特征与深度学习的事件联合抽取方法。本发明融合局部特征与深度学习的事件联合抽取方法,包括:抽取实体、词性与依存分析,利用PV‑DM模型训练文档向量;学习隐藏特征,进入GCN;再次,识别出事件元素与事件触发之间的记忆单元,帮助识别事件类型与事件论元;最后,使用CRF对最终的事件类型进行标注,全连接层中,用Softmax函数对事件元素进行识别。本发明的有益效果:借助文档向量学习文章中的主旨信息,其次利用图卷积网络挖掘事件之间的联系,最后利用记忆单元与局部特征学习事件类型与事件元素之间的信息,以此完成事件联合抽取,提高其识别性能。
-
公开(公告)号:CN103324758B
公开(公告)日:2017-07-14
申请号:CN201310288756.6
申请日:2013-07-10
Applicant: 苏州大学
IPC: G06F17/30
Abstract: 本申请提供一种新闻分类方法和系统。其中,一种新闻分类方法包括:使用预先构建的每个基分类器对待分类新闻进行分类,得到每个基分类器的分类结果;依据每个基分类器的分类结果,分别对待分类新闻进行情绪判定,得到判定结果;使用判定结果,得到待分类新闻含有的所有情绪类别。由于情绪判定是指判定待分类新闻是否含有用户看到待分类新闻时产生的情绪,判定结果表明所述待分类新闻含有的情绪,所以使用判定结果,即可以得到所述待分类新闻含有的所有情绪类别,并将待分类新闻划分到其含有的所有情绪类别对应的新闻中,实现依据情绪对新闻划分。进一步依据不同情绪推荐新闻,使推荐给用户的新闻更能满足用户当前的需求。
-
公开(公告)号:CN105206123A
公开(公告)日:2015-12-30
申请号:CN201510706510.5
申请日:2015-10-27
Applicant: 苏州大学
Abstract: 本发明提供一种聋哑患者交流装置,包括主控单元、触摸显示屏、存储卡、麦克风、扬声器,所述主控单元连接触摸显示屏、存储卡、麦克风及扬声器,所述主控单元将从麦克风获取的音频转换为动画手语及文字输出在触摸显示屏上,或者从触摸显示屏获取文字信息或手语动画转换为语音从扬声器输出,可以使聋哑人与普通人方便地进行交流。同时,本装置还设有语音手语交流按钮、语音播放按钮、书写训练按钮及手语库按钮,扩展了装置不同方面的使用功能,使用时更加便捷。
-
公开(公告)号:CN110427605B
公开(公告)日:2023-06-09
申请号:CN201910385277.3
申请日:2019-05-09
Applicant: 苏州大学
IPC: G06F40/30 , G06N3/0455 , G06N3/0442
Abstract: 本发明公开了一种面向短文本理解的省略恢复方法。本发明模型主要分为嵌入层、编码层和解码层。嵌入层是为了获取离散词语的分布式表征;编码层是为了挖掘文本的特征;解码层则是利用编码层提取的特征来生成省略补全后的结果。本发明的有益效果:给出的模型则假定句子内词与词之间都可能存在省略,模型在训练和预测时充分考虑了待恢复序列的结构信息,有效解决seq2seq带来的“病句”问题。另外,在短文本理解上,模型融合了交叉注意力和自注意力机制,相较于seq2seq模型能够提取更多、更深的文本特征。
-
公开(公告)号:CN107679041B
公开(公告)日:2020-12-01
申请号:CN201710997259.1
申请日:2017-10-20
Applicant: 苏州大学
IPC: G06F16/35 , G06F40/30 , G06F40/284 , G06F40/295 , G06F40/211
Abstract: 本发明涉及一种基于卷积神经网络的英文事件同指消解方法及系统,为了提升事件同指消解性能而设计。本发明基于卷积神经网络的英文事件同指消解方法及系统,得到测试语料事件集合,然后通过引入多语料库通用的过滤策略降低数据分布不均衡的影响,并兼顾不同的事件标注策略,采用最小事件描述和事件间关系描述相结合的特征表示方法,通过引入全局优化对部分识别结果进行后处理。结合WordNet等外部资源进行事件间语义关系的计算。最后采用卷积神经网络模型与推理方法,利用深度学习来消解事件同指关系。本发明可以充分利用事件之间的各种关系及其所在的句子信息对事件同指消解进行识别和推理,从而提高了事件同指消解的性能。
-
公开(公告)号:CN111488733A
公开(公告)日:2020-08-04
申请号:CN202010265414.2
申请日:2020-04-07
Applicant: 苏州大学
IPC: G06F40/211 , G06F40/221 , G06F40/253 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于Mask机制与孪生网络的汉语零指代消解方法及系统,包括在零代词所在的位置加“[MASK]”标记,得到补全后的零代词所在的句子,其中若先行词和[MASK]在同一句中,则不进行拼接处理,若所述先行词和[MASK]不在同一句中,将先行词所在的句子和补全后零代词所在的句子进行拼接处理;将上述预处理后的句子输入至预训练的BERT模型提取出第一先行词和第一零代词;将注意力机制融入至所述BERT模型中,对于第一先行词,通过第一线性函数处理得到第二先行词;对于第一零代词,结合预选的手工特征,分别通过各自线性函数处理得到第二零代词;计算所述第二先行词和第二零代词的相似度,输出相似度最高的先行词。本发明避免了信息的冗余及噪声。
-
公开(公告)号:CN110427605A
公开(公告)日:2019-11-08
申请号:CN201910385277.3
申请日:2019-05-09
Applicant: 苏州大学
Abstract: 本发明公开了一种面向短文本理解的省略恢复方法。本发明模型主要分为嵌入层、编码层和解码层。嵌入层是为了获取离散词语的分布式表征;编码层是为了挖掘文本的特征;解码层则是利用编码层提取的特征来生成省略补全后的结果。本发明的有益效果:给出的模型则假定句子内词与词之间都可能存在省略,模型在训练和预测时充分考虑了待恢复序列的结构信息,有效解决seq2seq带来的“病句”问题。另外,在短文本理解上,模型融合了交叉注意力和自注意力机制,相较于seq2seq模型能够提取更多、更深的文本特征。
-
公开(公告)号:CN110069636A
公开(公告)日:2019-07-30
申请号:CN201910369095.7
申请日:2019-05-05
Applicant: 苏州大学
Abstract: 本发明公开了一种融合依存关系与篇章修辞关系的事件时序关系识别方法。本发明一种融合依存关系与篇章修辞关系的事件时序关系识别方法,其特征在于,包括:给定事件对e1,e2,提取最短依存路径方面;考虑到依存句法树复杂的句法结构,另外增加了一条启发式规则来丰富事件相关信息;把孩子节点加入依存路径中,最后将提取出的词按事件句出现顺序排序;之后将得到的事件对依存路径按照与基准模型相同的处理方法,经过嵌入层,双向LSTM层以及隐藏层得到向量表示Y'。本发明的有益效果:将篇章树的信息编码加入模型中。该方法将事件间关联关系分两部分进行表征,一是事件所在句子的依存路径信息。
-
-
-
-
-
-
-
-
-