-
公开(公告)号:CN110210033B
公开(公告)日:2023-08-15
申请号:CN201910476073.0
申请日:2019-06-03
Applicant: 苏州大学
IPC: G06F40/253 , G06N3/08
Abstract: 本发明公开了一种基于主述位理论的汉语基本篇章单元识别方法。本发明基于主述位理论的汉语基本篇章单元识别方法,包括:通过确定EDU中主、述位的位置间接获得EDU的边界,因此可将EDU识别分成两个部分,首先进行主、述位识别,然后在识别主位和述位后再依据一定的规则合并得到EDU。本发明的有益效果:参考了英文基本篇章单元的识别方法,结合汉语实际情况,在使用深度学习方法的同时引入主述位结构,一方面将EDU识别当作关于主述位的序列化标注问题,实现了主述位结构与EDU的联合识别;另一方面从EDU内部构成的完整性角度进行EDU边界的识别,提升了EDU的识别性能。
-
公开(公告)号:CN109885841B
公开(公告)日:2023-07-11
申请号:CN201910212569.7
申请日:2019-03-20
Applicant: 苏州大学
IPC: G06F40/211 , G06F40/289
Abstract: 本发明公开了一种基于结点表示法的指代消解方法,包括:结点表示法:给定成分句法树,通过后序遍历得到其对应的结点序列,然后通过“字词嵌入替换法”获得其初始表示,通过双向长短时记忆网络获得其上下文表示;特征补充法:从成分句法树上提出每个结点的特征集加入初始表示中,丰富节点的表示;结点更新法:结合注意力机制与门控机制,利用孩子节点序列更新双亲结点的表示;结点枚举策略。本发明的有益效果:通过“结点表示法”、“特征补充法”、“节点更新法”与节点枚举策略,将整棵成分句法树的信息编码加入模型中,弥补了传统模型忽略结构信息与句法信息的不足,增强了句法结构信息在指代消解系统中的表达。
-
公开(公告)号:CN109325242B
公开(公告)日:2023-06-13
申请号:CN201811094517.6
申请日:2018-09-19
Applicant: 苏州大学
IPC: G06F40/58 , G06F40/289 , G06F40/242 , G06N3/0464 , G06N3/044 , G06N3/045
Abstract: 本发明公开了一种基于词典和翻译判断句子是否对齐的方法,在对源文本句进行分词得到源文本词之后,还确定了与源文本词对应的翻译文本词,并据此更新了源文本词序列,最后根据源文本句以及目标文本句对应的隐藏状态序列,判断源文本句与目标文本句是否对齐。可见,该方法不依赖于源文本句与目标文本句本身去判断二者是否对齐,而是结合源文本句中各个词的翻译,将该翻译的信息融入到了源文本句的抽象表示中,进而根据源文本句与目标文本句的抽象表示来判断二者是否对齐,极大的提高了判断的精准性。此外,本发明还提供了一种基于词典和翻译判断句子是否对齐的装置、设备及计算机可读存储介质,其作用与上述方法相对应。
-
公开(公告)号:CN109960803B
公开(公告)日:2023-04-18
申请号:CN201910212932.5
申请日:2019-03-20
Applicant: 苏州大学
IPC: G06F40/211 , G06F40/295
Abstract: 本发明公开了一种基于成分句法压缩树的指代消解方法。本发明基于成分句法压缩树的指代消解方法,包括:(1)定义“压缩”操作;(2)针对成分句法树的压缩算法;(3)从成分句法压缩树上提取特征应用于指代消解任务。本发明的有益效果:减小了原始成分句法树的复杂结构,消除了对于指代消解任务无关的冗余结点的信息,为指代消解任务提供了简洁而精确的结构信息,增强了结构信息与层次关系在神经指代消解系统中的表达。
-
公开(公告)号:CN115687611A
公开(公告)日:2023-02-03
申请号:CN202211136811.5
申请日:2022-09-19
Applicant: 苏州大学
IPC: G06F16/35 , G06F40/284 , G06F40/289 , G06F40/126 , G06F40/30 , G06N3/048 , G06N3/047 , G06N3/08
Abstract: 本申请公开了一种生物医学事件组装方法、装置、设备及介质,涉及自然语言处理技术领域,该方法包括:基于待组装文本的触发词类型,将所述待组装文本的触发词和所述待组装文本的论元进行组合,以得到所述待组装文本的候选事件;利用嵌套标记法对所述候选事件的触发词和所述候选事件的论元进行标记,以得到候选实例;利用预设深度学习模型对所述候选实例进行编码,以得到所述候选实例的语义信息的输出表征;获取所述输出表征的预设合法类别的第一概率结果以及预设非法类别的第二概率结果,然后基于所述第一概率结果和所述第二概率结果从所述候选事件中确定出目标生物医学事件。能够提高生物医学事件组装的性能。
-
公开(公告)号:CN115081436B
公开(公告)日:2022-12-30
申请号:CN202210831553.6
申请日:2022-07-15
Applicant: 苏州大学
IPC: G06F40/279 , G06F40/268 , G06F40/284 , G06F40/44 , G06K9/62
Abstract: 本发明公开了一种否定焦点的识别方法及系统,将待识别文本转换成词序列输入已经训练好的模型中,将词序列生成编码向量和特征向量,再基于给定的否定条件利用编码向量、特征向量及之前生成的所有否定焦点的起始标记和结束标记,计算生成下一个否定焦点的起始标记或结束标记;相比于现有的序列标注模型,对待识别文本中每个词进行标注,本发明生成标记为每个否定焦点的起始和结束,最终得到的是否定焦点范围,在计算下一个否定焦点时不需要根据词序列中每个词再计算,一定程度上减少了计算量,提高了计算效率,同时也能满足在单一否定条件下的否定焦点识别,计算量减少了,计算效率也提高了。
-
公开(公告)号:CN115048924B
公开(公告)日:2022-12-23
申请号:CN202210976289.5
申请日:2022-08-15
Applicant: 苏州大学
IPC: G06F40/211 , G06F40/279 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于否定前后缀信息的否定句识别方法,本发明基于否定前后缀信息的否定句识别方法首先利用单词训练集训练辅助任务模型,用于获取带有否定前后缀的单词的信息;然后利用句子训练集训练主任务模型,用于否定句的识别,在主任务模型训练过程中,利用训练好的辅助任务模型得到句子中带有否定前后缀的单词的第一隐层特征表示,并将其插入至所在句子的第二隐层特征表示中更新整个句子的隐层特征表示,进行主任务模型的训练;最后利用训练好的主任务模型和辅助任务模型对目标句子进行识别。本发明将否定词识别建模为匹配模型,通过对句子中的带有否定前后缀的单词进行识别并更新句子的隐层特征表示,可以大幅提升否定句识别准确率。
-
公开(公告)号:CN114896971B
公开(公告)日:2022-09-30
申请号:CN202210831562.5
申请日:2022-07-15
Applicant: 苏州大学
IPC: G06F40/284 , G06F40/242 , G06F40/211 , G06F40/30
Abstract: 本发明在少样本学习的基础上,提出了一种输入扩展方式,将该提示输入模板应用于否定词识别方法中,实现了面向单词级别的否定词识别,不需要利用上下文信息,节省了资源;并且,本发明涉及的提示输入模板,一部分受输入内容的动态影响,根据输入的单词,去除其特定前后缀,利用了输入单词本身蕴含的词内信息,输入模板中的文本描述是同输入相关的,组成的提示模板句子更容易与输入单词语义接近,能更好地引出语言模型在预训练时学到的知识;同时预测选定的标签描述词是否应该存在于当前这个位置,使其组成更合理的句子,使语义通顺,进而依据此对输入的待测单词进行识别,提高了特定前后缀否定词的识别准确率。
-
公开(公告)号:CN114896971A
公开(公告)日:2022-08-12
申请号:CN202210831562.5
申请日:2022-07-15
Applicant: 苏州大学
IPC: G06F40/284 , G06F40/242 , G06F40/211 , G06F40/30
Abstract: 本发明在少样本学习的基础上,提出了一种输入扩展方式,将该提示输入模板应用于否定词识别方法中,实现了面向单词级别的否定词识别,不需要利用上下文信息,节省了资源;并且,本发明涉及的提示输入模板,一部分受输入内容的动态影响,根据输入的单词,去除其特定前后缀,利用了输入单词本身蕴含的词内信息,输入模板中的文本描述是同输入相关的,组成的提示模板句子更容易与输入单词语义接近,能更好地引出语言模型在预训练时学到的知识;同时预测选定的标签描述词是否应该存在于当前这个位置,使其组成更合理的句子,使语义通顺,进而依据此对输入的待测单词进行识别,提高了特定前后缀否定词的识别准确率。
-
公开(公告)号:CN113297352A
公开(公告)日:2021-08-24
申请号:CN202110628590.2
申请日:2021-06-07
Applicant: 苏州大学
Abstract: 本申请涉及一种基于多任务网络的属性级情感分类方法及装置,属于情感分析技术领域。该方法包括:获取情感分类样本语料并对语料进行预处理,得到处理后的样本语料;构建预设分类模型,所述预设分类模型包括属性级情感分类主任务网络、篇章级情感分类辅助任务网络、上下句情感连贯性判断辅助任务网络,所述主任务网络和辅助任务网络由共享的编码层和与编码层相连的各独立分类层构成;将所述处理后的样本语料输入所述预设分类模型并利用预设的损失函数进行训练,得到情感分类模型,所述情感分类模型用于对输入的待分类语料进行属性级情感分类。本申请有效地提高属性级情感分类的性能。
-
-
-
-
-
-
-
-
-