-
公开(公告)号:CN104598510A
公开(公告)日:2015-05-06
申请号:CN201410548795.X
申请日:2014-10-16
Applicant: 苏州大学
CPC classification number: G06F17/30867 , G06F17/2785
Abstract: 本申请公开了一种事件触发词识别方法及装置,方法为:获取语料库中各条原始语料的语料特征,组成可用语料,利用预设的特征模板,从所述可用语料中提取所述语料特征,组成训练语料,利用所述训练语料对条件随机场模型进行训练,得到训练后的目标条件随机场模型,利用所述目标条件随机场模型对待测语料进行事件触发词的识别。本申请将事件的触发词识别任务看作是序列标注问题,使用条件随机场模型,可以充分的利用上下文信息,建立一个统一的概率模型,同时可以避免标签偏置的问题,提高事件触发词的识别效率及性能。
-
公开(公告)号:CN104346327A
公开(公告)日:2015-02-11
申请号:CN201410572252.1
申请日:2014-10-23
Applicant: 苏州大学
Abstract: 本申请提供的文本情绪复杂度的确定方法及装置,利用预先构建的分类器对待分类文本进行分类,获得分类结果,并确定分类结果中的最大概率值,将该最大概率值对应的情绪复杂度确定为待分类文本的情绪复杂度,从而利用分类器实现了对文本情绪复杂度的确定。确定出情绪复杂度的文本可以被保存至对应数据库,进而文本推荐系统可以读取该数据库中的文本在相应版块进行推荐,满足用户不同的阅读需求。
-
公开(公告)号:CN104317784A
公开(公告)日:2015-01-28
申请号:CN201410521299.5
申请日:2014-09-30
Applicant: 苏州大学
IPC: G06F17/27
Abstract: 本发明公开的跨平台用户识别方法和系统,充分考虑社交平台中用户消息的重要性,通过相应时间段内不同平台的两个账户中用户消息所反映的用户见闻、兴趣、偏好以及写作风格、用词习惯等个性化信息的相似情况,来识别用户是否为同一用户,具体地,本发明方法获取不同平台的两个账户中发布时间在预设时间段内的消息内容,并对两个账户的消息内容进行分词及特征抽取处理,在此基础上,利用两个账户消息的分词特征相似度识别所述不同平台的两个账户是否属于同一用户。可见,本发明解决了不同社交平台同一用户的识别问题,进而为同一用户的跨平台数据分析提供了支持。
-
公开(公告)号:CN104199981A
公开(公告)日:2014-12-10
申请号:CN201410495083.6
申请日:2014-09-24
Applicant: 苏州大学
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06K9/6278
Abstract: 本发明提供一种基于微博文本的个人和机构用户分类方法及系统,本发明方法包括以下步骤。S1、根据微博网站提供的API收集用户发表的微博文本,并对收集到的用户类型进行标注。S2、将标注好的微博文本进行分词处理后作为训练样本,并利用所述训练样本构建贝叶斯分类器。S3、根据所述贝叶斯分类器对待测用户进行分类,并根据分类结果确定用户类别。本发明对于微博用户的自动分类,具有较高的准确性。
-
公开(公告)号:CN102339362A
公开(公告)日:2012-02-01
申请号:CN201110350614.9
申请日:2011-11-08
Applicant: 苏州大学
IPC: G06F19/18
Abstract: 本发明公开了一种抽取蛋白质相互作用关系的方法,包括:对自然语句进行句法分析,确定该自然语句的完全句法树,在该完全句法树中提取两个蛋白质名称之间的最短成分路径;对自然语句进行依存关系分析,确定该自然语句的依存关系树,在该依存关系树中提取两个蛋白质名称之间的最短依存路径;根据最短依存路径扩展最短成分路径,确定扩展后的成分路径为该自然语句的关系树;利用预存的分类模型对该关系树进行二元分类。本发明公开的抽取方法,关系树中包含了丰富的结构化信息,具有较好的通用性,其精度和召回率得到了提高,总体性能较好,同时减小了系统开销。
-
公开(公告)号:CN115081436B
公开(公告)日:2022-12-30
申请号:CN202210831553.6
申请日:2022-07-15
Applicant: 苏州大学
IPC: G06F40/279 , G06F40/268 , G06F40/284 , G06F40/44 , G06K9/62
Abstract: 本发明公开了一种否定焦点的识别方法及系统,将待识别文本转换成词序列输入已经训练好的模型中,将词序列生成编码向量和特征向量,再基于给定的否定条件利用编码向量、特征向量及之前生成的所有否定焦点的起始标记和结束标记,计算生成下一个否定焦点的起始标记或结束标记;相比于现有的序列标注模型,对待识别文本中每个词进行标注,本发明生成标记为每个否定焦点的起始和结束,最终得到的是否定焦点范围,在计算下一个否定焦点时不需要根据词序列中每个词再计算,一定程度上减少了计算量,提高了计算效率,同时也能满足在单一否定条件下的否定焦点识别,计算量减少了,计算效率也提高了。
-
公开(公告)号:CN115048924B
公开(公告)日:2022-12-23
申请号:CN202210976289.5
申请日:2022-08-15
Applicant: 苏州大学
IPC: G06F40/211 , G06F40/279 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于否定前后缀信息的否定句识别方法,本发明基于否定前后缀信息的否定句识别方法首先利用单词训练集训练辅助任务模型,用于获取带有否定前后缀的单词的信息;然后利用句子训练集训练主任务模型,用于否定句的识别,在主任务模型训练过程中,利用训练好的辅助任务模型得到句子中带有否定前后缀的单词的第一隐层特征表示,并将其插入至所在句子的第二隐层特征表示中更新整个句子的隐层特征表示,进行主任务模型的训练;最后利用训练好的主任务模型和辅助任务模型对目标句子进行识别。本发明将否定词识别建模为匹配模型,通过对句子中的带有否定前后缀的单词进行识别并更新句子的隐层特征表示,可以大幅提升否定句识别准确率。
-
公开(公告)号:CN114896971B
公开(公告)日:2022-09-30
申请号:CN202210831562.5
申请日:2022-07-15
Applicant: 苏州大学
IPC: G06F40/284 , G06F40/242 , G06F40/211 , G06F40/30
Abstract: 本发明在少样本学习的基础上,提出了一种输入扩展方式,将该提示输入模板应用于否定词识别方法中,实现了面向单词级别的否定词识别,不需要利用上下文信息,节省了资源;并且,本发明涉及的提示输入模板,一部分受输入内容的动态影响,根据输入的单词,去除其特定前后缀,利用了输入单词本身蕴含的词内信息,输入模板中的文本描述是同输入相关的,组成的提示模板句子更容易与输入单词语义接近,能更好地引出语言模型在预训练时学到的知识;同时预测选定的标签描述词是否应该存在于当前这个位置,使其组成更合理的句子,使语义通顺,进而依据此对输入的待测单词进行识别,提高了特定前后缀否定词的识别准确率。
-
公开(公告)号:CN114896971A
公开(公告)日:2022-08-12
申请号:CN202210831562.5
申请日:2022-07-15
Applicant: 苏州大学
IPC: G06F40/284 , G06F40/242 , G06F40/211 , G06F40/30
Abstract: 本发明在少样本学习的基础上,提出了一种输入扩展方式,将该提示输入模板应用于否定词识别方法中,实现了面向单词级别的否定词识别,不需要利用上下文信息,节省了资源;并且,本发明涉及的提示输入模板,一部分受输入内容的动态影响,根据输入的单词,去除其特定前后缀,利用了输入单词本身蕴含的词内信息,输入模板中的文本描述是同输入相关的,组成的提示模板句子更容易与输入单词语义接近,能更好地引出语言模型在预训练时学到的知识;同时预测选定的标签描述词是否应该存在于当前这个位置,使其组成更合理的句子,使语义通顺,进而依据此对输入的待测单词进行识别,提高了特定前后缀否定词的识别准确率。
-
公开(公告)号:CN114841335A
公开(公告)日:2022-08-02
申请号:CN202210062288.X
申请日:2022-01-19
Applicant: 苏州大学
IPC: G06N3/08 , G06N3/04 , G06K9/62 , G06V10/764 , G06V10/774 , G06V10/778 , G06V10/82 , G06F16/35
Abstract: 本发明涉及一种基于变分蒸馏的多模态联合表示学习方法,包括部署学生模型、文本教师模型和图像教师模型,多模态数据包括原始的文本模态数据和图像模态数据,整理得到输入相同的文本模态输入和图像模态输入;将其分别输入至模态联合表示模块,得到文本输出和图像输出,将原始的文本模态数据和图像模态数据输入至文本教师模型和图像教师模型,得到文本输出和图像输出;利用变分互信息表征学生模型和教师模型对应的文本输出和图像输出的相关性,将文本输出和图像输出利用蒸馏损失函数进行联合蒸馏训练,使学生模型获得匹配教师模型的能力。本发明提出一种基于变分蒸馏的多模态联合表示学习方法及系统,在不同模态数据集上均超越了现有的基准模型。
-
-
-
-
-
-
-
-
-