-
公开(公告)号:CN107688652A
公开(公告)日:2018-02-13
申请号:CN201710775894.5
申请日:2017-08-31
Applicant: 苏州大学
Abstract: 本发明涉及一种面向互联网新闻事件的演化式摘要生成方法,包括:输入相关新闻文档集合;通过LDA主题模型将文档表示为主题特征向量,所述主题特征向量的维数为第一预定值;将表示为主题特征向量的文档进行聚类,其中,每一类代表一个主题;计算每一个主题中各个文档的本地得分;计算每一个主题中各个文档的全局得分;计算每一个主题中各个文档的最终得分;从每一个主题中抽取得分高的文档标题按时间排序作为摘要;输出摘要。上述面向互联网新闻事件的演化式摘要生成方法保证抽取的摘要具有动态演化性且前后连贯,可读性强,实验结果表明该系统和传统多文档摘要系统相比,在冗余度,连贯性和动态演化性等几个方面有较大提升。
-
公开(公告)号:CN105868180A
公开(公告)日:2016-08-17
申请号:CN201610221211.7
申请日:2016-04-11
Applicant: 苏州大学
IPC: G06F17/27
CPC classification number: G06F17/277 , G06F17/2715 , G06F17/2765
Abstract: 本申请提供了一种互联网用户数据处理方法、装置及系统,互联网用户数据处理方法使用最大熵分类器计算每个词特征对应的待分类正预测子条件概率和待分类负预测子条件概率;计算得到待分类正预测条件概率,及计算得到待分类负预测条件概率;在待分类正预测条件概率最大的情况下,确定待测样本的类别为正;在待分类负预测条件概率最大的情况下,确定待测样本的类别为负,实现了使用最大熵分类器对待测样本类别的预测。在预测出待测样本的类别为正时,确定出待测样本的发言者的职业类型为学生,在预测出待测样本的类别为负时,确定出待测样本的发言者的职业类型为非学生,从而实现了对互联网用户的职业类型的识别。
-
公开(公告)号:CN104317784A
公开(公告)日:2015-01-28
申请号:CN201410521299.5
申请日:2014-09-30
Applicant: 苏州大学
IPC: G06F17/27
Abstract: 本发明公开的跨平台用户识别方法和系统,充分考虑社交平台中用户消息的重要性,通过相应时间段内不同平台的两个账户中用户消息所反映的用户见闻、兴趣、偏好以及写作风格、用词习惯等个性化信息的相似情况,来识别用户是否为同一用户,具体地,本发明方法获取不同平台的两个账户中发布时间在预设时间段内的消息内容,并对两个账户的消息内容进行分词及特征抽取处理,在此基础上,利用两个账户消息的分词特征相似度识别所述不同平台的两个账户是否属于同一用户。可见,本发明解决了不同社交平台同一用户的识别问题,进而为同一用户的跨平台数据分析提供了支持。
-
公开(公告)号:CN104199981A
公开(公告)日:2014-12-10
申请号:CN201410495083.6
申请日:2014-09-24
Applicant: 苏州大学
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06K9/6278
Abstract: 本发明提供一种基于微博文本的个人和机构用户分类方法及系统,本发明方法包括以下步骤。S1、根据微博网站提供的API收集用户发表的微博文本,并对收集到的用户类型进行标注。S2、将标注好的微博文本进行分词处理后作为训练样本,并利用所述训练样本构建贝叶斯分类器。S3、根据所述贝叶斯分类器对待测用户进行分类,并根据分类结果确定用户类别。本发明对于微博用户的自动分类,具有较高的准确性。
-
公开(公告)号:CN114332650B
公开(公告)日:2022-05-31
申请号:CN202210221862.1
申请日:2022-03-09
Applicant: 苏州大学
Abstract: 本发明公开了一种遥感图像道路识别方法及系统,包括:获取道路图像;对道路灰度图进行连通域分析,得到道路连通域;根据各关键点及其邻域像素的梯度方向和各关键点及其邻近像素到道路边缘的欧式距离,对道路连通域的支路进行分割,得到初次分割后的道路连通域;根据初次分割后道路连通域的长轴及短轴方向的方差和边缘规则程度计算初次分割后的道路连通域为非道路区域的概率;根据概率得到道路区域;根据像素点的修正概率及标签号对存在遮挡的道路区域进行修正,得到细分割后的道路区域;根据细分割后的道路区域对道路进行识别。本发明用于图像道路识别,通过上述方法可提高图像道路识别的准确度。
-
公开(公告)号:CN114332650A
公开(公告)日:2022-04-12
申请号:CN202210221862.1
申请日:2022-03-09
Applicant: 苏州大学
Abstract: 本发明公开了一种遥感图像道路识别方法及系统,包括:获取道路图像;对道路灰度图进行连通域分析,得到道路连通域;根据各关键点及其邻域像素的梯度方向和各关键点及其邻近像素到道路边缘的欧式距离,对道路连通域的支路进行分割,得到初次分割后的道路连通域;根据初次分割后道路连通域的长轴及短轴方向的方差和边缘规则程度计算初次分割后的道路连通域为非道路区域的概率;根据概率得到道路区域;根据像素点的修正概率及标签号对存在遮挡的道路区域进行修正,得到细分割后的道路区域;根据细分割后的道路区域对道路进行识别。本发明用于图像道路识别,通过上述方法可提高图像道路识别的准确度。
-
公开(公告)号:CN102279890A
公开(公告)日:2011-12-14
申请号:CN201110258876.2
申请日:2011-09-02
Applicant: 苏州大学
Abstract: 本发明实施例公开了一种基于微博的情感词提取收集方法,其步骤包括:接收情绪图标,并获取与所述情绪图标相对应的情绪图标极性;利用所述情绪图标以及主题关键词搜索并收集微博语料;根据所述情绪图标极性对微博语料进行情感分类;对所述微博语料进行分词,并获取所述词的词性标注;使用特征提取方法从所述微博语料中提取情感词,并收集;本实施例提供的提取收集方法利于保障提取收集的情感词的规模和时效性,同时也大大提高了收集的情感词的正确率。
-
公开(公告)号:CN101446944A
公开(公告)日:2009-06-03
申请号:CN200810243607.7
申请日:2008-12-10
Applicant: 苏州大学
IPC: G06F17/27
Abstract: 本发明公开了一种自然语言句子的语义关系树的构造方法,其特征在于,对于句子中待建立语义关系树的两个实体,首先构建最短路径包含树;如果两实体之间的结构类型不是谓词结构,则最短路径包含树即为所需的语义关系树;如果两实体之间的结构类型是谓词链接结构,则扩展与谓词相关的上下文信息,得到上下文相关的路径包含树,作为语义关系树。本发明的方法获得的语义关系树,既能涵盖关键的结构化句法信息,又能减少不必要的噪音,能在基本不影响关系抽取速度的前提下,提高关系抽取的性能;采用该语义关系树进行比较,结果更具有普遍性。
-
公开(公告)号:CN101446942A
公开(公告)日:2009-06-03
申请号:CN200810243605.8
申请日:2008-12-10
Applicant: 苏州大学
IPC: G06F17/27
Abstract: 本发明公开了一种自然语言句子的语义角色标注方法,其特征在于:采用联合学习模型,同时实现中文句法分析和语义角色标注。本发明通过联合模型的使用,能够同时输出一个句子的句法分析结果和给定谓词的语义角色标注结果。在联合学习模型中,由于句法分析模型中增加了语义信息,使得训练出来的模型更适合于语义角色标注任务,因此由此模型输出的语义角色标注性能更高。同时联合模型输出的句法分析结果同单个句法分析模型的结果相比,两者性能不会有很大差别,甚至由于语义信息的加入,还能够提高句法分析的性能。
-
公开(公告)号:CN101446941A
公开(公告)日:2009-06-03
申请号:CN200810243604.3
申请日:2008-12-10
Applicant: 苏州大学
IPC: G06F17/27
Abstract: 本发明公开了一种基于历史信息的自然语言层次句法分析方法,其特征在于:对已完成分词的句子,首先将各个词看成是初始组块,采用分层方式,根据上下文信息进行组块识别,将可以组合的组块构成新的组块,获得中间结果,对中间结果重复根据上下文信息进行组块识别及组合,直至只包含一个组块为止,该组块为句法树的根结点,由此获得表达自然语言的句法树。本发明在每层处理过程中,优先识别出容易识别的组块,能提供更丰富的上下文信息进行复杂组块识别,提高决策预测的正确率,从而提高了句法分析的性能。
-
-
-
-
-
-
-
-
-