一种基于用户评论和历史评分的网购产品评估方法

    公开(公告)号:CN106296282A

    公开(公告)日:2017-01-04

    申请号:CN201610643257.8

    申请日:2016-08-08

    Applicant: 南京大学

    CPC classification number: G06Q30/0203 G06F16/00 G06K9/6282

    Abstract: 本发明公开了一种基于用户评论和历史评分的产品评估方法,通过获取网购产品的用户评论;基于句子的情感词,完成情感估分,再针对用户评论,结合句子的情感估分及位置,加权平均计算用户评论的情感估分;提取用户评论的文档特征,基于历史平均值设置用户评论标签,采用bootstrap采样生成多个训练集来训练多个随机森林分类器,加权平均计算分类器估分;对情感估分和分类器估分加权平均计算,获得每个用户评论的综合估分,最后采用平均法得到一个产品的综合估分;本方法避免用户的评分习性带来的影响,具有扩展性和适应性,充分考虑不同用户评论的情感倾向,以及用户的评分习性,帮助用户做出更好的选择,从而提高产品评价的客观性和准确性。

    一种基于词分布和文档特征的垃圾评论自动分类方法

    公开(公告)号:CN105183715B

    公开(公告)日:2018-02-09

    申请号:CN201510549592.7

    申请日:2015-08-31

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于词分布和文档特征的垃圾评论自动分类方法,首先收集网络评论,对评论分词得到关键词集合;再建立词分布矩阵,训练语言模型,计算未标注网络评论属于正常评论和垃圾评论的分类概率;之后提取网络评论的文档特征,计算未标注网络评论的分类概率;最后对分类概率计算加权平均,重复上述步骤直到前后两次计算的分类概率相同或达到给定的迭代次数。该方法综合考虑网络评论中词分布特征和文档特征,通过自学习策略自动完成网络评论分类,帮助识别其中的垃圾评论的方法。本发明计算简单,通用性和扩展性强,只要少量具有标注的网络评论即可对大量的评论进行实时分类,适用于即时更新的网络评论中快速识别垃圾评论的应用需求。

    一种砂岩显微薄片的自动分类方法

    公开(公告)号:CN105354600A

    公开(公告)日:2016-02-24

    申请号:CN201510628405.4

    申请日:2015-09-28

    Applicant: 南京大学

    CPC classification number: G06K9/66

    Abstract: 本发明公开了一种砂岩显微薄片的自动分类方法,其步骤是:1)对砂岩的显微薄片图像进行预处理,分割矿物颗粒;2)以颗粒为单位分别提取纹理和形状特征,选择代表颗粒,构成薄片图像的特征向量;3)对目标地域的砂岩薄片,基于欧氏距离采用近邻法选择相似的砂岩薄片样本,构建训练集合;4)精化训练集数据,包括类间平衡和特征降维;5)训练随机森林分类器,预测砂岩薄片的种类。本方法运用图像处理技术和机器学习方法,自动鉴别来自不同地域的砂岩薄片种类,能够解决由于地域不同导致的砂岩薄片结构差异较大而难于互相借鉴的问题。

    一种基于词分布和文档特征的垃圾评论自动分类方法

    公开(公告)号:CN105183715A

    公开(公告)日:2015-12-23

    申请号:CN201510549592.7

    申请日:2015-08-31

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于词分布和文档特征的垃圾评论自动分类方法,首先收集网络评论,对评论分词得到关键词集合;再建立词分布矩阵,训练语言模型,计算未标注网络评论属于正常评论和垃圾评论的分类概率;之后提取网络评论的文档特征,计算未标注网络评论的分类概率;最后对分类概率计算加权平均,重复上述步骤直到前后两次计算的分类概率相同或达到给定的迭代次数。该方法综合考虑网络评论中词分布特征和文档特征,通过自学习策略自动完成网络评论分类,帮助识别其中的垃圾评论的方法。本发明计算简单,通用性和扩展性强,只要少量具有标注的网络评论即可对大量的评论进行实时分类,适用于即时更新的网络评论中快速识别垃圾评论的应用需求。

Patent Agency Ranking