-
公开(公告)号:CN105354600A
公开(公告)日:2016-02-24
申请号:CN201510628405.4
申请日:2015-09-28
Applicant: 南京大学
IPC: G06K9/66
CPC classification number: G06K9/66
Abstract: 本发明公开了一种砂岩显微薄片的自动分类方法,其步骤是:1)对砂岩的显微薄片图像进行预处理,分割矿物颗粒;2)以颗粒为单位分别提取纹理和形状特征,选择代表颗粒,构成薄片图像的特征向量;3)对目标地域的砂岩薄片,基于欧氏距离采用近邻法选择相似的砂岩薄片样本,构建训练集合;4)精化训练集数据,包括类间平衡和特征降维;5)训练随机森林分类器,预测砂岩薄片的种类。本方法运用图像处理技术和机器学习方法,自动鉴别来自不同地域的砂岩薄片种类,能够解决由于地域不同导致的砂岩薄片结构差异较大而难于互相借鉴的问题。
-
公开(公告)号:CN105183715B
公开(公告)日:2018-02-09
申请号:CN201510549592.7
申请日:2015-08-31
Applicant: 南京大学
Abstract: 本发明公开了一种基于词分布和文档特征的垃圾评论自动分类方法,首先收集网络评论,对评论分词得到关键词集合;再建立词分布矩阵,训练语言模型,计算未标注网络评论属于正常评论和垃圾评论的分类概率;之后提取网络评论的文档特征,计算未标注网络评论的分类概率;最后对分类概率计算加权平均,重复上述步骤直到前后两次计算的分类概率相同或达到给定的迭代次数。该方法综合考虑网络评论中词分布特征和文档特征,通过自学习策略自动完成网络评论分类,帮助识别其中的垃圾评论的方法。本发明计算简单,通用性和扩展性强,只要少量具有标注的网络评论即可对大量的评论进行实时分类,适用于即时更新的网络评论中快速识别垃圾评论的应用需求。
-
公开(公告)号:CN105183715A
公开(公告)日:2015-12-23
申请号:CN201510549592.7
申请日:2015-08-31
Applicant: 南京大学
Abstract: 本发明公开了一种基于词分布和文档特征的垃圾评论自动分类方法,首先收集网络评论,对评论分词得到关键词集合;再建立词分布矩阵,训练语言模型,计算未标注网络评论属于正常评论和垃圾评论的分类概率;之后提取网络评论的文档特征,计算未标注网络评论的分类概率;最后对分类概率计算加权平均,重复上述步骤直到前后两次计算的分类概率相同或达到给定的迭代次数。该方法综合考虑网络评论中词分布特征和文档特征,通过自学习策略自动完成网络评论分类,帮助识别其中的垃圾评论的方法。本发明计算简单,通用性和扩展性强,只要少量具有标注的网络评论即可对大量的评论进行实时分类,适用于即时更新的网络评论中快速识别垃圾评论的应用需求。
-
-