-
公开(公告)号:CN103812872B
公开(公告)日:2016-11-23
申请号:CN201410073426.X
申请日:2014-02-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于混合狄利克雷过程的网络水军行为检测方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据,并对每个维度的原始数据进行量化表示构成用户的历史行为向量,构成待聚类用户数据集;对待聚类用户数据集中的历史行为向量进行聚类,得到至少一个分类用户行为集合;将所有分类用户行为集合中的数据进行转换,对转换后的数据中具有相同用户标识的数据合并,得到序列数据库;模式挖掘模块对序列数据库进行序列模式挖掘,得到分别对应每个分类用户行为集合的至少一个事务序列模式;水军判断模块比较每个事务序列模式,就可以判断出哪个分类用户行为集合是水军账号。本发明很容易分辨出哪一类属于水军账号。
-
公开(公告)号:CN103795592A
公开(公告)日:2014-05-14
申请号:CN201410027720.7
申请日:2014-01-21
Applicant: 中国科学院信息工程研究所
IPC: H04L12/26
Abstract: 本发明涉及一种网络水军的检测方法及装置。其中,网络水军的检测方法包括:步骤一,将原始的用户描述信息表示为归一化的用户描述向量,从用户描述向量中筛选出已分类数据,将该已分类数据的a%作为深度信念网络DBN模型的训练数据,将该已分类数据的b%作为DBN模型的检测数据;步骤二,用训练数据训练DBN模型,输出训练得到的DBN模型;步骤三,检验输出DBN模型的收敛性和判定准确率,根据检验结果调整所述步骤一和步骤二中的相关参数,直至所述输出DBN模型达到预设收敛条件或终止条件;步骤四,使用最终DBN模型对网络水军进行检测。本发明的网络水军的检测方法及装置,既提高了网络水军检测算法的收敛性和准确率,又缩短了海量样本数据下的模型训练时间。
-
公开(公告)号:CN103745002B
公开(公告)日:2017-01-18
申请号:CN201410035139.X
申请日:2014-01-24
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于行为特征与内容特征融合的水军识别方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据;利用马尔可夫链蒙特卡罗随机模型进行行为特征维度和内容特征维度的融合,组成用户特征向量;利用用户特征向量进行DBN模型训练,得到DBN模型;对DBN模型进行检测,判断检测结果是否达到预定标准,如果是则结束;否则根据检测结果生成相应的调节命令,分别调节特征融合阶段和DBN模型训练阶段的相关参数;在DBN训练过程中根据识别准确率不断优化行为特征与内容特征的比例分配,具体特征的选取,以及对DBN模型训练过程中迭代次数的调整,达到较优的训练效果,最终提高识别准确率和识别方法的自适应性。
-
公开(公告)号:CN103729678B
公开(公告)日:2016-10-05
申请号:CN201310681479.5
申请日:2013-12-12
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于改进DBN模型的水军检测方法,具体包括以下步骤:步骤1:采用已分类数据集对原始DBN深度信念网络模型进行训练和检测,构成改进DBN深度信念网络模型;步骤2:将待分类数据集中的数据输入改进DBN深度信念网络模型进行分类,完成对水军用户的识别。本发明结合DBN深度信念网络和PSO粒子群算法对“苍蝇水军”进行识别,然后构造DBN模型,用已分类数据集对模型进行训练,最后用得到的模型对待分类用户数据进行分类,即实现了“苍蝇水军”的识别。该方法是对BP神经网络算法的改进,既可以保证较高的判定准确率,又具有较短的训练时间,且不易陷入局部最优解。
-
公开(公告)号:CN103955714A
公开(公告)日:2014-07-30
申请号:CN201410146467.7
申请日:2014-04-09
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及水军检测模型构建方法,包括步骤:对一组样本数据进行任务分割得到多个任务,平均特征抽取得到多个任务的训练样本集;多任务特征选择,得到多个任务的特征权重矩阵;设定一个阈值δ,判断特征权重矩阵中的一个列向量中的最大值是否大于阈值δ,如是,下一步;否则,放弃所述列向量,执行步骤5;将所述列向量添加到共享特征项集合中;判断特征权重矩阵中是否存在未与阈值δ进行比较的列向量,如是,执行步骤3;否则,下一步;输入新的训练数据集;计算得到线性分类值;设置水军阈值,使线性分类值大于水军阈值时判定其为水军。本发明利用多任务学习的方法建立水军检测模型,实现了方便快捷的识别出水军用户。
-
公开(公告)号:CN103812872A
公开(公告)日:2014-05-21
申请号:CN201410073426.X
申请日:2014-02-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于混合狄利克雷过程的网络水军行为检测方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据,并对每个维度的原始数据进行量化表示构成用户的历史行为向量,构成待聚类用户数据集;对待聚类用户数据集中的历史行为向量进行聚类,得到至少一个分类用户行为集合;将所有分类用户行为集合中的数据进行转换,对转换后的数据中具有相同用户标识的数据合并,得到序列数据库;模式挖掘模块对序列数据库进行序列模式挖掘,得到分别对应每个分类用户行为集合的至少一个事务序列模式;水军判断模块比较每个事务序列模式,就可以判断出哪个分类用户行为集合是水军账号。本发明很容易分辨出哪一类属于水军账号。
-
公开(公告)号:CN103729678A
公开(公告)日:2014-04-16
申请号:CN201310681479.5
申请日:2013-12-12
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于改进DBN模型的水军检测方法,具体包括以下步骤:步骤1:采用已分类数据集对原始DBN深度信念网络模型进行训练和检测,构成改进DBN深度信念网络模型;步骤2:将待分类数据集中的数据输入改进DBN深度信念网络模型进行分类,完成对水军用户的识别。本发明结合DBN深度信念网络和PSO粒子群算法对“苍蝇水军”进行识别,然后构造DBN模型,用已分类数据集对模型进行训练,最后用得到的模型对待分类用户数据进行分类,即实现了“苍蝇水军”的识别。该方法是对BP神经网络算法的改进,既可以保证较高的判定准确率,又具有较短的训练时间,且不易陷入局部最优解。
-
公开(公告)号:CN103795592B
公开(公告)日:2017-01-25
申请号:CN201410027720.7
申请日:2014-01-21
Applicant: 中国科学院信息工程研究所
IPC: H04L12/26
Abstract: 本发明涉及一种网络水军的检测方法及装置。其中,网络水军的检测方法包括:步骤一,将原始的用户描述信息表示为归一化的用户描述向量,从用户描述向量中筛选出已分类数据,将该已分类数据的a%作为深度信念网络DBN模型的训练数据,将该已分类数据的b%作为DBN模型的检测数据;步骤二,用训练数据训练DBN模型,输出训练得到的DBN模型;步骤三,检验输出DBN模型的收敛性和判定准确率,根据检验结果调整所述步骤一和步骤二中的相关参数,直至所述输出DBN模型达到预设收敛条件或终止条件;步骤四,使用最终DBN模型对网络水军进行检测。本发明的网络水军的检测方法及装置,既提高了网络水军检测算法的收敛性和准确率,又缩短了海量样本数据下的模型训练时间。
-
公开(公告)号:CN103745002A
公开(公告)日:2014-04-23
申请号:CN201410035139.X
申请日:2014-01-24
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/30861 , G06N3/088
Abstract: 本发明涉及一种基于行为特征与内容特征融合的水军识别方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据;利用马尔可夫链蒙特卡罗随机模型进行行为特征维度和内容特征维度的融合,组成用户特征向量;利用用户特征向量进行DBN模型训练,得到DBN模型;对DBN模型进行检测,判断检测结果是否达到预定标准,如果是则结束;否则根据检测结果生成相应的调节命令,分别调节特征融合阶段和DBN模型训练阶段的相关参数;在DBN训练过程中根据识别准确率不断优化行为特征与内容特征的比例分配,具体特征的选取,以及对DBN模型训练过程中迭代次数的调整,达到较优的训练效果,最终提高识别准确率和识别方法的自适应性。
-
-
-
-
-
-
-
-