-
公开(公告)号:CN103955714A
公开(公告)日:2014-07-30
申请号:CN201410146467.7
申请日:2014-04-09
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及水军检测模型构建方法,包括步骤:对一组样本数据进行任务分割得到多个任务,平均特征抽取得到多个任务的训练样本集;多任务特征选择,得到多个任务的特征权重矩阵;设定一个阈值δ,判断特征权重矩阵中的一个列向量中的最大值是否大于阈值δ,如是,下一步;否则,放弃所述列向量,执行步骤5;将所述列向量添加到共享特征项集合中;判断特征权重矩阵中是否存在未与阈值δ进行比较的列向量,如是,执行步骤3;否则,下一步;输入新的训练数据集;计算得到线性分类值;设置水军阈值,使线性分类值大于水军阈值时判定其为水军。本发明利用多任务学习的方法建立水军检测模型,实现了方便快捷的识别出水军用户。
-
公开(公告)号:CN103812872A
公开(公告)日:2014-05-21
申请号:CN201410073426.X
申请日:2014-02-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于混合狄利克雷过程的网络水军行为检测方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据,并对每个维度的原始数据进行量化表示构成用户的历史行为向量,构成待聚类用户数据集;对待聚类用户数据集中的历史行为向量进行聚类,得到至少一个分类用户行为集合;将所有分类用户行为集合中的数据进行转换,对转换后的数据中具有相同用户标识的数据合并,得到序列数据库;模式挖掘模块对序列数据库进行序列模式挖掘,得到分别对应每个分类用户行为集合的至少一个事务序列模式;水军判断模块比较每个事务序列模式,就可以判断出哪个分类用户行为集合是水军账号。本发明很容易分辨出哪一类属于水军账号。
-
公开(公告)号:CN103745002B
公开(公告)日:2017-01-18
申请号:CN201410035139.X
申请日:2014-01-24
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于行为特征与内容特征融合的水军识别方法及系统,其方法为,采集包括用户行为特征和内容特征的原始数据;利用马尔可夫链蒙特卡罗随机模型进行行为特征维度和内容特征维度的融合,组成用户特征向量;利用用户特征向量进行DBN模型训练,得到DBN模型;对DBN模型进行检测,判断检测结果是否达到预定标准,如果是则结束;否则根据检测结果生成相应的调节命令,分别调节特征融合阶段和DBN模型训练阶段的相关参数;在DBN训练过程中根据识别准确率不断优化行为特征与内容特征的比例分配,具体特征的选取,以及对DBN模型训练过程中迭代次数的调整,达到较优的训练效果,最终提高识别准确率和识别方法的自适应性。
-
公开(公告)号:CN104281882A
公开(公告)日:2015-01-14
申请号:CN201410472689.8
申请日:2014-09-16
Applicant: 中国科学院信息工程研究所
CPC classification number: G06Q50/01 , G06F16/958
Abstract: 本发明提供了基于用户特征的预测社交网络信息流行度的方法,该方法包括:获取社交网络中的用户数据和信息数据;从用户数据中提取部分用户属性特征及用户行为特征;根据用户属性特征和用户行为特征将用户数据进行分类;根据信息数据及用户的类别,得到信息数据对应的用户传播特征;根据用户传播特征得到社交网络信息流行度预测模型,采用预测模型对信息流行度进行预测。本发明提供的基于用户特征的预测社交网络信息流行度的系统,包括获取模块、特征提取模块、分类模块、处理模块、预测模型模块及预测模型。本发明结合用户行为特征的特点,更加准确地预测社交网络的信息传播,解决热点发现滞后、信息推送以及网络舆情监测实时性难以保证的问题。
-
公开(公告)号:CN103927340A
公开(公告)日:2014-07-16
申请号:CN201410119505.X
申请日:2014-03-27
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/30011 , G06F17/30675 , G06F17/30705 , G06F17/30737
Abstract: 本发明公开了一种密文检索方法,在客户端实现层次聚类的创建和索引的加密,服务器接收密文查询向量,通过基于层次聚类的密文索引可计算出各个文档向量和查询向量之间的相关度分数,并且根据该相关度分数实现文档排序功能,由于查询过程中没有查询所有的密文文档向量,而是搜索特定聚类内部的文档向量,所以查询时间大大减少,提高了密文检索效率。本发明支持多关键字可排序的密文检索,支持大数据量下的密文检索,同时,有效保护了数据隐私。
-
-
-
-