-
公开(公告)号:CN110956210A
公开(公告)日:2020-04-03
申请号:CN201911197218.X
申请日:2019-11-29
Applicant: 重庆邮电大学
Abstract: 本发明请求保护一种基于AP聚类的半监督网络水军识别方法及系统,涉及网络舆情领域,该方法包括以下步骤:(A)对爬取数据进行打标和数据清理,结合水军定义构造新特征;(B)将数据集拆分成训练集、测试集与验证集,作为水军识别模型的输入;(C)根据用户相似性将欧氏距离引入AP聚类算法与支持向量机算法(SVM)组合形成半监督网络水军识别模型;(D)将处理好的数据输入识别模型,判断每个用户是否为水军;(E)通过调整欧氏距离Radius的值提高模型的准确率,输出识别结果。本发明解决了现有算法中对打标数据质量和数量高度依赖,且打标数据不易获取的问题,能利用少量的打标数据实现较高准确率的识别。
-
公开(公告)号:CN110956210B
公开(公告)日:2023-03-28
申请号:CN201911197218.X
申请日:2019-11-29
Applicant: 重庆邮电大学
IPC: G06F18/214 , G06F18/23213 , G06Q50/00
Abstract: 本发明请求保护一种基于AP聚类的半监督网络水军识别方法及系统,涉及网络舆情领域,该方法包括以下步骤:(A)对爬取数据进行打标和数据清理,结合水军定义构造新特征;(B)将数据集拆分成训练集、测试集与验证集,作为水军识别模型的输入;(C)根据用户相似性将欧氏距离引入AP聚类算法与支持向量机算法(SVM)组合形成半监督网络水军识别模型;(D)将处理好的数据输入识别模型,判断每个用户是否为水军;(E)通过调整欧氏距离Radius的值提高模型的准确率,输出识别结果。本发明解决了现有算法中对打标数据质量和数量高度依赖,且打标数据不易获取的问题,能利用少量的打标数据实现较高准确率的识别。
-