一种基于AP聚类的半监督网络水军识别方法及系统

    公开(公告)号:CN110956210A

    公开(公告)日:2020-04-03

    申请号:CN201911197218.X

    申请日:2019-11-29

    Abstract: 本发明请求保护一种基于AP聚类的半监督网络水军识别方法及系统,涉及网络舆情领域,该方法包括以下步骤:(A)对爬取数据进行打标和数据清理,结合水军定义构造新特征;(B)将数据集拆分成训练集、测试集与验证集,作为水军识别模型的输入;(C)根据用户相似性将欧氏距离引入AP聚类算法与支持向量机算法(SVM)组合形成半监督网络水军识别模型;(D)将处理好的数据输入识别模型,判断每个用户是否为水军;(E)通过调整欧氏距离Radius的值提高模型的准确率,输出识别结果。本发明解决了现有算法中对打标数据质量和数量高度依赖,且打标数据不易获取的问题,能利用少量的打标数据实现较高准确率的识别。

    一种基于AP聚类的半监督网络水军识别方法及系统

    公开(公告)号:CN110956210B

    公开(公告)日:2023-03-28

    申请号:CN201911197218.X

    申请日:2019-11-29

    Abstract: 本发明请求保护一种基于AP聚类的半监督网络水军识别方法及系统,涉及网络舆情领域,该方法包括以下步骤:(A)对爬取数据进行打标和数据清理,结合水军定义构造新特征;(B)将数据集拆分成训练集、测试集与验证集,作为水军识别模型的输入;(C)根据用户相似性将欧氏距离引入AP聚类算法与支持向量机算法(SVM)组合形成半监督网络水军识别模型;(D)将处理好的数据输入识别模型,判断每个用户是否为水军;(E)通过调整欧氏距离Radius的值提高模型的准确率,输出识别结果。本发明解决了现有算法中对打标数据质量和数量高度依赖,且打标数据不易获取的问题,能利用少量的打标数据实现较高准确率的识别。

Patent Agency Ranking