-
公开(公告)号:CN110019677A
公开(公告)日:2019-07-16
申请号:CN201711263641.6
申请日:2017-11-30
Applicant: 南京大学
IPC: G06F16/33 , G06F16/9535 , G06F17/27
Abstract: 本发明公开了基于聚类分析的微博广告发布者识别方法及装置,该微博广告识别方法对于用户维度,针对微博广告发布者通过发布大量普通微博来稀释其广告内容的现象,提出核心微博的概念,通过提取核心微博主题及其对应的微博序列,以此计算用户特征和对应微博的文本特征,并使用聚类算法对特征进行聚类,从而识别其中的微博广告发布者。实验结果显示该方法具有很高的准确率,证明该方法在广告内容被人为稀释的情况下能准确地识别微博广告发布者,可以为微博垃圾信息识别、清理等工作提供实用方法。