-
公开(公告)号:CN109472027A
公开(公告)日:2019-03-15
申请号:CN201811284749.8
申请日:2018-10-31
Applicant: 北京邮电大学
Abstract: 本发明提出一种基于博文相似性的社交机器人检测系统及方法,属于机器学习和社交网络技术领域。包括:离线数据库、特征提取模块、社交机器人检测模型训练模块、社交账号信息数据收集模块、社交机器人检测模块和检测结果输出模块。对离线数据集中账号使用语言是英语的每条账号数据进行元数据特征提取;对经过处理后的每条账号数据,账号的博文数量大于K条的对博文内容进行特征提取;将前述获取的元数据特征和博文内容提取的特征采用不同机器学习算法进行模型训练,选出最优检测模型作为最终的社交机器人检测模型。本发明通过提取包括博文相似性在内的多维特征,采用机器学习算法建立模型,从而达到检测社交网络中的账号是否为社交机器人的目的。