基于语言和非语言特征的社交网络用户识别方法及装置

    公开(公告)号:CN111382366A

    公开(公告)日:2020-07-07

    申请号:CN202010139426.0

    申请日:2020-03-03

    Abstract: 本发明涉及自然语言处理、网络安全、社交网络、信息提取领域,尤其涉及一种基于语言和非语言特征的社交网络用户识别方法及装置,方法包括收集社交网络用户账号的评论文本,将不同的用户账号两两组合,得到社交网络马甲识别训练集;基于社交网络马甲识别训练集,从中提取语言和非语言的特征,将语言和非语言特征进行横向拼接;使用SVM模型对数据集进行训练,得到马甲识别模型,利用特征选择技术贪心算法选择最优的特征组合;将提取实时的两个用户的最优的特征组合,并将该特征组合输入SVM模型,即可识别出这两个用户账户是否为同一个用户操纵;本发明适用于任何的社交网络平台,模型简单、高效,对于识别马甲账号也有较高的准确率。

Patent Agency Ranking