一种基于多特征的微博用户属性分析方法

    公开(公告)号:CN111125486A

    公开(公告)日:2020-05-08

    申请号:CN201911340531.4

    申请日:2019-12-23

    Inventor: 程克非 单凤池

    Abstract: 本发明涉及一种基于多特征的微博用户属性分析方法,属于智能媒体计算和大数据分析技术领域。该方法包括:S1利用爬虫软件爬取用户微博博文信息并清洗、打标;S2通过word2vec模型构造微博博文信息的词向量,在此基础上根据集成学习的组合策略,得出用户微博文本特征;S3从用户微博数据中构造出用于微博属性分析的多特征体系,并通过基础特征构造出符合用户属性分析的复合特征;S4采用Stacking模型融合技术将多个基分类器进行融合,构造微博用户属性分析模型,输入待检测数据,得到最终的微博用户属性分析结果。本发明提高了微博用户属性分类的准确率,为商家给用户提供更高效的个性化推荐提供技术支持。

    一种基于多特征的微博用户属性分析方法

    公开(公告)号:CN111125486B

    公开(公告)日:2022-11-25

    申请号:CN201911340531.4

    申请日:2019-12-23

    Inventor: 程克非 单凤池

    Abstract: 本发明涉及一种基于多特征的微博用户属性分析方法,属于智能媒体计算和大数据分析技术领域。该方法包括:S1利用爬虫软件爬取用户微博博文信息并清洗、打标;S2通过word2vec模型构造微博博文信息的词向量,在此基础上根据集成学习的组合策略,得出用户微博文本特征;S3从用户微博数据中构造出用于微博属性分析的多特征体系,并通过基础特征构造出符合用户属性分析的复合特征;S4采用Stacking模型融合技术将多个基分类器进行融合,构造微博用户属性分析模型,输入待检测数据,得到最终的微博用户属性分析结果。本发明提高了微博用户属性分类的准确率,为商家给用户提供更高效的个性化推荐提供技术支持。

Patent Agency Ranking