基于DBSCAN-cGAN-XGBoost模型在不平衡数据上生成累次违规人员用户画像的方法

    公开(公告)号:CN118211087A

    公开(公告)日:2024-06-18

    申请号:CN202311740286.2

    申请日:2023-12-18

    Applicant: 新疆大学

    Abstract: 基于DBSCAN‑cGAN‑XGBoost模型在不平衡数据上生成累次违规人员用户画像的方法,其属于用户画像生成的技术领域。该方法包括:首先,利用DBSCAN算法对提取出的稀少违规行为标签样本数据进行聚类处理,提取出簇内样本与噪声样本;然后,采用条件采样生成对抗网络模型cGAN,指定生成样本的条件满足特征的逻辑,对提取出的簇内样本进行扩充;最后,使用重新构建后的数据集对XGBoost算法进行训练,并完成违规行为类型数据的预测。再选取合适的阈值,生成预测标签,结合基本属性和行为属性标签生成的累次违规人员用户画像。和基准模型比较在数据平衡、准确率提升、用户画像构建等多个方面取得了突出的贡献。首次在不平衡数据集上实现累次违规人员用户画像,提供了准确、全面、直观的数据信息。

Patent Agency Ranking