-
公开(公告)号:CN117992819A
公开(公告)日:2024-05-07
申请号:CN202311779706.8
申请日:2023-12-22
Applicant: 北京工业大学
IPC: G06F18/24 , G06F18/214 , G06F18/213 , G06F18/25 , G06Q30/0201 , G06Q40/03 , G06N20/20
Abstract: 本发明公开了基于集成学习的多特征融合金融用户画像分类方法,适用于金融领域多特征、多类别数据的分类挑战。首先,获取具有多种类型特征的金融用户数据并进行预处理,通过使用多种基本分类算法为每个特征类型选择最优基分类器,随后基于确定的基模型,对样本中不同类型特征进行训练,得到各类别的预测概率值,形成预测概率矩阵。根据每个基模型在训练数据上的召回率与所有基模型的召回率的比值调整权重,将权重融入各模型的预测结果。然后,将加权后的预测概率矩阵与原始输入特征矩阵进行整合,构建新的输入特征集合,并将其输入至第二层的XGBoost分类器中,最终得到每个金融用户样本的分类预测结果。
-
公开(公告)号:CN117668225A
公开(公告)日:2024-03-08
申请号:CN202311584640.7
申请日:2023-11-27
Applicant: 北京工业大学
IPC: G06F16/35 , G06F40/284 , G06F40/30 , G06N3/126
Abstract: 一种基于遗传算法的文本情感分类方法属于基于情感分类领域。本发明结合遗传算法和机器学习分类技术,旨在自动提取最佳文本特征,构建高性能情感分类模型。具体步骤包括数据预处理、特征预筛选、基于遗传算法的特征选择和模型构建,其中遗传算法用于特征选择和模型优化,适应度函数中纳入特征数量,模型准确率等指标。最终,集成不同基模型以构建强大的情感分类模型。
-