-
公开(公告)号:CN119047520A
公开(公告)日:2024-11-29
申请号:CN202411198721.8
申请日:2024-08-29
Applicant: 重庆邮电大学
IPC: G06N3/0475 , G06N3/0455 , G06N3/047 , G06N3/094 , G06N3/084 , G06N20/00 , G06F18/214
Abstract: 本发明涉及一种基于纵向联邦学习的参与方对齐样本生成系统,属于数据生成填补技术领域,包括:多方属性相关性矩阵构建模块:用于将多个参与方的样本数据集进行对齐,并计算各参与方之间每个属性的相关性,构建多方属性相关性矩阵;属性对对应关系建立模块:用于根据多方属性相关性矩阵,分别从对齐样本数据集的各方中找出具有强相关性的属性对,建立该属性对中两个属性列所有取值间的对应关系;缺失值生成模块:用于根据对应关系,建立两个属性列取值的关联规则,对参与方属性列的缺失值进行生成;生成对抗填补模块:利用参与方数据样本和生成的属性列缺失值对参与方剩余属性列的缺失值进行生成填补,获得完整的多方联合对齐样本数据集。
-
公开(公告)号:CN116523602A
公开(公告)日:2023-08-01
申请号:CN202310508313.7
申请日:2023-05-08
Applicant: 重庆邮电大学
IPC: G06Q30/0601 , G06Q40/00 , G06F21/62 , G06N3/0895 , G06N3/098 , G06N20/00
Abstract: 本发明涉及一种多方半监督学习的金融产品潜在用户推荐方法,属于大数据推荐领域,针对金融产品提供方只拥有正样本的己方数据而无法进行推荐的问题,在保护多方数据安全隐私的情况下,联合多方未标记数据进行多次随机采样,构建正负样本均衡的二分类数据集,训练基于基学习器的纵向联邦学习模型,根据其预测结果,从未标记样本数据中选出可靠正样本,多次迭代数据集重构采样、模型训练预测过程,选出批量可靠正样本。本方法有效地解决了只有少量正样本和大量未标记样本的批量推荐,提高了推荐的可靠性,实现了金融产品潜在用户的精准与批量推荐。
-