一种自动离散连续特征归类的ACTGAN表格数据合成方法

    公开(公告)号:CN118210795A

    公开(公告)日:2024-06-18

    申请号:CN202211622145.6

    申请日:2022-12-16

    Applicant: 复旦大学

    Inventor: 吴杰 刘森 谭言丹

    Abstract: 本发明提供一种自动离散连续特征归类的ACTGAN表格数据合成方法,首先基于高斯核概率密度函数GPDF的峰值来识别离散变量和连续变量,其中峰值代表值出现的高概率,也意味着峰值中的值非常重要。因此,将特征中与类值比率高的峰值定义为离散类型,否则定义为连续类型。在区分离散和连续值后,基于独热编码和变分高斯混合编码分别对离散特征和连续特征进行编码,然后将编码的结果输入到ACTGAN,由判别器基于ELBO策略学习到编码数据的分布,生成器基于分布的噪声进行数据合成。本发明由于无需对特征类型以及特征列名先行了解,因此省去了费时费力的人工数据类型标注流程,能辅助模型实现更优的数据合成性能,同时模型参数更少,能节省计算资源,具有良好的应用性。

    基于自注意力集成自动多视野的信贷违约预测方法及装置

    公开(公告)号:CN119273130A

    公开(公告)日:2025-01-07

    申请号:CN202310812520.1

    申请日:2023-07-04

    Applicant: 复旦大学

    Inventor: 吴杰 谭言丹

    Abstract: 本发明提供一种基于自注意力集成自动多视野的信贷违约预测方法及装置,其中,基于离散连接性和正负相关性将用于模型训练的金融数据的特征自动划分为四个特征组,省去了费时的人工标注环节,且这种划分方式使得相同或类似的特征得以聚集,使得相异的特征得以区分,从而在信息组织层面上实现了更高的效率;采用基于自注意力机制的堆叠网络模型,该模型运用先进的自注意力机制,使得神经网络能够更加准确地识别和理解数据之间的内在关联,进一步,通过基于自注意力机制的堆叠泛化学习,能够有效集成来自不同视野的信息,并从中学习集成机制,该集成机制能够将不同的基神经网络模型所做出的预测结合起来,使得预测结果的准确度和鲁棒性得以大幅提升。

    基于ACGAN的横向联邦小微企业信用预测的数据贡献评估方法

    公开(公告)号:CN117314456A

    公开(公告)日:2023-12-29

    申请号:CN202210685708.X

    申请日:2022-06-17

    Applicant: 复旦大学

    Inventor: 吴杰 严明 谭言丹

    Abstract: 本发明涉及联邦学习技术领域,发明主要提供一种基于ACGAN的横向联邦小微企业信用预测的数据贡献评估方法。具体而言,是基于辅助对抗生成网络实现对真实数据分布的学习以识别具有异常分布的不可信数据,从而通过评估参与数据的可信度评估参与方的贡献度,同时隔离不可信数据,以防止其对信用风险度评估模型产生干扰。本发明还可根据协作方提供的数据进行实时贡献度评估,且防止不可信数据对信用风险模型的干扰,对于促进多方安全协作具有重大意义。

    用于风险画像构建的联合分箱标签生成方法及装置

    公开(公告)号:CN119443820A

    公开(公告)日:2025-02-14

    申请号:CN202411696231.0

    申请日:2024-11-25

    Applicant: 复旦大学

    Abstract: 本发明提供了一种用于风险画像构建的联合分箱标签生成方法及装置,具有这样的特征,包括步骤S1‑S3,将所有特征划分为多个子特征集合,并从所有子特征集合中根据特征的重要性值选取多个特征,构建重要性代表特征集合;步骤S4,对重要性代表特征集合进行分箱计算,得到重要性代表特征集合中各个目标对应的各个特征的分箱值,并根据所有分箱值构建分箱特征集合;步骤S5,对分箱特征集合中的各个特征进行联合,得到联合分箱特征集合;步骤S6,计算联合分箱特征集合中各个目标对应的各个特征的woe值。总之,本方法能够生成提高风险画像准确度的多个标签和每个目标的对应标签值。

    基于关键信息的多视野学习的复杂数据预测方法及装置

    公开(公告)号:CN119271664A

    公开(公告)日:2025-01-07

    申请号:CN202310812518.4

    申请日:2023-07-04

    Applicant: 复旦大学

    Inventor: 吴杰 谭言丹

    Abstract: 本发明提供一种基于关键信息的多视野学习的复杂数据预测方法及装置,由于金融表格数据等复杂数据中,特征与标签之间有低相关性,在面向这些复杂数据的预测方法中,特征选择在过滤关键信息方面起重要作用。为了关注关键信息并增加信息多样性,本发明提出了基于特征重要性的策略来组织多视图特征空间,包括线性相关、非线性相关和相似性度量,进一步,通过多层感知来获得不同视图中的输出作为局部视图知识,获取关键的局部视图知识,减少不太重要的信息的干扰。对于数据中的所有特征,通过多层感知器来获得全局特征空间,对于上述特征空间,通过多层感知来学习信息融合机制,从而能够充分利用复杂数据中的有效信息,得到鲁棒且准确率高的预测结果。

    面向非法集资交易风险场景的金融数据生成方法

    公开(公告)号:CN120013666A

    公开(公告)日:2025-05-16

    申请号:CN202510017637.X

    申请日:2025-01-06

    Applicant: 复旦大学

    Abstract: 本发明提供一种面向非法集资交易风险场景的金融数据生成方法,包括生成用户基础数据的步骤、生成用户关系网络的步骤、生成用户之间的正常交易数据和多场景非法集资交易数据的步骤,其中,由于根据统计数据来生成用户信息,并在此基础上构建多个用户之间的关系网络,因此能够很好地模拟多用户真实的社会经济特征,提供多样化和真实感强的用户基础数据和接近真实的社会关系网络,为交易数据的模拟提供坚实基础。进而,基于用户基础信息、用户关系网络、统计数据和预定生成规则分别生成了正常交易数据与多种非法集资交易场景的非法集资交易数据,也即,能够自动生成具备复杂交易模式的交易数据,为金融模型测试和欺诈检测等应用提供了有力的支持。

    用于风险画像构建的多项式标签生成方法及装置

    公开(公告)号:CN119494541A

    公开(公告)日:2025-02-21

    申请号:CN202411696232.5

    申请日:2024-11-25

    Applicant: 复旦大学

    Abstract: 本发明提供了一种用于风险画像构建的多项式标签生成方法及装置,具有这样的特征,包括步骤S1‑S3,将所有特征划分为多个子特征集合,并根据重要性值、相关性值和特征筛选量,从各子特征集合种选取特征构建筛选特征集合;步骤S4,对筛选特征集合中的特征进行多项式交叉特征计算,得到多项式特征集合;步骤S5,计算多项式特征集合中各个特征的重要性值和相关性值以及特征筛选量;步骤S6,从多项式特征集合中,根据重要性值、相关性值和特征筛选量,选取多个特征构建得到多项式筛选特征集合;步骤S7,计算多项式筛选特征集合中各个目标对应的各个特征的woe值。总之,本方法能够细粒度地描述目标的多维风险状态。

    用于风险画像构建的标签生成方法及装置

    公开(公告)号:CN119476956A

    公开(公告)日:2025-02-18

    申请号:CN202411696230.6

    申请日:2024-11-25

    Applicant: 复旦大学

    Abstract: 本发明提供了一种用于风险画像构建的标签生成方法及装置,具有这样的特征,包括步骤S1‑S3,将所有特征划分为多个子特征集合,根据重要性值、相关性值和特征筛选量,从子特征集合中选取特征,构建对应的筛选特征集合;步骤S4,对各个子特征集合,将子特征集合中每个目标对应的所有特征的值输入机器学习模型,结合该目标对应的风险判断标签,得到子特征集合中各个目标对应的预测值;步骤S5,对各个子特征集合,将对应的筛选特征集合的特征和预测特征进行合并,得到对应的模型特征集合;步骤S6,计算模型特征集合中各个目标对应的各个特征的woe值。总之,本方法能够生成提高风险画像准确度的多个标签和每个目标的对应标签值。

    基于动态信息学习的风险预测方法及装置

    公开(公告)号:CN119513698A

    公开(公告)日:2025-02-25

    申请号:CN202411665819.X

    申请日:2024-11-20

    Applicant: 复旦大学

    Abstract: 本发明提供了一种基于动态信息学习的风险预测方法及装置,具有这样的特征,包括以下步骤:步骤S1,对所有特征分别进行预处理,得到对应的预处理特征;步骤S2,根据所有预处理特征构建特征向量,并将特征向量输入预测模型,得到风险预测结果,其中,预测模型包括:中间变量计算模块,用于对特征向量进行线性变换,计算得到中间变量;信息贡献度量计算模块,用于对中间变量进行特征过滤,得到信息贡献度量;特征保留模块,用于根据信息贡献度量和特征向量,计算得到保留特征信息;分类模块,包括神经网络分类器,用于根据保留特征信息计算得到对应的风险预测标签作为风险预测结果。总之,本方法能够生成准确的风险预测结果。

    用于风险画像构建的多视野标签生成方法及装置

    公开(公告)号:CN119443821A

    公开(公告)日:2025-02-14

    申请号:CN202411696233.X

    申请日:2024-11-25

    Applicant: 复旦大学

    Abstract: 本发明提供了一种用于风险画像构建的多视野标签生成方法及装置,具有这样的特征,包括步骤S1‑S2,构建子特征集合并计算各个特征的重要性值和相关性值以及特征筛选量;步骤S3,构建筛选特征集合;步骤S4,计算并根据筛选特征集合中各个特征的相关性值,构建正相关特征集合和负相关特征集合;步骤S5,根据筛选特征集合中各个特征对应的唯一值的数量,构建离散特征集合和连续特征集合;步骤S6,根据正相关特征集合、负相关特征集合、离散特征集合和连续特征集合,得到多视野模型特征集合;步骤S7,计算多视野模型特征集合中各个目标对应的各个特征的woe值。总之,本方法能够生成具有更优风险表达能力的标签。

Patent Agency Ranking