-
公开(公告)号:CN110728442A
公开(公告)日:2020-01-24
申请号:CN201910936745.1
申请日:2019-09-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种资损识别方法、装置及设备,所述方法包括:利用资损案件的属性信息的相关性,从包括多个历史资损案件的历史数据中查找出属于团伙作案的案件,获得第一资损案件数据;收集网络资损案件数据,从所述网络资损案件数据中获取第二资损案件数据,其中,所述第一资损案件数据与所述第二资损案件数据满足相似度条件;利用所述第一资损案件数据与所述第二资损案件数据构建训练样本集后,通过所述训练样本集对机器学习模型进行训练,获得资损识别模型,所述资损识别模型用于对被监控对象进行资损识别。
-
公开(公告)号:CN110717189A
公开(公告)日:2020-01-21
申请号:CN201910935293.5
申请日:2019-09-29
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种数据泄露识别方法、装置及设备,该方案获取样本监控对象在使用电子设备过程中产生的样本设备使用数据,获得原始数据集;通过特征工程提取所述原始数据集中数据的特征,获得训练数据集;其中,在进行特征工程中,所述原始数据集中数据的标签通过将该数据与敏感数据进行相似度匹配而确定,所述标签指示所述数据是否属于敏感数据,所述敏感数据为表征发生数据泄露的数据;利用所述训练数据集对机器学习模型进行训练,获得数据泄露识别模型,所述数据泄露识别模型用于对被监控对象进行数据泄露识别。
-
公开(公告)号:CN110956278A
公开(公告)日:2020-04-03
申请号:CN201911172318.7
申请日:2019-11-26
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请涉及一种用于重新训练机器学习模型的方法,包括:在使用机器学习模型的过程中监控所述机器学习模型在一时间段内的一个或多个性能度量;基于所述一个或多个性能度量确定是否需要重新训练所述机器学习模型;如果确定需要重新训练所述机器学习模型,则至少基于所述时间段内的原始数据自动生成样本特征;以及至少使用所述自动生成的样本特征来重新训练所述机器学习模型。本申请还涉及相应的系统和计算机可读存储介质。本申请能够自动、高效地重新训练机器学习模型。
-
公开(公告)号:CN110781174A
公开(公告)日:2020-02-11
申请号:CN201910978519.X
申请日:2019-10-15
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/215 , G06K9/62 , G06N20/00
Abstract: 本公开涉及一种使用pca和特征交叉的特征工程建模的方案,包括:对特征数据进行特征相关检测;使用独热编码对特征进行编码,并对经编码的特征执行pca算法,其中在执行独热编码的过程中,还可以对所述特征进行特征交叉;通过执行共线性选择和特征重要性选择对所述特征进行筛选;以及将筛选出的特征输出用于特征工程建模。
-
-
-