-
公开(公告)号:CN110852443A
公开(公告)日:2020-02-28
申请号:CN201910919567.1
申请日:2019-09-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本申请提供了一种特征稳定性检测方案中,使用所述训练集中样本的特征组对基于阈值分类的机器学习模型进行训练,获取训练过程中基于每项特征进行分类时所采用的分类阈值,并根据所述分类阈值划分每项特征的值域区间,在确定值域区间之后,使用测试集中样本的特征组,并基于对应于每项特征的值域,计算每项特征的稳定性指标,由于不需要人工设定每个特征的区间划分,而是基于模型训练过程中的分类阈值来自动划分值域区间,由此获取的值域区间会与机器学习模型实际的特征分布符合,使得以此计算获得的稳定性指标能够真实的反映特征分布变化对于模型性能的影响,有效防止在特征选择时筛掉合适的特征。
-
公开(公告)号:CN110852443B
公开(公告)日:2023-02-21
申请号:CN201910919567.1
申请日:2019-09-26
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N20/00
Abstract: 本申请提供了一种特征稳定性检测方案中,使用所述训练集中样本的特征组对基于阈值分类的机器学习模型进行训练,获取训练过程中基于每项特征进行分类时所采用的分类阈值,并根据所述分类阈值划分每项特征的值域区间,在确定值域区间之后,使用测试集中样本的特征组,并基于对应于每项特征的值域,计算每项特征的稳定性指标,由于不需要人工设定每个特征的区间划分,而是基于模型训练过程中的分类阈值来自动划分值域区间,由此获取的值域区间会与机器学习模型实际的特征分布符合,使得以此计算获得的稳定性指标能够真实的反映特征分布变化对于模型性能的影响,有效防止在特征选择时筛掉合适的特征。
-
公开(公告)号:CN111428757A
公开(公告)日:2020-07-17
申请号:CN202010146141.X
申请日:2020-03-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书实施例公开了模型训练方法、异常数据检测方法、装置和电子设备的实施例。所述方法包括:获取训练样本集,所述训练样本集包括无标签样本集和有标签样本集,所述无标签样本集包括多个第一样本,所述有标签样本集包括多个第二样本和类型标签;根据所述无标签样本集,对第一模型进行训练,所述第一模型包括特征提取子模型;根据所述有标签样本集和所述特征提取子模型的训练结果,对第二模型进行训练,所述第二模型包括所述特征提取子模型和异常数据检测子模型,所述异常数据检测子模型用于根据所述特征提取子模型的输出检测异常数据。本说明书实施例可以提高第二模型的训练效果。
-
公开(公告)号:CN110675228B
公开(公告)日:2021-05-28
申请号:CN201910922200.5
申请日:2019-09-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请提供用户购票行为检测方法以及装置,其中所述用户购票行为检测方法包括:采集用户在购票页面的页面访问数据;通过对所述页面访问数据进行解析,确定所述用户在所述购票页面的访问异常度;将所述访问异常度输入至所述购票页面所属的购票维度对应的访问异常衡量函数进行访问异常计算;在计算获得的所述购票维度的访问异常衡量数值小于所述购票维度预设的衡量阈值的情况下,将所述页面访问数据输入购票行为检测模型进行购票行为检测,获得输出的所述用户的购票行为检测结果。通过所述用户购票行为检测方法,采用所述购票行为检测模型对所述用户的购票行为进行检测,有效的对虚假占座情况进行了防控,并且克服了需要大量人力、物力的弊端。
-
公开(公告)号:CN110675228A
公开(公告)日:2020-01-10
申请号:CN201910922200.5
申请日:2019-09-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请提供用户购票行为检测方法以及装置,其中所述用户购票行为检测方法包括:采集用户在购票页面的页面访问数据;通过对所述页面访问数据进行解析,确定所述用户在所述购票页面的访问异常度;将所述访问异常度输入至所述购票页面所属的购票维度对应的访问异常衡量函数进行访问异常计算;在计算获得的所述购票维度的访问异常衡量数值小于所述购票维度预设的衡量阈值的情况下,将所述页面访问数据输入购票行为检测模型进行购票行为检测,获得输出的所述用户的购票行为检测结果。通过所述用户购票行为检测方法,采用所述购票行为检测模型对所述用户的购票行为进行检测,有效的对虚假占座情况进行了防控,并且克服了需要大量人力、物力的弊端。
-
公开(公告)号:CN111428757B
公开(公告)日:2021-09-10
申请号:CN202010146141.X
申请日:2020-03-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/62
Abstract: 本说明书实施例公开了模型训练方法、异常数据检测方法、装置和电子设备的实施例。所述方法包括:获取训练样本集,所述训练样本集包括无标签样本集和有标签样本集,所述无标签样本集包括多个第一样本,所述有标签样本集包括多个第二样本和类型标签;根据所述无标签样本集,对第一模型进行训练,所述第一模型包括特征提取子模型;根据所述有标签样本集和所述特征提取子模型的训练结果,对第二模型进行训练,所述第二模型包括所述特征提取子模型和异常数据检测子模型,所述异常数据检测子模型用于根据所述特征提取子模型的输出检测异常数据。本说明书实施例可以提高第二模型的训练效果。
-
-
-
-
-