-
公开(公告)号:CN110390041B
公开(公告)日:2022-05-20
申请号:CN201910591330.5
申请日:2019-07-02
Applicant: 上海上湖信息技术有限公司
IPC: G06F16/906 , G06F16/9536 , G06N3/04 , G06N3/08 , G06Q30/02
Abstract: 一种在线学习方法及装置、计算机可读存储介质,包括:获取线上业务数据,所述线上业务数据包括用户特征,其中,所述用户特征包括以下至少一种:用户的属性信息、用户的操作行为信息;采用分析模型对所述线上业务数据进行分析,得到预设参数的分析结果,其中,所述分析模型采用梯度提升决策树算法及深度神经网络模型算法构建得到;基于所述线上业务数据对所述分析模型进行定期更新或者实时更新。采用上述方案,能够实现在线学习,并提高在线学习结果的准确度。
-
公开(公告)号:CN112200298A
公开(公告)日:2021-01-08
申请号:CN202010930978.3
申请日:2020-09-07
Applicant: 上海上湖信息技术有限公司
Abstract: 一种深度神经网络特征分布的自适应变换方法及装置、存储介质、终端,所述方法包括:获取数据集,所述数据集包括多个样本数据,每一样本数据包括多个特征;对于每一特征,统计所述特征在所述数据集中的原始分布;至少根据所述原始分布的分布参数判断是否进行变换操作;当判断结果表明进行变换操作时,对所述特征进行变换操作,以使变换后的特征在所述数据集中的分布为正态分布,所述变换后的特征用于输入至深度神经网络进行训练。通过本发明提供的方案能够在以变换后的特征组成的数据集进行模型训练时,加速深度神经网络的收敛,得到鲁棒的网络模型。
-
公开(公告)号:CN110310199A
公开(公告)日:2019-10-08
申请号:CN201910567548.7
申请日:2019-06-27
Applicant: 上海上湖信息技术有限公司
Abstract: 本发明公开一种借贷风险预测模型的构建方法、系统及借贷风险预测方法,属于计算机技术领域。模型构建方法包括:获取预设的带有时刻分类标签的训练样本集合;构建包括生成网络和判别网络的初始对抗学习网络;根据第一时刻的借贷申请信息和第二时刻的借贷申请信息输入至生成网络生成的借贷风险结果和第一时刻的借贷风险标签、第二时刻的借贷风险标签,根据生成网络生成的借贷风险结果输入至判别网络得到的时刻分类结果和时刻分类标签,对生成网络及判别网络进行训练,将训练后的生成网络确定为借贷风险预测模型。本发明通过两个阶段的数据建立一个模型,使得该模型能够应用到不同的阶段,模型效果评估简单、模型维护成本较小、模型迭代较为方便。
-
公开(公告)号:CN110795570B
公开(公告)日:2022-06-17
申请号:CN201910962997.1
申请日:2019-10-11
Applicant: 上海上湖信息技术有限公司
IPC: G06F16/36 , G06F16/383 , G06F16/9537 , G06F16/958
Abstract: 本发明公开了一种用户时序行为特征提取方法及装置,其中方法包括:根据一定的时间段内的单个用户在各页面中的各行为数据以及各行为数据的时间戳,构建行为字典,行为字典包括:页面信息、与页面信息对应的行为数据以及与行为数据对应的行为用时;对多个用户的行为字典做时间归一化和时间离散化处理,利用处理后的行为字典构建行为语料库;基于行为语料库,利用TF‑IDF特征提取方法,生成用户时序行为特征向量。本发明将用户在不同页面的不同行为的耗时融入到行为字典中,使得不同用户的相同行为存在差异,更准确地进行特征提取。
-
公开(公告)号:CN110866043A
公开(公告)日:2020-03-06
申请号:CN201910976795.2
申请日:2019-10-12
Applicant: 上海上湖信息技术有限公司
IPC: G06F16/2458 , G06N3/04 , G06N3/08
Abstract: 一种数据预处理方法及装置、存储介质、终端,数据预处理方法包括:获取多个样本数据,每一样本数据为包括多个特征的特征值的数据集合;对于每一特征,统计所述特征在所述多个样本数据中的原始分布以及分布参数;根据各个特征的分布参数确定对特征进行调整,以使得调整后的特征在所述多个样本数据中的分布为正态分布,所述调整后的特征用于输入至神经网络模型进行训练。本发明技术方案能够通过对用于神经网络模型的训练数据进行处理,提升模型的训练效果。
-
公开(公告)号:CN110852418A
公开(公告)日:2020-02-28
申请号:CN201910977161.9
申请日:2019-10-12
Applicant: 上海上湖信息技术有限公司
Abstract: 一种神经网络模型的数据处理方法及装置、存储介质、终端,神经网络模型的数据处理方法包括:获取训练完成的神经网络模型以及测试集数据;将所述测试集数据的多个样本输入至所述神经网络模型,以得到针对所述测试集数据中多个样本的输出数据,所述输出数据为数值型数据;按照所述输出数据的大小对所述测试集数据中的多个样本进行排序,并将排序后的多个样本划分为至少两部分,每部分样本对应的输出数据的大小是连续的;统计各个特征在所述多个样本的各部分样本中的分布,每一样本包括多个特征;根据每个特征在各部分样本中的分布的距离确定所述特征对所述神经网络模型是否具有贡献。
-
公开(公告)号:CN110795570A
公开(公告)日:2020-02-14
申请号:CN201910962997.1
申请日:2019-10-11
Applicant: 上海上湖信息技术有限公司
IPC: G06F16/36 , G06F16/383 , G06F16/9537 , G06F16/958
Abstract: 本发明公开了一种用户时序行为特征提取方法及装置,其中方法包括:根据一定的时间段内的单个用户在各页面中的各行为数据以及各行为数据的时间戳,构建行为字典,行为字典包括:页面信息、与页面信息对应的行为数据以及与行为数据对应的行为用时;对多个用户的行为字典做时间归一化和时间离散化处理,利用处理后的行为字典构建行为语料库;基于行为语料库,利用TF-IDF特征提取方法,生成用户时序行为特征向量。本发明将用户在不同页面的不同行为的耗时融入到行为字典中,使得不同用户的相同行为存在差异,更准确地进行特征提取。
-
公开(公告)号:CN110765352A
公开(公告)日:2020-02-07
申请号:CN201910967146.6
申请日:2019-10-11
Applicant: 上海上湖信息技术有限公司
IPC: G06F16/9535 , G06N3/02
Abstract: 本发明公开了一种用户兴趣识别方法及装置,属于深度学习技术领域。所述方法包括:将包含用户APP时序信息的APP列表数据,输入神经网络识别模型,通过所述神经网络识别模型进行包含加权聚合的计算,输出用户兴趣识别结果,其中,所述神经网络识别模型是通过输入包含用户APP时序信息的APP列表训练数据训练得到的。本发明解决了现有技术因忽略用户APP时序信息而造成的模型预测不准确问题,获取了跟用户兴趣有关的更丰富语义信息,提高了用户兴趣识别的准确度。
-
公开(公告)号:CN110796179B
公开(公告)日:2023-05-26
申请号:CN201910967125.4
申请日:2019-10-12
Applicant: 上海上湖信息技术有限公司
IPC: G06F18/2431 , G06F18/23 , G06N20/00 , G06F16/9535
Abstract: 一种用于模型训练的样本数据处理方法及装置、存储介质、终端,所述方法包括:获取待处理样本数据,待处理样本数据包括应用程序列表;对于应用程序列表中的每一应用程序,获取应用程序的至少一个属性信息;对于每一属性信息,根据预设映射表确定所述属性信息关联的码值,所述预设映射表记录有属性信息与码值的关联关系;对于每一应用程序,基于所述应用程序的至少一个属性信息各自关联的码值生成编码信息;统计所述应用程序列表中所有应用程序各自对应的编码信息,其中,统计结果作为处理后的样本数据输入模型进行训练。通过本发明提供的方案能够充分利用应用程序列表中的冷门应用程序,以优化模型训练效果,使训练得到的模型更能体现用户偏好。
-
公开(公告)号:CN110765352B
公开(公告)日:2022-11-11
申请号:CN201910967146.6
申请日:2019-10-11
Applicant: 上海上湖信息技术有限公司
IPC: G06F16/9535 , G06N3/02
Abstract: 本发明公开了一种用户兴趣识别方法及装置,属于深度学习技术领域。所述方法包括:将包含用户APP时序信息的APP列表数据,输入神经网络识别模型,通过所述神经网络识别模型进行包含加权聚合的计算,输出用户兴趣识别结果,其中,所述神经网络识别模型是通过输入包含用户APP时序信息的APP列表训练数据训练得到的。本发明解决了现有技术因忽略用户APP时序信息而造成的模型预测不准确问题,获取了跟用户兴趣有关的更丰富语义信息,提高了用户兴趣识别的准确度。
-
-
-
-
-
-
-
-
-