-
公开(公告)号:CN113052198B
公开(公告)日:2024-06-21
申请号:CN201911384128.1
申请日:2019-12-28
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/2413 , G06F18/2431 , G06F18/2321 , G06N5/01
Abstract: 本发明实施例公开了一种数据处理方法、装置、设备及存储介质,该方法包括:获取第一样本集中非数值型和/或离散型的字段数据;对字段数据进行降维,得到与第一样本集相关的边界样本集;根据第一样本集中每个样本的概率值,确定随机样本的至少一个近邻样本;基于至少一个近邻样本和边界样本集,生成包括少数类样本的第二样本集。能够解决在保证整体分类准确度稳定的前提下,提高少数类样本集分类的准确性的问题。
-
公开(公告)号:CN117314553A
公开(公告)日:2023-12-29
申请号:CN202311191654.2
申请日:2023-09-14
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q30/0601 , G06Q30/0202 , G06Q40/08 , G06F18/25 , G06F18/22 , G06N3/0455 , G06N3/0499 , G06N3/084
Abstract: 本发明公开了一种数据处理方法、装置、设备及存储介质,属于产品推荐技术领域。本发明获取当前信令数据和当前用户属性数据;将当前信令数据进行融合,得到时空统计特征数据;将当前用户属性数据按照预设编码策略映射为统一维度的目标用户基础属性特征;基于时空统计特征数据计算各统计特征的相似度,并根据计算结果得到目标时空信息特征;将目标时空信息特征和目标用户基础属性特征输入至成功率预测模型,得到用户属性;根据用户属性进行产品推荐,成功率预测模型为解码器结构更新后的结构,可以提取到不同模态特征深层的联系,从而更有效的对特征进行融合和提取,适用多种产品推荐场景,提高产品推荐的效果。
-
公开(公告)号:CN116645221A
公开(公告)日:2023-08-25
申请号:CN202211585558.1
申请日:2022-12-09
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q40/08 , G06F18/23 , G06F18/213 , G06F18/24 , G06N3/006
Abstract: 本申请实施例公开了一种风险评估方法及装置、设备和存储介质,其中,所述方法包括:获取待评估对象的当前用户数据;确定所述当前用户数据对应的目标样本类别;从多个已训练的风险评估模型中,确定与所述目标样本类别匹配的目标风险评估模型;其中,不同的所述风险评估模型对应不同的样本类别,并通过对应样本类别下的历史用户数据训练得到;基于所述当前用户数据和所述目标风险评估模型,确定所述待评估对象的当前风险等级。
-
公开(公告)号:CN115952468A
公开(公告)日:2023-04-11
申请号:CN202211646017.5
申请日:2022-12-20
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/25 , G06F18/214 , G06F18/2431 , G06Q40/08 , G06Q10/04
Abstract: 本申请公开了一种特征处理方法、装置、设备及计算机存储介质,涉及大数据技术领域。该方法包括:获取样本数据集,所述样本数据集中包括N个用户样本一一对应的目标信息,所述目标信息包括样本标签和在M个特征下分别对应的M个特征标签;基于所述N个用户样本一一对应的目标信息,采用catboost算法对所述样本数据集中的M个特征进行特征交叉,得到Q个混合特征,所述Q个混合特征用于作为目标预测模型的输入特征;其中,所述Q个混合特征中任一混合特征中包括的特征的数量小于或者等于预设阈值。根据本申请实施例,能够直接对样本特征进行特征衍生,从而有效避免了高维稀疏特征的出现。
-
公开(公告)号:CN113052198A
公开(公告)日:2021-06-29
申请号:CN201911384128.1
申请日:2019-12-28
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06K9/62
Abstract: 本发明实施例公开了一种数据处理方法、装置、设备及存储介质,该方法包括:获取第一样本集中非数值型和/或离散型的字段数据;对字段数据进行降维,得到与第一样本集相关的边界样本集;根据第一样本集中每个样本的概率值,确定随机样本的至少一个近邻样本;基于至少一个近邻样本和边界样本集,生成包括少数类样本的第二样本集。能够解决在保证整体分类准确度稳定的前提下,提高少数类样本集分类的准确性的问题。
-
公开(公告)号:CN117093598A
公开(公告)日:2023-11-21
申请号:CN202311052071.1
申请日:2023-08-18
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请公开了一种数据检索方法、系统、设备以及存储介质,应用于搜索引擎服务器与数据库构建的检索系统,其数据检索方法包括:获取待检索字段和计算函数;根据所述待检索字段和所述计算函数,结合预先建立的索引关系返回数据表行键;将所述数据表行键发送至所述数据库,并接收所述数据库根据所述数据表行键返回的检索结果信息。本申请通过在搜索引擎服务器中预先建立索引关系,结合任意组成的待检索字段和计算函数,与索引关系进行检索,能满足多条件检索的需求,提高查询的智能程度。
-
公开(公告)号:CN115880015A
公开(公告)日:2023-03-31
申请号:CN202111143740.7
申请日:2021-09-28
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q30/0601 , G06F18/24 , G06F16/9535
Abstract: 本发明提供一种信息推荐方法及装置。其中,该方法包括:基于枢纽节点联合参与方的数据点,并利用预设密度聚类算子对多域联合数据进行密度聚类分群,得到特征空间差异化的用户群;根据所述用户群的订购产品统计结果,确定预设产品类别对应的初始的偏好用户群分类结果;将所述偏好用户群分类结果输入到相应的模型分类器中基于偏好概率进行产品潜客筛选,得到所述模型分类器输出的目标用户群及其对应的偏好产品类别。采用本发明方法,能够以群为单位进行并行模型预测,根据偏好概率精筛用户,提升了客户分群的准确率和产品推荐效率,为各类别产品细筛出偏好度高的用户群进行精准营销,极大的节省了内部资源,减少获客成本,有效提高了运营效率。
-
公开(公告)号:CN116467632A
公开(公告)日:2023-07-21
申请号:CN202310566335.9
申请日:2023-05-18
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/24 , G06F18/25 , G06F18/214
Abstract: 本申请公开了一种训练样本的确定方法、装置、设备及存储介质,涉及通信技术领域。其方法包括:对初始样本集进行分类,得到至少一个用户样本簇,其中,初始用户样本集包括多个用户样本,用户样本包括历史用户的业务数据以及标签;对各用户样本簇进行多次样本融合处理,得到多个融合样本集,其中,各融合样本集包括至少一个融合样本,且不同融合样本集中的融合样本的数量不同,各融合样本包括融合业务数据和融合标签;在各用户样本簇的多个融合样本集中,确定各用户样本簇的目标融合样本集;将至少一个用户样本簇中目标融合样本集的融合样本,确定为目标模型的训练样本,目标模型用于根据用户的业务数据预测用户的所属群体。
-
公开(公告)号:CN114463121B
公开(公告)日:2024-12-31
申请号:CN202011246191.1
申请日:2020-11-10
Applicant: 中移物联网有限公司 , 中国移动通信集团有限公司
Abstract: 本发明的实施例提供一种基于区块链的交易信息处理方法、装置和电子设备,应用于区块链中的发起节点的方法包括:接收交易提案;根据本地账本数据,对所述交易提案的提案类型进行确认;在确认所述交易提案的提案类型为可验证交易的情况下,将所述交易提案发送至所述区块链中的排序节点。本发明的方案可以提高区块链对交易信息的处理性能。
-
公开(公告)号:CN116204780A
公开(公告)日:2023-06-02
申请号:CN202111443697.6
申请日:2021-11-30
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/214 , G06N20/00
Abstract: 本申请提供基于GBDT的集成学习方法、装置、及电子设备,涉及数据挖掘技术领域。所述方法包括:基于梯度提升回归树,将原始特征转换为叶子结节位置,形成数据集;基于数据集,利用滑动窗口,得到衍生特征;对原始特征进行稀疏处理;组合衍生特征和稀疏处理后的原始特征,得到若干训练数据集;基于若干训练数据集,训练得到若干基模型;当需要完成分类任务时,基于若干基模型输出的分类结果,根据预设分类汇总条件,得到最终分类结果。本申请提供的基于GBDT的集成学习方法,能够增加样本的多样性,降低模型偏差,改善集成学习效果;还能够发现特征之间的非线性关系,增加基模型的多样性,避免模型产生高方差,提高模型预测准确率。
-
-
-
-
-
-
-
-
-