-
公开(公告)号:CN113052198B
公开(公告)日:2024-06-21
申请号:CN201911384128.1
申请日:2019-12-28
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/2413 , G06F18/2431 , G06F18/2321 , G06N5/01
Abstract: 本发明实施例公开了一种数据处理方法、装置、设备及存储介质,该方法包括:获取第一样本集中非数值型和/或离散型的字段数据;对字段数据进行降维,得到与第一样本集相关的边界样本集;根据第一样本集中每个样本的概率值,确定随机样本的至少一个近邻样本;基于至少一个近邻样本和边界样本集,生成包括少数类样本的第二样本集。能够解决在保证整体分类准确度稳定的前提下,提高少数类样本集分类的准确性的问题。
-
公开(公告)号:CN113052198A
公开(公告)日:2021-06-29
申请号:CN201911384128.1
申请日:2019-12-28
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06K9/62
Abstract: 本发明实施例公开了一种数据处理方法、装置、设备及存储介质,该方法包括:获取第一样本集中非数值型和/或离散型的字段数据;对字段数据进行降维,得到与第一样本集相关的边界样本集;根据第一样本集中每个样本的概率值,确定随机样本的至少一个近邻样本;基于至少一个近邻样本和边界样本集,生成包括少数类样本的第二样本集。能够解决在保证整体分类准确度稳定的前提下,提高少数类样本集分类的准确性的问题。
-
公开(公告)号:CN113554049A
公开(公告)日:2021-10-26
申请号:CN202010336551.0
申请日:2020-04-26
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明公开了一种异网宽带用户识别的方法、装置、设备及存储介质。具体包括:获取本网用户对应的用户对数据集合和用户数据集合,所述用户对为具有业务关联关系的用户;利用家庭群组识别模型,对用户对数据集合对应的用户对进行识别,得到家庭群组用户信息,所述家庭群组识别模型是由用户对数据集合样本确定;利用宽带用户识别模型,对用户数据集合对应的用户进行识别,得到宽带用户信息,所述宽带用户识别模型是由用户数据集合样本确定;结合所述家庭群组用户信息,对宽带用户信息进行筛选,以将满足预设异网条件的宽带用户信息作为异网宽带用户信息。根据本发明实施例,可以提高异网宽带用户识别准确性和效率。
-
公开(公告)号:CN113554049B
公开(公告)日:2024-11-29
申请号:CN202010336551.0
申请日:2020-04-26
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06Q30/0201 , G06Q50/50 , G06F18/243 , G06F18/2415 , G06F18/23 , G06F18/27 , G06N5/01 , G06N20/20
Abstract: 本发明公开了一种异网宽带用户识别的方法、装置、设备及存储介质。具体包括:获取本网用户对应的用户对数据集合和用户数据集合,所述用户对为具有业务关联关系的用户;利用家庭群组识别模型,对用户对数据集合对应的用户对进行识别,得到家庭群组用户信息,所述家庭群组识别模型是由用户对数据集合样本确定;利用宽带用户识别模型,对用户数据集合对应的用户进行识别,得到宽带用户信息,所述宽带用户识别模型是由用户数据集合样本确定;结合所述家庭群组用户信息,对宽带用户信息进行筛选,以将满足预设异网条件的宽带用户信息作为异网宽带用户信息。根据本发明实施例,可以提高异网宽带用户识别准确性和效率。
-
公开(公告)号:CN114429166A
公开(公告)日:2022-05-03
申请号:CN202011182603.X
申请日:2020-10-29
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06K9/62
Abstract: 本申请提供了一种数据的高维特征获取方法、装置、设备及计算机存储介质。该数据的高维特征获取方法,获取原始数据;对原始数据进行预处理,得到处理后的数据;对处理后的数据进行独热编码,得到第一特征;基于机器学习算法,利用处理后的数据,生成第二特征;将第一特征和第二特征合并,并判断合并后的特征的重要度是否满足预设重要度阈值;在确定满足预设重要度阈值的情况下,复制扩充合并后的特征得到高维特征。根据本申请实施例,能够获取准确率高、特征区分显著的高维特征。
-
公开(公告)号:CN114429166B
公开(公告)日:2024-11-15
申请号:CN202011182603.X
申请日:2020-10-29
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/2113 , G06F18/213 , G06F18/243 , G06F18/10 , G06F18/25 , G06N5/01 , G06N20/20
Abstract: 本申请提供了一种数据的高维特征获取方法、装置、设备及计算机存储介质。该数据的高维特征获取方法,获取原始数据;对原始数据进行预处理,得到处理后的数据;对处理后的数据进行独热编码,得到第一特征;基于机器学习算法,利用处理后的数据,生成第二特征;将第一特征和第二特征合并,并判断合并后的特征的重要度是否满足预设重要度阈值;在确定满足预设重要度阈值的情况下,复制扩充合并后的特征得到高维特征。根据本申请实施例,能够获取准确率高、特征区分显著的高维特征。
-
公开(公告)号:CN113808755A
公开(公告)日:2021-12-17
申请号:CN202010552673.3
申请日:2020-06-17
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G16H50/80 , G16H50/50 , G06K9/62 , G06N20/00 , H04W4/021 , G16Y10/60 , G16Y20/10 , G16Y20/40 , G16Y40/10 , G16Y40/60
Abstract: 本发明实施例公开了一种感染人群预测模型训练的方法、预测的方法、装置、设备。通过获取多个待测用户的特征信息,所述特征信息包括在预设时间段内待测用户处于感染基站覆盖区域的次数,待测用户的年龄,待测用户是否为感染用户的属性信息,待测用户的消费信息中的至少一种;基于所述多个待测用户的特征信息,训练初始模型作为感染人群预测模型。本发明实施例解决了无法及时准确预测感染者的问题,提高了预测感染者的速度和精确度。
-
公开(公告)号:CN113808755B
公开(公告)日:2024-08-13
申请号:CN202010552673.3
申请日:2020-06-17
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
IPC: G16H50/80 , G16H50/50 , G06F18/243 , G06F18/27 , G06N20/20 , H04W4/021 , G16Y10/60 , G16Y20/10 , G16Y20/40 , G16Y40/10 , G16Y40/60
Abstract: 本发明实施例公开了一种感染人群预测模型训练的方法、预测的方法、装置、设备。通过获取多个待测用户的特征信息,所述特征信息包括在预设时间段内待测用户处于感染基站覆盖区域的次数,待测用户的年龄,待测用户是否为感染用户的属性信息,待测用户的消费信息中的至少一种;基于所述多个待测用户的特征信息,训练初始模型作为感染人群预测模型。本发明实施例解决了无法及时准确预测感染者的问题,提高了预测感染者的速度和精确度。
-
-
-
-
-
-
-