-
公开(公告)号:CN110278555A
公开(公告)日:2019-09-24
申请号:CN201810215482.0
申请日:2018-03-15
Applicant: 中国移动通信集团有限公司 , 中移信息技术有限公司
Abstract: 本发明实施例公开了一种国际漫游沉默号码的识别方法,所述方法包括:基于预设基础指标中各个指标之间的相关性,确定特征指标;根据预设沉默号码界定规则,确定样本集中属于沉默号码类别的正样本,以及属于非沉默号码类别的负样本;根据正样本对应的国内外通信数据和负样本对应的国内外通信数据,以及特征指标,确定训练集数据和测试集数据;根据训练集数据和预设挖掘算法,训练识别模型,并根据测试集数据对识别模型进行准确率测试;当识别模型的准确率大于等于预设准确率阈值时,根据目标号码对应的国内外通信数据、特征指标,以及识别模型,识别目标号码是否为沉默号码。
-
公开(公告)号:CN113052198B
公开(公告)日:2024-06-21
申请号:CN201911384128.1
申请日:2019-12-28
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F18/2413 , G06F18/2431 , G06F18/2321 , G06N5/01
Abstract: 本发明实施例公开了一种数据处理方法、装置、设备及存储介质,该方法包括:获取第一样本集中非数值型和/或离散型的字段数据;对字段数据进行降维,得到与第一样本集相关的边界样本集;根据第一样本集中每个样本的概率值,确定随机样本的至少一个近邻样本;基于至少一个近邻样本和边界样本集,生成包括少数类样本的第二样本集。能够解决在保证整体分类准确度稳定的前提下,提高少数类样本集分类的准确性的问题。
-
公开(公告)号:CN113052198A
公开(公告)日:2021-06-29
申请号:CN201911384128.1
申请日:2019-12-28
Applicant: 中移信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06K9/62
Abstract: 本发明实施例公开了一种数据处理方法、装置、设备及存储介质,该方法包括:获取第一样本集中非数值型和/或离散型的字段数据;对字段数据进行降维,得到与第一样本集相关的边界样本集;根据第一样本集中每个样本的概率值,确定随机样本的至少一个近邻样本;基于至少一个近邻样本和边界样本集,生成包括少数类样本的第二样本集。能够解决在保证整体分类准确度稳定的前提下,提高少数类样本集分类的准确性的问题。
-
公开(公告)号:CN110278555B
公开(公告)日:2022-04-01
申请号:CN201810215482.0
申请日:2018-03-15
Applicant: 中移动信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本发明实施例公开了一种国际漫游沉默号码的识别方法,所述方法包括:基于预设基础指标中各个指标之间的相关性,确定特征指标;根据预设沉默号码界定规则,确定样本集中属于沉默号码类别的正样本,以及属于非沉默号码类别的负样本;根据正样本对应的国内外通信数据和负样本对应的国内外通信数据,以及特征指标,确定训练集数据和测试集数据;根据训练集数据和预设挖掘算法,训练识别模型,并根据测试集数据对识别模型进行准确率测试;当识别模型的准确率大于等于预设准确率阈值时,根据目标号码对应的国内外通信数据、特征指标,以及识别模型,识别目标号码是否为沉默号码。
-
-
-