-
公开(公告)号:CN109995924A
公开(公告)日:2019-07-09
申请号:CN201711491653.4
申请日:2017-12-30
Applicant: 中国移动通信集团贵州有限公司 , 中国移动通信集团公司
Abstract: 本发明实施例提供了一种欺诈电话识别方法、装置、设备及介质,包括如下步骤:获取用户的基础通话数据;将所述基础通话数据进行统计及计算,生成与用户通话的各电话号码及其数据特征;从所述与用户通话的各电话号码中选出多个已知的黑名单号码及多个已知的非黑名单号码;建立二分类训练模型,将所述多个已知的黑名单号码的数据特征与所述多个已知的非黑名单号码的数据特征输入所述二分类训练模型内,训练所述二分类训练模型,以得到经过训练的二分类训练模型;及将新号码的数据特征输入所述经过训练的二分类训练模型内,以识别该新号码是否是欺诈电话。本发明能直接识别欺诈电话,不需用户进行标识判断且不需要安装客户端。
-
公开(公告)号:CN113064885B
公开(公告)日:2023-10-27
申请号:CN202011604136.5
申请日:2020-12-29
Applicant: 中国移动通信集团贵州有限公司 , 中国移动通信集团有限公司
IPC: G06F16/215 , G06F16/25
Abstract: 本发明公开了一种数据清洗方法和装置,用以解决数据清洗的效率低的问题。本方案包括:获取待清洗数据,待清洗数据包括至少一个目标数据;根据清洗策略库确定与各目标数据的数据类型相匹配的目标清洗策略;根据各目标数据对应的目标清洗策略对待清洗数据中异常的目标数据执行清洗处理,以得到符合目标数据格式的清洗后的目标数据;将清洗后数据和对异常的目标数据执行清洗处理的信息关联存储至数据。本发明针对于待清洗数据的数据类型确定相匹配的清洗策略,满足各类数据处理需求,提高数据清洗后的数据质量,有效提高数据清洗速度。关联存储清洗后数据和执行清洗处理的信息,避免数据丢失,保证数据质量。
-
公开(公告)号:CN115982151A
公开(公告)日:2023-04-18
申请号:CN202111194506.7
申请日:2021-10-13
Applicant: 中国移动通信集团贵州有限公司 , 中国移动通信集团有限公司
Abstract: 本申请实施例提供了一种数据冗余识别方法、装置、电子设备及存储介质,其中数据冗余识别方法包括:获取预设数据库内至少两个数据表中的待识别字段;获取所述待识别字段的支持度;基于所述待识别字段的支持度,识别得到所述待识别字段中的合理冗余字段,其中所述合理冗余字段指出现频率高于预设值的字段。本申请实施例实现了对合理冗余字段的识别。
-
公开(公告)号:CN113064885A
公开(公告)日:2021-07-02
申请号:CN202011604136.5
申请日:2020-12-29
Applicant: 中国移动通信集团贵州有限公司 , 中国移动通信集团有限公司
IPC: G06F16/215 , G06F16/25
Abstract: 本发明公开了一种数据清洗方法和装置,用以解决数据清洗的效率低的问题。本方案包括:获取待清洗数据,待清洗数据包括至少一个目标数据;根据清洗策略库确定与各目标数据的数据类型相匹配的目标清洗策略;根据各目标数据对应的目标清洗策略对待清洗数据中异常的目标数据执行清洗处理,以得到符合目标数据格式的清洗后的目标数据;将清洗后数据和对异常的目标数据执行清洗处理的信息关联存储至数据。本发明针对于待清洗数据的数据类型确定相匹配的清洗策略,满足各类数据处理需求,提高数据清洗后的数据质量,有效提高数据清洗速度。关联存储清洗后数据和执行清洗处理的信息,避免数据丢失,保证数据质量。
-
-
-