一种基于机器学习预测电信业用户携号转出的方法

    公开(公告)号:CN112153636A

    公开(公告)日:2020-12-29

    申请号:CN202011178646.0

    申请日:2020-10-29

    Abstract: 本发明涉及电信技术领域,尤其涉及一种基于机器学习预测电信业用户携号转出的方法,包括以下步骤:1)采集特征变量数据并进行数据预处理保存到数据库中,在数据库中进行样本采样,将正样本和负样本的比例控制在1:10;2)样本随机分为训练集和测试集;3)选择XGBoost算法为基础构建预测模型,输入训练集训练预测模型,获得预测概率值和特征的重要程度;4)利用训练完成的模型对测试集进行数据预测,并根据预测结果对预测模型进行评估,若评估结果低于阈值,对预测模型进行优化迭代。本发明的有益效果在于:提高预测效率,做到提前预警及时维系,预测模型能够动态进行优化迭代。

    一种保留统计级特征属性的身份证号脱敏方法

    公开(公告)号:CN112182654B

    公开(公告)日:2024-03-05

    申请号:CN202011048516.5

    申请日:2020-09-29

    Abstract: 本发明涉及数据处理领域,尤其涉及一种保留统计级特征属性的身份证号脱敏方法,包括以下步骤:身份证号进行分段;分别对地区编码、出生日期、顺序码进行脱敏:获取相同省份下的所有地区编码集和,从集合中获取新的地址编码;获取基准日期与待脱敏出生日期的间隔天数,间隔天数通过转换得到新的间隔天数,新的间隔天数进制转换后与一个随机数进行模运算,得到最终的间隔天数,根据最终的间隔天数得到新的出生日期;通过与一随机整数进行计算得到新的顺序码;根据固定算法得到新的校验码;组合形成新的身份证号。本发明的有益效果在于:采用分段处理机制,可以灵活选择要脱敏的分段信息,同时保持身份证号本身的结构特征和分析价值。(56)对比文件张继.利用EXCEL函数功能从身份证号提取学生基础学籍信息.电脑知识与技术.2014,(第33期),7948-7950.张樵.数据漂白简析.中国金融电脑.2010,(第09期),80-81.

    一种保留统计级特征属性的身份证号脱敏方法

    公开(公告)号:CN112182654A

    公开(公告)日:2021-01-05

    申请号:CN202011048516.5

    申请日:2020-09-29

    Abstract: 本发明涉及数据处理领域,尤其涉及一种保留统计级特征属性的身份证号脱敏方法,包括以下步骤:身份证号进行分段;分别对地区编码、出生日期、顺序码进行脱敏:获取相同省份下的所有地区编码集和,从集合中获取新的地址编码;获取基准日期与待脱敏出生日期的间隔天数,间隔天数通过转换得到新的间隔天数,新的间隔天数进制转换后与一个随机数进行模运算,得到最终的间隔天数,根据最终的间隔天数得到新的出生日期;通过与一随机整数进行计算得到新的顺序码;根据固定算法得到新的校验码;组合形成新的身份证号。本发明的有益效果在于:采用分段处理机制,可以灵活选择要脱敏的分段信息,同时保持身份证号本身的结构特征和分析价值。

Patent Agency Ranking