一种基于用户话单数据中基站位置可信度的加权基站位置纠偏的方法

    公开(公告)号:CN107835485A

    公开(公告)日:2018-03-23

    申请号:CN201710975671.3

    申请日:2017-10-19

    Abstract: 本发明公开一种基于用户话单大数据中基站位置可信度的加权基站位置纠偏的方法,包括如下步骤:(1)对于经、纬度信息存疑的基站,在话单大数据中寻找与该基站进行连接了的全部电话号码信息;(2)对这些号码在连接该基站的预设时间范围内的话单数据进行分析,进而给出这些号码连接其他基站的信息;(3)针对上述基站,根据与该基站进行连接的号码与上、下文基站数据经、纬度信息的时间间距作为量度给出该基站可信度;(4)以此可信度作为该基站周围基站位置信息的权值,对存疑基站的经、纬度信息进行加权估计。

    一种基于SVM分类算法的话单信息中敏感电话发现方法

    公开(公告)号:CN108108756A

    公开(公告)日:2018-06-01

    申请号:CN201711368252.X

    申请日:2017-12-18

    Abstract: 本发明公开一种基于SVM分类算法的话单信息中敏感电话发现方法,包括以下步骤:步骤1、在话单大数据中寻找出用户话单中与一般、普通电话具有根本性差异的具有一系列敏感特征的电话号码;步骤2、对电信运营商话单大数据进行挖掘、分析,在用户话单大数据中提取不同号码的通话记录特征信息;步骤3、把上述特征信息做为训练SVM分类模型的特征向量,在话单大数据中选取一定量已知的话单数据,训练SVM分类模型;步骤4、采用改SVM分类算法模型,对话单中可能的敏感电话号码与正常号码进行区分,寻找出可疑电话。

    一种基于Apriori算法的话单数据深度挖掘和用户行为预测的方法

    公开(公告)号:CN108090787A

    公开(公告)日:2018-05-29

    申请号:CN201711368254.9

    申请日:2017-12-18

    Abstract: 本发明公开一种基于Apriori算法的话单数据深度挖掘和用户行为预测的方法,包括如下步骤:步骤1、根据话单中相关信息和用户对应行为特征,找寻出其中某些特有话单信息与用户后续的一些行为特征的关联关系频度;步骤2、根据上述关联关系发生的频度强度,对上述关系进行排序。将排名靠前的具有较强关联性的相关项找出,进而根据此规则对不同用户的行为进行挖掘、统计;步骤3、基于Apriori算法给出用户相关行为等的预测。

    一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法

    公开(公告)号:CN107613463A

    公开(公告)日:2018-01-19

    申请号:CN201710982621.8

    申请日:2017-10-20

    Abstract: 本发明公开一种基于用户话单数据中不同基站接入频次加权的基站位置估计方法,括如下步骤:(1)对于经、纬度信息存疑的基站,在话单大数据中寻找与该基站进行连接了的全部电话号码;(2)对这些电话号码在连接该基站的一定时间范围内的话单数据进行分析,基于时空的连续性,对这些号码连接该存疑基站上、下文基站的信息进行统计;(3)针对上述基站,建立基站集合,根据集合中不同基站出现的频次,计算上述基站在基站估计中的权值,对存疑基站的经、纬度信息进行加权平均计算;(4)对上述目标多天数据进行采集,剔除干扰外点,并采用最小二乘估计算法计算平均值作为最终存疑基站的经、纬度估计值。

    一种基于用户话单大数据特征信息的AdaBoost用户居住地判别方法

    公开(公告)号:CN107609196A

    公开(公告)日:2018-01-19

    申请号:CN201710975842.2

    申请日:2017-10-19

    Abstract: 本发明公开一种基于用户话单大数据特征信息的AdaBoost用户居住地判别方法,基于统计方法进行以下3个特征的不同统计向量:1、计算用户一段时间,每天话单中最大未通话时间间隔的重合度;2、计算用户多日话单中重合最大未通话间隔连续的天数;3、计算用户每天话单中的最大未通话时长。根据上述信息获得该话单的多个统计向量,基于AdaBoost分类算法,以及用户的居住地与非居住地样本,对模型进行训练,并使用训练所获得模型对用户的居住地进行判断,通过精准的特征向量选择,使得最终基于AdaBoost算法的分类器分类效果更佳、分类精度更高。

    一种改善的基于Ransac算法的鲁棒AdaBoost分类器构建方法

    公开(公告)号:CN106529579A

    公开(公告)日:2017-03-22

    申请号:CN201610917782.4

    申请日:2016-10-20

    Inventor: 曹万鹏

    CPC classification number: G06K9/6227

    Abstract: 本发明公开一种改善的基于Ransac算法的鲁棒AdaBoost分类器构建方法,包括:初始参数设置、量样本随机选取、满足该模型样本加入、分类器模型更新、迭代构建下一个分类器模型、分类正确率计算、最终分类模型选出。本发明通过将Ransac算法引入到AdaBoost分类器模型构建过程中,并通过迭代建模的过程搜寻正确的样本;同时在全部基于AdaBoost算法构建的分类器模型中选取最佳分类模型。通过上述策略,本发明最终实现了基于Ransac算法的鲁棒AdaBoost分类器构建,获得的分类器模型的设计完全不受外点的影响。最后,基于本方法设计的AdaBoost分类器模型用于含有一定量外点的笔迹样本的验证,实验结果证明本文提出方法对比于另外两种AdaBoost分类器构建方法,拥有更高分类精度。

Patent Agency Ranking