一种判别人口数据的离群点检测方法、系统和存储介质

    公开(公告)号:CN115329904B

    公开(公告)日:2023-04-28

    申请号:CN202211250229.1

    申请日:2022-10-13

    Abstract: 本发明公开的一种判别人口数据的离群点检测方法、系统和存储介质,其中方法包括:获取预设区域的人口数据集;基于预设离群点算法,根据预设区域的人口数据集,得到离群点数据;获取离群点对应时间内的净流入人口数据信息;将离群点对应的人口数据和离群点对应相邻人口数据进行差值计算,得到离群点人口差值;判断离群点人口差值和净流入人口数据的比值是否在预设范围,若是,则得到对应离群点是假离群点;若否,则对应离群点为真离群点;将人口数据集中的真离群点进行删除,假离群点保留。本申请通过预设离群点算法和净流入人口数据进行结合,判别离群点并分出真假,保留由偶然非正常因素影响而引起的假离群点,保证了离群点的准确性。

    一种基于大数据的消费习惯分类方法、系统和存储介质

    公开(公告)号:CN114741612B

    公开(公告)日:2022-09-02

    申请号:CN202210658815.3

    申请日:2022-06-13

    Abstract: 本发明公开的一种基于大数据的消费习惯分类方法、系统和存储介质,其中方法包括:获取信令大数据路径信息、基站信息、工参表信息和poi(point of interesting)数据信息,通过信令大数据路径信息,得到用户的轨迹信息;再将用户的轨迹信息、基站信息、工参表信息和poi数据信息发送至预设的消费习惯分类模型进行存储;通过消费习惯分类模型,得到用户的消费兴趣值,再根据用户的消费兴趣值,得到用户月内平均兴趣最高的兴趣点类型;将用户月内平均兴趣最高的兴趣点类型作为该用户的消费习惯分类。本发明通过信令大数据路径为基础,结合消费习惯分类模型以及基站信息、工参表信息和poi数据信息,使用户的消费习惯分类更加方便、更加精准。

    一种疫情风险评估方法、系统及可读存储介质

    公开(公告)号:CN114334172B

    公开(公告)日:2022-09-02

    申请号:CN202111522302.1

    申请日:2021-12-13

    Abstract: 本申请实施例提一种疫情风险评估方法、系统及可读存储介质,该方法包括结合用于反映风险评估因子数量的数量数值维度、用于反映对应统计疫情关联地区占地面积上的风险程度的空间密度维度、以及用于反映对应疫情关联地区的人均风险程度的人口密度维度,确定与疫情风险相关联的历史风险评估数据;根据所述历史风险评估数据构建训练样本集,并以预设的机器学习算法进行风险预测模型的训练;所述机器学习算法包括AdaBoost算法;通过训练好的风险预测模型,对所确定的实时风险评估数据进行处理,得到疫情在未来预设天数内的发展趋势。该方法的实施能够提高风险评估全面性。

    基于数据分析的政策匹配方法、系统和可读存储介质

    公开(公告)号:CN114780735A

    公开(公告)日:2022-07-22

    申请号:CN202210155790.5

    申请日:2022-02-21

    Abstract: 本发明公开的一种基于数据分析的政策匹配方法、系统和可读存储介质,其中方法包括:基于预设因子输出对应的政策智能标签,进而基于所述政策智能标签构建全景政策图谱;基于目标客户调用预设数据库进行政策匹配,并结合所述全景政策图谱输出所述客户对应的企业画像;基于所述全景政策图谱对政策进行区域性比对以提取区域政策,其中,比对分析具体包括政策对比、政策重合度对比、政策热词分析以及政策影响评价。本发明可以生成全景政策图谱,并且基于不同客户的实际需要输出适配的政策,同时还可以对政策进行分析,基于不同的区域进行对比,输出区域政策热力图,并利用多源数据对政策施行效果进行融合分析,提供全面、科学的数据支撑给到施政者。

    一种基于轨迹相似性的一机多卡用户判别方法

    公开(公告)号:CN110958599B

    公开(公告)日:2022-05-24

    申请号:CN201811126908.1

    申请日:2018-09-26

    Abstract: 本发明提供一种基于轨迹相似性的区域人口中一机多卡用户数量判定方法,在居住地在统计区域的常驻人口随机抽取一定数量的IMSI,根据抽样数据中每个IMSI在统计时间段内访问过的基站数和在每个基站的驻留时间,确定每个IMSI的移动轨迹;逐一比对一个IMSI与其他IMSI的移动轨迹,筛选出候选一机多卡用户;采用超几何分布对候选一机多卡用户进行检验,并对检验结果进行多重校正,判定出抽样数据中的一机多卡用户。本发明用于通过移动大数据进行区域人口统计,用判定出的统计区域内一机多卡用户对人口统计结果进行校正,可提高人口统计的准确性。

    一种基于大数据的人房企智慧统计方法、系统及可读存储介质

    公开(公告)号:CN114490624A

    公开(公告)日:2022-05-13

    申请号:CN202210340504.2

    申请日:2022-04-02

    Abstract: 本申请实施例提供了基于大数据的人房企智慧统计方法、系统及可读存储介质。该方法,包括:获取区域内楼宇房屋数据信息并进行数据分类清洗得到目标楼房数据,获取分类清洗后所述目标楼房数据的人口特征数据,根据人口特征数据对目标楼房的房屋进行栅格处理得到房屋栅格分布数据,根据房屋栅格分布数据结合人口特征数据获得楼房栅格人口特征画像,根据楼房栅格人口特征画像获得楼宇人企数据信息;从而基于楼房房屋栅格分布数据以及楼房栅格人口特征画像实现对区域重点楼房企人口数据分布的筛选和获取,可以提高对区域高经济活力的楼企人力分布情况的统计准确率,便于掌握区域经济和人力经济运行状况。

    一种基于大数据的网约车司机智能识别方法、系统及可读存储介质

    公开(公告)号:CN114422973A

    公开(公告)日:2022-04-29

    申请号:CN202210320903.2

    申请日:2022-03-30

    Abstract: 本申请实施例提供了基于大数据的网约车司机智能识别方法、系统及可读存储介质。该方法,包括:获取道路区域内移动用户的特征数据信息并识别SIM卡用户并根据SIM卡用户在预设时间段内呼叫信息及路径表数据筛选出第一类别用户,根据第一类别用户手机信令数据获取IMSI基站交互信息数据包筛选出第二类别用户,根据第二类别用户在预设时间切片内移动数据识别用户属性获得第三类别用户,根据移动用户识别模型检验第三类别用户的用户属性获得目标网约车用户;从而基于大数据对道路区域内移动用户进行数据智慧识别实现对移动用户信息的采集和处理,再通过移动信息数据辨别出网约车用户,实现对网约车用户的精准识别和网约车用户相关数据统计,并保障网约车司乘安全。

    一种疫情风险评估方法、系统及可读存储介质

    公开(公告)号:CN114334172A

    公开(公告)日:2022-04-12

    申请号:CN202111522302.1

    申请日:2021-12-13

    Abstract: 本申请实施例提一种疫情风险评估方法、系统及可读存储介质,该方法包括结合用于反映风险评估因子数量的数量数值维度、用于反映对应统计疫情关联地区占地面积上的风险程度的空间密度维度、以及用于反映对应疫情关联地区的人均风险程度的人口密度维度,确定与疫情风险相关联的历史风险评估数据;根据所述历史风险评估数据构建训练样本集,并以预设的机器学习算法进行风险预测模型的训练;所述机器学习算法包括AdaBoost算法;通过训练好的风险预测模型,对所确定的实时风险评估数据进行处理,得到疫情在未来预设天数内的发展趋势。该方法的实施能够提高风险评估全面性。

Patent Agency Ranking