拉链表构建方法、装置、设备及存储介质

    公开(公告)号:CN117667924A

    公开(公告)日:2024-03-08

    申请号:CN202311546331.0

    申请日:2023-11-17

    Abstract: 本发明公开了一种拉链表构建方法、装置、设备及存储介质,该方法包括:获取数据源系统的数据变更捕捉日志;通过目标数据湖根据数据变更捕捉日志生成批量增量数据文件;分别将批量增量数据文件映射至第一侧的外部表和第二侧的增量截止表,得到第一侧的拉链表和第二侧的拉链表;根据增量数据文件的数据采集模式根据第一侧的拉链表和第二侧的拉链表构建目标数据仓库的拉链表;通过上述方式,在根据数据源系统的数据变更捕捉日志生成批量增量数据文件后,将批量增量数据文件分为两部分进行映射,然后结合批量增量数据文件根据不同侧的拉链表构建目标数据仓库的拉链表,从而能够有效提高构建拉链表的准确性,进而提高数据仓库的实时分析能力。

    异网卡槽套餐推荐方法及系统
    12.
    发明公开

    公开(公告)号:CN116797303A

    公开(公告)日:2023-09-22

    申请号:CN202210247993.7

    申请日:2022-03-14

    Abstract: 本申请涉及大数据处理技术领域,提供一种异网卡槽套餐推荐方法及系统。所述方法包括:获取异网卡槽的套餐使用状态数据,根据套餐使用状态数据生成对应的原始特征向量;将原始特征向量输入到改进的深度自编码器中,构建目标数据特征向量;基于改进的K‑means聚类模型,通过多个样本移动终端的历史数据特征向量,得到聚类结果;基于联合概率密度函数和数值距离,通过目标数据特征向量和历史数据特征向量,计算目标移动终端和聚类结果中每个样本移动终端之间数据特征向量的相似性度量,并根据相似性度量,确定对应样本移动终端的套餐信息;根据套餐信息,生成异网卡槽的套餐推荐信息。本申请实施例可提高异网卡槽套餐推荐信息的准确率。

    区域用户数量统计值预测方法、装置、设备及介质

    公开(公告)号:CN108053080B

    公开(公告)日:2021-05-11

    申请号:CN201711488849.8

    申请日:2017-12-30

    Abstract: 本发明公开了区域用户数量统计值预测方法、装置、设备及介质,方法包括:基于原始信令数据,确定用户实时位置;基于用户实时位置,确定区域中各网格的实时用户数量统计值;与时间相关联地保存所述实时用户数量统计值;以及基于各网格的历史用户数量统计值和当前用户数量统计,通过深度卷积神经网络预测模型,预测各网格未来预定时间段的用户数量统计值。由此,结合了当前及周边网格实时、历史数据作为输入特征,并基于深度卷积神经网络进行自适应建模,实现区域网格客流量预测。

    用户分类模型的确定方法、装置、设备及存储介质

    公开(公告)号:CN111612528A

    公开(公告)日:2020-09-01

    申请号:CN202010361519.8

    申请日:2020-04-30

    Inventor: 刘亮 顾强 张晟

    Abstract: 本申请公开了一种用户分类模型的确定方法、装置、设备及存储介质,具体包括:获取多组超参数组合和用户行为数据训练样本;利用遗传算法,将多组所述超参数组合作为采集函数的初始种群,进行种群迭代优化,以得到满足预设优化条件的目标超参数组合;根据所述目标超参数组合和用户行为数据训练样本,对所述用户分类模型进行迭代训练,以得到所述用户分类模型的性能指标;当所述性能指标满足预设寻优条件时,将所述性能指标对应的目标超参数组合作为所述用户分类模型的超参数,以确定所述用户分类模型。根据本申请实施例,提升用户分类模型的分类预测结果的准确性。

    识别存在家庭关系客户的方法、装置、设备及介质

    公开(公告)号:CN109639478A

    公开(公告)日:2019-04-16

    申请号:CN201811493732.3

    申请日:2018-12-07

    Inventor: 张晟 刘亮 顾强

    CPC classification number: H04L41/5064 H04L41/145 H04L41/147 H04W24/02

    Abstract: 本发明提供了一种识别存在家庭关系客户的方法、装置、设备及介质。该方法包括:获取目标位置的真实家庭用户;筛选目标位置处预设时间段中闲时通话天数所占比例大于第一预设比例的交往圈用户;将真实家庭用户和交往圈用户进行混合,得到基础用户;从基础用户中选取第二预设比例的用户作为训练样本集用户;基于已知家庭关系样本集用户的多个输入变量,剔除与用于识别家庭关系无关的输入变量,获取多个重要输入变量;对训练样本集用户的多个重要输入变量进行建模,获得模型输出规则,用于识别存在家庭关系的客户。根据本发明提供的技术方案,利用真实家庭用户和交往圈用户数据训练模型,并附加多个与识别家庭关系有关的变量,大幅提升预测准确度。

    用户常驻地识别方法、装置、设备及介质

    公开(公告)号:CN109275107A

    公开(公告)日:2019-01-25

    申请号:CN201811294944.9

    申请日:2018-11-01

    Inventor: 顾强 熊亦兰

    Abstract: 本发明公开了一种用户常驻地识别方法、装置、设备及介质。该方法通过获取用户标识,并根据用户标识确定用户驻留的基站及在基站的驻留时长的第一对应关系;获取居民小区信息及居民小区与基站的对应关系,并根据最长的驻留时长确定居民小区与基站一对一的第二对应关系;基于基站将第一对应关系和第二对应关系进行关联,并根据最长的驻留时长确定用户标识与居民小区一对一的对应关系,得到用户的常驻居民小区。根据本发明实施例能够识别用户的常驻居民小区。

    一种伪基站定位方法和装置

    公开(公告)号:CN107155186A

    公开(公告)日:2017-09-12

    申请号:CN201710229649.4

    申请日:2017-04-10

    Inventor: 李亮 赵雨 顾强

    Abstract: 本发明公开了一种伪基站定位方法和装置,涉及通信技术领域。该伪基站定位方法,包括:获取基站在预设时间内的上网信令中的统一资源定位符URL信息以及基站信息;在URL信息中筛选得到疑似非法URL信息;记录每个基站在预设时间内上网信令中相同的疑似非法URL信息的数目;若基站在预设时间内上网信令中相同的疑似非法URL信息的数目大于预设阈值,确定伪基站位于基站的覆盖范围内。能够提高定位伪基站的准确率。

    一种确定位置的方法及装置

    公开(公告)号:CN105847310A

    公开(公告)日:2016-08-10

    申请号:CN201510017616.4

    申请日:2015-01-13

    Abstract: 本发明涉及大数据应用领域,特别涉及一种确定位置的方法及装置,用以解决目前无法确定客户当前的常驻位置的问题。该方法包括:在确定终端在每个时间段内的位置后,确定终端在每个时间段内的聚类位置,再确定同一类型的时间段内相关联的聚类位置对应的本次的总驻留时间,和没有相关联的聚类位置对应的本次的总驻留时间,最后在遍历所有类型的时间段的次数达到设定阈值后,确定同一类型的时间段对应的聚类位置。这种技术方案由于能够通过确定终端在不同类型时间段内的聚类位置以及聚类位置对应每次的总的驻留时间,因此能够确定同一类型的时间段对应的聚类位置即客户当前的常驻位置。

    一种终端虚拟存储的方法、设备和系统

    公开(公告)号:CN105827669A

    公开(公告)日:2016-08-03

    申请号:CN201510001952.X

    申请日:2015-01-04

    Abstract: 本发明实施例公开了一种终端虚拟存储的方法、设备和系统,该方法可以包括:当终端开机加电并开始加载外置存储卡时,终端通过由高速无线网络承载的专用通道向云存储服务器发送虚拟存储请求信令;终端接收由云存储服务器通过专用通道发送的鉴权成功信息,并根据鉴权成功信息通过专用通道向云存储服务器发送授权请求;终端接收云存储服务器通过专用通道发送的授权信息之后,将终端自身在云存储服务器中对应的存储空间进行虚拟磁盘映射操作,映射成终端本地的虚拟磁盘;终端根据终端本地的虚拟磁盘与终端自身在云存储服务器中对应的存储空间之间的映射关系通过专用通道从终端自身在云存储服务器中对应的存储空间中加载终端对应的应用程序及数据。

Patent Agency Ranking