一种基于副本选择的大数据实时查询系统负载均衡方法

    公开(公告)号:CN103731498A

    公开(公告)日:2014-04-16

    申请号:CN201310755662.5

    申请日:2013-12-31

    Abstract: 本发明涉及计算机数据库处理领域,尤其涉及一种基于副本选择的大数据实时查询系统负载均衡方法,包括节点负载信息收集和节点负载均衡两个过程,节点负载均衡过程包括预处理和选择副本两个阶段。本发明的有益效果:本发明针对现有的大数据实时查询系统负载均衡方法过于简单且不考虑机器当前状态的问题,提出了新的基于副本选择的大数据实时查询系统负载均衡方法,本发明的优点包括:负载均衡效果优于现有的大数据实时查询系统;时间复杂度较小,为O(n2),其中n为块的数目;适用于异构分布式系统和系统中运行其他任务的情况。

    一种基于数据仓库内在特征的OLAP关键词查询方法

    公开(公告)号:CN102306176B

    公开(公告)日:2013-09-25

    申请号:CN201110247045.5

    申请日:2011-08-25

    Abstract: 本发明涉及数据仓库搜索技术,尤其涉及一种基于数据仓库内在特征的OLAP关键词查询方法,将可能的查询结果返回给OLAP用户,简化用户多维分析的过程,本发明只对维度表建立索引,这样提高了索引的速度,消除了无关信息的噪音;在索引过程中,通过过滤非相关维度属性来减少无关信息对查询结果的影响,采用过滤重复的维度列的方法规避冗余数据对语义的影响;根据维度层次粒度产生了维度层次权重系数,通过在传统的全文检索排序策略上增加维度层次权重系数来提升命中结果准确度;通过Joins相似的排序评分方法提高了结果排序的准确性,解决了现有技术中存在的问题。

    一种基于图神经网络的用户通信行为预测方法和装置

    公开(公告)号:CN113516501A

    公开(公告)日:2021-10-19

    申请号:CN202110523619.0

    申请日:2021-05-13

    Abstract: 本发明公开了一种基于图神经网络的用户通信行为预测方法和装置,包括:采集用户属性数据、用户行为数据、用户间通话数据,以及待预测行为数据,将用户属性数据和用户行为数据的编码信息作为节点属性,根据用户间通话数据构建节点之间连边信息,以形成用户通信社交图,待预测行为数据作为待预测行为标签;构建包含图神经网络和分类网络的用户通信行为模型,其中,图神经网络用于提取节点特征,分类网络用于基于节点特征进行用户通信行为预测,利用用户通信社交图和待预测行为标签优化用户通信行为模型参数;应用时,将待预测的用户通信社交图输入至参数优化后的用户通信行为模型,经计算得到用户通信行为预测结果。提升用户通信行为预测的准确性。

    一种基于机器学习预测电信业用户携号转出的方法

    公开(公告)号:CN112153636A

    公开(公告)日:2020-12-29

    申请号:CN202011178646.0

    申请日:2020-10-29

    Abstract: 本发明涉及电信技术领域,尤其涉及一种基于机器学习预测电信业用户携号转出的方法,包括以下步骤:1)采集特征变量数据并进行数据预处理保存到数据库中,在数据库中进行样本采样,将正样本和负样本的比例控制在1:10;2)样本随机分为训练集和测试集;3)选择XGBoost算法为基础构建预测模型,输入训练集训练预测模型,获得预测概率值和特征的重要程度;4)利用训练完成的模型对测试集进行数据预测,并根据预测结果对预测模型进行评估,若评估结果低于阈值,对预测模型进行优化迭代。本发明的有益效果在于:提高预测效率,做到提前预警及时维系,预测模型能够动态进行优化迭代。

    一种基于分组的全局多查询优化方法

    公开(公告)号:CN107133281A

    公开(公告)日:2017-09-05

    申请号:CN201710242819.2

    申请日:2017-04-14

    Abstract: 本发明涉及一种基于分组的全局多查询优化方法,具体实施如下:1)为输入系统的查询语句建立签名;2)根据签名对查询语句进行分组;3)通过对每一分组内的查询计划进行代价估算来进行计划选择;4)将每一分组选择的计划进行合并,最终得到多个全局计划。本发明通过建立查询签名,结合分组思想,确保在最短时间内得到较优全局计划,以此提高多查询优化效率。在大数据背景下的数据统计、数据挖掘、报表生成和联机查询等领域具有广阔的应用前景。

    一种基于超图和动态规划的大数据实时查询优化方法

    公开(公告)号:CN103793467B

    公开(公告)日:2017-01-25

    申请号:CN201310716665.8

    申请日:2013-12-16

    Abstract: 本发明涉及大数据实时查询技术领域,尤其涉及一种基于超图和动态规划的大数据实时查询优化方法,该方法通过采用基于最佳代价的连接顺序优化方法来提升查询效率,在大数据环境下满足用户的实时查询需求。本发明的有益效果在于:针对执行计划搜索空间过大的问题,构建满足左线性树的搜索策略,大大降低了搜索的空间,提升了基于超图和动态计划算法运行的效率;构建满足大数据环境的最佳代价模型,综合考虑了大数据环境下传输代价及哈希连接算法运行特性等因素,确保了优化方法生成的计划是最佳的。

    基于机器学习的高质量用户离网预警模型构建方法

    公开(公告)号:CN115471250A

    公开(公告)日:2022-12-13

    申请号:CN202210929865.0

    申请日:2022-08-03

    Abstract: 本发明公开了基于机器学习的高质量用户离网预警模型构建方法,包括如下步骤:S1、划定电信高质量客户群体范围,划分流失群体和未流失群体;S2、对历史数据中的流失群体进行数据探索;S3、收集与流失群体存在关联性的特征,制作数据宽表;S4、对数据宽表中的数据进行预处理后得到数值型特征数据;S5、通过对宽表内数据进行特征工程进而衍生多维度特征数据;S6、通过多维度特征数据对机器学习模型进行训练得到最优模型;S7、采用最优模型对获取对应客户的流失概率,筛选流失概率大于P0的高质量客户群体,进行离网预警和处置。构建了可以准确有效识别具有高流失倾向的用户群体的预警模型,为及时发现和干预用户离网行为提供数据模型支持。

    一种基于深度神经网络的多因素感知终端换机预测方法

    公开(公告)号:CN110991711A

    公开(公告)日:2020-04-10

    申请号:CN201911135219.1

    申请日:2019-11-19

    Abstract: 本发明涉及一种基于深度神经网络的多因素感知终端换机预测方法,首先采集终端属性以及相关的用户自然属性、通话行为数据、流量使用行为数据和历史换机记录,并进行预处理;其次进行编码得到用户自然属性编码和终端属性编码,根据用户历史换机记录和对应的终端属性编码构建用户历史换机信息编码,并构建用户通话、流量使用行为时序,进行粗化和归一化处理;提取用户通话、流量使用行为时序特征;最后将用户自然属性编码、历史换机信息编码、通话行为时序特征和流量使用行为时序特征拼接后送入全连接网络,预测用户是否会换机。本发明的预测方法,有利于运营商面向用户精准营销移动终端及其配套产品,从而提升移动终端销量、扩大市场规模。

    一种基于GRU的多因素感知短期景区内游客人数预测方法

    公开(公告)号:CN109389244A

    公开(公告)日:2019-02-26

    申请号:CN201811038526.3

    申请日:2018-09-06

    Abstract: 本发明涉及一种基于GRU的多因素感知短期景区内游客人数预测方法,具体实施如下:1)对原始景区数据进行预处理,得到多个时间序列和预测时刻的相关情境信息及其距当前时刻的时刻数;2)利用CNN卷积神经网络提取时间序列的特征向量;利用GRU网络处理CNN提取的特征向量,得到时序特征向量;3)将GRU中得到的时序特征向量和预测时刻的相关情境信息及其距当前时刻的时刻数独热(one-hot)编码相连接,输入到全连接层中,得到预测时刻景区内游客人数。本发明利用CNN和GRU处理景区多时序数据,并加入预测时刻的相关情境信息及其距当前时刻的时刻数来预测短期景区内游客人数,在智能旅游、流量预测等领域具有广阔的应用前景。

    一种基于多情境嵌入的个性化场所语义识别方法

    公开(公告)号:CN109117476A

    公开(公告)日:2019-01-01

    申请号:CN201810761994.7

    申请日:2018-07-12

    Abstract: 本发明涉及一种基于多情境嵌入的个性化场所语义识别方法,本发明针对传统个性化场所语义识别方法中,情境信息考虑不足以及特征工程的固有局限性问题,提出了一种将个性化场所语义和手机App相关性协同识别的方法。对于个性化场所语义识别,利用深度神经网络得到与之相关的多情境信息(时间、用户、用户活动等)的表示。对于手机App相关性识别,利用词嵌入得到不同手机App的表示。通过共享手机App的表示,对模型参数进行协同训练。本发明结合情境感知和表示学习进行个性化场所语义识别,在普适计算和基于位置的服务(LBS)等领域具有广阔的应用前景。

Patent Agency Ranking