一种基于MPP引擎的跨数据中心快速查询方法和系统

    公开(公告)号:CN107066546B

    公开(公告)日:2021-03-09

    申请号:CN201710165501.9

    申请日:2017-03-20

    Abstract: 本发明涉及一种基于MPP引擎的跨数据中心快速查询方法和系统,属于大数据检索分析领域,可应用于实时系统或离线备份系统。该方法将不同MPP引擎中的数据进行统一标记并存储到元数据中;全局中心节点接收查询请求并对其进行语法解析,然后分发送到对应的数据分中心节点;各数据分中心节点通过元数据的相应MPP引擎进行查询,并将数据传输给全局中心节点;全局中心节点利用MPP引擎对数据分中心节点返回的数据进行快速查询,并输出查询结果。本发明能够实现不同数据中心数据的联合查询,兼容多种MPP引擎,充分利用不同存储模式的特点优化查询,支持多种方式导出查询结果,便于实现上层不同应用对结果数据再分析的不同要求。

    一种GPU上的基于着色优化的置信传播方法

    公开(公告)号:CN112257865A

    公开(公告)日:2021-01-22

    申请号:CN202010940174.1

    申请日:2020-09-09

    Abstract: 本发明公开了一种GPU上的基于着色优化的置信传播方法。本发明通过使用信息残差大的顶点对信息残差小的顶点进行固定步长的着色操作,在整个图模型上形成多个以信息残差大的顶点为中心的分区,将该顶点命名为中心点;在每个分区中,按照最远顶点到中心点以及中心点到最远点的顺序对边上的信息进行更新操作,以完成每次迭代的置信传播计算。本发明能够保证置信传播方法在短时间内收敛大多数顶点。

    一种滑动窗口下多维数据重复检测快速索引方法

    公开(公告)号:CN105989061B

    公开(公告)日:2019-11-26

    申请号:CN201510066798.4

    申请日:2015-02-09

    Abstract: 本发明涉及一种滑动窗口下多维数据重复检测快速索引方法。该方法采用压缩计数型布隆过滤器矩阵数组来维护滑动窗口内的数据项,在滑动窗口内维护多个子窗口,队首子窗口以滑动方式接收新元素,队尾子窗口以滑动方式淘汰老元素;每个独立子窗口由一个计数型布隆过滤器矩阵组成,计数型布隆过滤器矩阵具备面向多维数据的维度删减能力,并且其内部维护计数器单元。通过对所有计数型布隆过滤器矩阵均采用相同的设计容量并共享同一组k个哈希函数,能够有效提升重复元素检测效率;通过在计数器单元中维护系统基础时钟,能够有效支持滑动窗口的元素隐式删除;通过矩阵方式维护多维数据,有效降低多维数据的组合误差率,降低整体误判率。

    一种估算误差可控的概要数据压缩方法

    公开(公告)号:CN104935348B

    公开(公告)日:2018-01-05

    申请号:CN201510254377.4

    申请日:2015-05-18

    Abstract: 本发明公开了一种估算误差可控的概要数据压缩方法。本方法为:1)对每个对象的概要数据建立一时间追踪器;对于待写入的概要数据,根据对象定位到对应的时间追踪器,然后时间追踪器对概要数据进行采样并保存对该时间追踪器对应的样本集合中;2)将每个时间追踪器的样本集合中的样本划分为多个时间阶段并设置误差参数;然后时间追踪器根据对应的误差参数对样本进行采样;3)将处理后的样本集合合并成一个样本集合H,然后将集合H中的样本数据划分多个时间阶段并根据对应误差参数采样写入到一新时间追踪器的样本集合内。本发明压缩后的概要数据不仅线性的提升存储空间,而且仍然能够支持误差限定的近似计算。

    一种基于最优重构的特征选择方法

    公开(公告)号:CN107203489A

    公开(公告)日:2017-09-26

    申请号:CN201710188156.0

    申请日:2017-03-27

    Inventor: 张晓宇 王树鹏

    CPC classification number: G06F17/16

    Abstract: 本发明提供一种基于最优重构的特征选择方法,其步骤为:1)将数据集中每个原始特征为d维的数据表示为数据矩阵X,其中d>1;2)对上述数据矩阵X建立最优化线性重构模型,且该模型最优化目标为表示矩阵B;3)将上述数据矩阵X进行转置得到特征矩阵F,并将表示矩阵B进行清零;4)利用迭代交替优化的方式对上述经过步骤3)的最优化线性重构模型进行求解,得到最优表示矩阵B*;5)根据最优表示矩阵B*选取能够表示全部d维特征的最优k维特征子集,其中k

    集群内存自适应管理方法、服务器集群系统

    公开(公告)号:CN103226520A

    公开(公告)日:2013-07-31

    申请号:CN201310113105.3

    申请日:2013-04-02

    Abstract: 本发明涉及一种集群内存自适应管理方法、服务器集群。其中,集群内存自适应管理方法包括:对于数据服务器集群中的每个数据服务器,在使用前对该数据服务器按照变步长加性增长方式进行内存预分配,将内存分割为设定数目的片组,每个片组的总容量相等,每个片组包含容量相等的多个分片。本发明的集群内存自适应调管理方法,采用优化模式的内存预先分配的策略,保证了内存的合理分片,从而提高了内存的存取效率,也减少了内存碎片的产生。此外,本发明的集群内存自适应调管理方法能够进行内存自适应调整,大大提高了内存的自治能力和稳定性。

Patent Agency Ranking