基于列存数据的流式数据处理方法及系统

    公开(公告)号:CN114185884B

    公开(公告)日:2025-04-04

    申请号:CN202111306456.7

    申请日:2021-11-05

    Abstract: 本发明提出一种基于列存数据的流式数据处理方法及系统,包括:获取待处理的流式数据及其对应的处理任务,基于时间维度将该流式数据切分为批式数据块,该批式数据块中每条数据均包含各自所属窗口的时间戳;根据该时间戳的时间类型,压缩该时间戳,根据压缩结果为该批式数据块中每条数据分配窗口序号,将该批式数据块切分为多个中间数据块,每个中间数据块仅包含窗口序号相同的数据,根据处理任务对每个中间数据块的数据进行预聚合计算,产生预聚合中间状态;根据预设的流式数据时间处理模式,从内部存储提取相应窗口序号的预聚合中间状态并执行与其对应的处理任务,输出各窗口序号的任务处理结果,作为流式数据处理结果。

    一种非等值关联子查询的优化方法和系统

    公开(公告)号:CN108874849B

    公开(公告)日:2020-12-25

    申请号:CN201810097136.7

    申请日:2018-01-31

    Abstract: 本发明公开了一种非等值关联子查询的优化方法和系统,其特征在于,包括:获取关联子查询的外表关联列的取值集;根据该关联子查询中操作符的类型和该取值集,建立该关联子查询的外表关联列到内表关联列分区的映射关系;根据得到的分区集合,对该关联子查询的内表进行分区,同时依据该关联子查询中内表的查询聚合函数,获取关联子查询在各分区的中间结果状态信息;根据该映射关系,遍历该外表关联列,通过聚合对应的分区集的中间结果状态信息,得到外表中各关联列对应的子查询结果。本发明具有的技术效果包括:通过对内表进行分区,并重复利用各分区的中间结果从而得到最终的子查询结果集,以提升查询性能。

    基于微内核操作系统的分布式流式数据处理方法及系统

    公开(公告)号:CN110532072A

    公开(公告)日:2019-12-03

    申请号:CN201910672072.3

    申请日:2019-07-24

    Abstract: 本发明提出一种基于微内核操作系统的分布式流式数据处理方法及系统,包括:获取包含用户定义函数的作业代码,并以该用户定义函数作为节点将该作业代码转换为有向无环图,并根据该有向无环图中算子之间的关联度,将该有向无环图中算子进行合并,得到任务逻辑视图;根据分布式微内核操作系统的物理执行环境,将该任务逻辑视图转换为执行图,该分布式微内核操作系统中工作节点收到该执行图,并将该执行图内的作业任务与作业调度分配至空闲CPU内核执行。与现有技术相比,本发明具有端到端处理延迟低,且吞吐量高,系统镜像体积小,启动时间短的技术进步。

    一种基于SQL与图计算交互式分析的查询方法和系统

    公开(公告)号:CN109684349A

    公开(公告)日:2019-04-26

    申请号:CN201811383695.0

    申请日:2018-11-20

    Abstract: 本发明涉及一种基于SQL与图计算交互式分析的查询方法和系统,包括:根据标准结构化查询语句对数据库中的节点表和边表进行筛选,得到原始节点集和原始边集,根据类结构化查询语句涉及的图计算算法将原始边集转换为图计算算法所需数据结构,原始节点集和原始边集进行连接查询的迭代计算,不断更新节点集,直至算法的迭代终止条件触发,从而得到图计算的最终结果,并将最终结果作为查询结果输出。本发明在已有的关系型数据查询语言SQL中嵌入图查询与图计算方法,既可发挥SQL数据处理与分析的优势,又可进行图查询与计算。

    基于最小执行代价的深度学习框架间模型转换方法及系统

    公开(公告)号:CN110532291B

    公开(公告)日:2022-07-12

    申请号:CN201910676904.9

    申请日:2019-07-25

    Abstract: 本发明提出一种基于最小执行代价的深度学习框架间模型转换方法及系统,包括:在原有技术的基础上,添加操作转换代价值,同时考虑多个独立操作可以融合的情况,补充融合映射;模型的具体实现体现在构成模型的操作转换上,本阶段依据模型转换映射表,通过动态规划算法得到执行代价最低的转换后模型结构。本发明通过操作融合可以减少多个操作间中间结果的读写过程,从而优化计算性能和存储空间,进而降低转换后模型的执行代价。同时,在有多种融合可选时通过动态规划的算法得到执行代价最小的模型转换方法。

    基于列存数据的流式数据处理方法及系统

    公开(公告)号:CN114185884A

    公开(公告)日:2022-03-15

    申请号:CN202111306456.7

    申请日:2021-11-05

    Abstract: 本发明提出一种基于列存数据的流式数据处理方法及系统,包括:获取待处理的流式数据及其对应的处理任务,基于时间维度将该流式数据切分为批式数据块,该批式数据块中每条数据均包含各自所属窗口的时间戳;根据该时间戳的时间类型,压缩该时间戳,根据压缩结果为该批式数据块中每条数据分配窗口序号,将该批式数据块切分为多个中间数据块,每个中间数据块仅包含窗口序号相同的数据,根据处理任务对每个中间数据块的数据进行预聚合计算,产生预聚合中间状态;根据预设的流式数据时间处理模式,从内部存储提取相应窗口序号的预聚合中间状态并执行与其对应的处理任务,输出各窗口序号的任务处理结果,作为流式数据处理结果。

Patent Agency Ranking