一种用于倾斜数据的流式计算引擎运行方法及系统

    公开(公告)号:CN110990059B

    公开(公告)日:2021-11-19

    申请号:CN201911191154.2

    申请日:2019-11-28

    Abstract: 本发明提出一种用于倾斜数据的流式计算引擎运行方法及系统,包括:获取包含倾斜数据的用户作业,并将该用户作业转换为表示该用户作业的有向无环图,根据该有向无环图中算子的业务处理逻辑,将该有向无环图中节点划分为有状态算子和无状态算子;将全部状态算子包装为有状态任务后输入有状态数据流,将全部无状态算子包装为无状态任务后输入无状态数据流;将该无状态数据流中无状态任务复制发送至任意计算节点,得到无状态处理结果;将该有状态数据流中有状态任务转换为包含键和值的数据记录,将包含相同键的数据记录分配至相同计算节点,得到有状态处理结果,集合该无状态处理结果和有状态处理结果作为该用户作业的运行结果。

    基于压缩图的数据存储方法、存储介质、存储装置和服务器

    公开(公告)号:CN110389953B

    公开(公告)日:2021-10-29

    申请号:CN201910508926.4

    申请日:2019-06-12

    Abstract: 本发明涉及一种基于压缩图的数据存储方法、系统和存储介质,该方法包括:步骤100,生成点表逻辑定义,根据该逻辑定义构建点表,并向该点集中插入数据;步骤200,生成边表逻辑定义,根据该逻辑定义构建边表,从所述点表中选择与该边表相关联的点表,并向所述边表中插入数据;步骤300,设置和执行压缩图定义命令,生成所述压缩图的建图逻辑,设置函数获取与所述压缩图定义关联的所述边表,形成边集聚合组,并生成与所述压缩图定义关联的所述点表的代理结构;步骤400,设置和执行压缩图重置命令,根据所述压缩图的建图逻辑构建所述压缩图。本方法降低了多次建图与建多类图的开销,增加了图构建的灵活性与表示性,减少了重复建图的排序工作量。

    一种自动生成深度学习框架间操作映射的方法及系统

    公开(公告)号:CN110533162A

    公开(公告)日:2019-12-03

    申请号:CN201910677639.6

    申请日:2019-07-25

    Abstract: 本发明提出一种自动生成深度学习框架间操作映射的方法及系统,包括:根据原深度学习框架和目标深度学习框架间的操作转换规则,抽取框架间操作转换的基本共性,根据基本共性构建转换关系,将转换关系作为基类存储于操作转换的初始描述文件中;获得原深度学习框架下支持的操作集合,遍历操作集合,为每个操作构建继承基类的子类,判断操作集合中操作除了基类中的基本转换规则外是否具有特殊属性,若是则补充特殊属性至子类,构成完备描述文件,否则直接保存子类,构成完备描述文件;将完备描述文件输入至编译器,得到操作转换规则,根据操作转换规则将原深度学习框架下待转换的操作转换为目标深度学习框架下的操作。

    一种基于列存数据库的流式数据处理方法及系统

    公开(公告)号:CN114185885A

    公开(公告)日:2022-03-15

    申请号:CN202111307991.4

    申请日:2021-11-05

    Abstract: 本发明提出一种基于列存数据的流式数据处理方法和系统,包括:获取待处理的列存流式数据及其对应的处理任务,基于时间维度将该流式数据切分为批式数据块,根据预设窗口模式为该批式数据块中每条数据分配窗口序号;将该批式数据块切分为多个中间数据块,每个中间数据块仅包含窗口序号相同的数据,对每个中间数据块的数据进行预聚合计算,产生预聚合中间状态;根据预设的流式数据时间处理模式,从内部存储提取窗口对应窗口序号的预聚合中间状态并执行与其对应的处理任务,输出任务执行结果,作为流式数据处理结果。本发明通过使用列存存储及计算引擎,结合预聚合技术,在保持较低延迟的前提下,提升数据分析场景的吞吐量。

    一种自动生成深度学习框架间操作映射的方法及系统

    公开(公告)号:CN110533162B

    公开(公告)日:2022-01-07

    申请号:CN201910677639.6

    申请日:2019-07-25

    Abstract: 本发明提出一种自动生成深度学习框架间操作映射的方法及系统,包括:根据原深度学习框架和目标深度学习框架间的操作转换规则,抽取框架间操作转换的基本共性,根据基本共性构建转换关系,将转换关系作为基类存储于操作转换的初始描述文件中;获得原深度学习框架下支持的操作集合,遍历操作集合,为每个操作构建继承基类的子类,判断操作集合中操作除了基类中的基本转换规则外是否具有特殊属性,若是则补充特殊属性至子类,构成完备描述文件,否则直接保存子类,构成完备描述文件;将完备描述文件输入至编译器,得到操作转换规则,根据操作转换规则将原深度学习框架下待转换的操作转换为目标深度学习框架下的操作。

    一种字符串散列表实现方法和系统

    公开(公告)号:CN110321346B

    公开(公告)日:2021-09-21

    申请号:CN201910450998.8

    申请日:2019-05-28

    Abstract: 本发明涉及一种字符串散列表实现方法,包括:根据字符串长度,将该字符串分发至对应的散列表;其中,该散列表包括数组散列表、数值型散列表和字符型双散列表。本发明使用多种异构散列表存储字符串,针对不同字符串的长度选择合适的散列表;同时针对短字符串,将短字符串划分为固定的几个长度区间,提高内存空间利用率,利用字符串变长的特性,为每种区间的散列槽预留末尾的1字节空间原地存储元数据信息;而针对长字符串,使用二级散列表结构,一级散列表通过仅使用部分前缀值计算字符串散列,减少了散列值的计算量;而二级散列表作为一级散列表的冲突链存储表,解决了一级散列表精简散列计算导致的冲突增大的问题。

    基于最小执行代价的深度学习框架间模型转换方法及系统

    公开(公告)号:CN110532291A

    公开(公告)日:2019-12-03

    申请号:CN201910676904.9

    申请日:2019-07-25

    Abstract: 本发明提出一种基于最小执行代价的深度学习框架间模型转换方法及系统,包括:在原有技术的基础上,添加操作转换代价值,同时考虑多个独立操作可以融合的情况,补充融合映射;模型的具体实现体现在构成模型的操作转换上,本阶段依据模型转换映射表,通过动态规划算法得到执行代价最低的转换后模型结构。本发明通过操作融合可以减少多个操作间中间结果的读写过程,从而优化计算性能和存储空间,进而降低转换后模型的执行代价。同时,在有多种融合可选时通过动态规划的算法得到执行代价最小的模型转换方法。

    一种字符串散列表实现方法和系统

    公开(公告)号:CN110321346A

    公开(公告)日:2019-10-11

    申请号:CN201910450998.8

    申请日:2019-05-28

    Abstract: 本发明涉及一种字符串散列表实现方法,包括:根据字符串长度,将该字符串分发至对应的散列表;其中,该散列表包括数组散列表、数值型散列表和字符型双散列表。本发明使用多种异构散列表存储字符串,针对不同字符串的长度选择合适的散列表;同时针对短字符串,将短字符串划分为固定的几个长度区间,提高内存空间利用率,利用字符串变长的特性,为每种区间的散列槽预留末尾的1字节空间原地存储元数据信息;而针对长字符串,使用二级散列表结构,一级散列表通过仅使用部分前缀值计算字符串散列,减少了散列值的计算量;而二级散列表作为一级散列表的冲突链存储表,解决了一级散列表精简散列计算导致的冲突增大的问题。

    一种多协议数据分类识别的方法和系统

    公开(公告)号:CN101605126A

    公开(公告)日:2009-12-16

    申请号:CN200810114751.0

    申请日:2008-06-11

    Abstract: 一种多协议分类识别的方法和系统,包括:网络流数据截获装置,用于截取每个网络流连接应用层的负载数据构成输入向量;解析装置,用于利用文本类协议数据高层语义信息将所述输入向量解析成可比较的结点序列集合;比较合并装置,将所述结点序列集合中相似的结点序列合并成一个新的结点序列;归类装置,将所述相似合并后的结点序列集合按协议类别分类;特征提取装置,用于对每一个分类结果的集合进行特征提取操作,所得特征可用于识别出所述输入向量的协议类型。与基于端口方法相比,由于协议特征内容具有较强的稳定性,大量同协议的数据将在相似合并阶段合并在一起,分类结果中信息将更为集中,据此提取的特征更为有效,结果精度更高。

Patent Agency Ranking