-
公开(公告)号:CN116360709B
公开(公告)日:2023-08-08
申请号:CN202310629133.4
申请日:2023-05-31
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F3/06
Abstract: 本发明提供一种数据存取系统,包括,第一SSD缓存阵列,包括多个并联的SSD存储器;处理器,分别连接到多个并联的SSD存储器;第二双SSD目录备份存储器,包括两个互为备份的SSD存储器,且与第一SSD缓存阵列相连;第一HDD磁盘阵列,包括多个HDD磁盘,用于存储数据;多个传感器,用于探测SSD存储器和HDD磁盘的状态数据;性能管理单元,包括第一接口,分别连接到第一SSD缓存阵列中的每个SSD存储器;第三接口,分别连接到第一HDD磁盘阵列中的每个HDD磁盘;第二接口,与处理器相连;第四接口,连接到多个传感器,获取传感器探测的状态数据;第五接口,连接到第二双SSD目录备份存储器。
-
公开(公告)号:CN115309837A
公开(公告)日:2022-11-08
申请号:CN202210930836.6
申请日:2022-08-04
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F16/28 , G06F16/2457 , G06Q30/02
Abstract: 本发明涉及一种基于列式存储的流水排序方法,其技术特点是:包括异步IO线程、流水化线程和排序线程,其根据所有CU的元信息构建CU序列,并根据CU序列的最小值信息构造边界序列,在排序过程中,将CU视为一个数据集合,对于相邻的两个CU,使用后一个CU的最小值做边界将数据划分为两部分,前一部分可以作为子集合单独排序,后一部分和第二个CU组成一个新的集合,再和后面的CU继续进行相同的处理,实现流水排序。本发明设计合理,实现了对采用列式存储并且近似有序的数据集合进行快速排序功能,具有处理速度快、占用资源小等特点。
-
公开(公告)号:CN102750368B
公开(公告)日:2014-03-26
申请号:CN201210200158.4
申请日:2012-06-18
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种数据库集群数据高速导入方法,其技术特点是:包括以下步骤:步骤1:数据导入驱动组件与数据库集群的交互模块建立连接并获取各个数据库节点连接信息;步骤2:数据导入驱动组件通过步骤1建立的数据库集群连接获取目标表的模式信息及分片存储信息并与相关数据库节点建立连接;步骤3:数据导入驱动组件向相关数据库节点进行数据导入,交互控制模块接收数据导入结果,并更新目标表的相关统计信息。本发明的数据导入驱动组件,解放了控制节点,实现在尽可能少受数据库集群干预的情况下完成数据的导入;同时,采用独立数据导入的方式,可以方便的通过增加客户端来实现并行导入,提升导入性能,从而满足企业对数据高速导入的要求。
-
公开(公告)号:CN102323946B
公开(公告)日:2013-03-27
申请号:CN201110259524.9
申请日:2011-09-05
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F17/30
Abstract: 一种并行数据库中算子复用的实现方法,包括如下步骤:步骤1、使用普通的查询规划方法为查询生成串行的查询计划,所述查询计划是一个二叉树结构;步骤2、自顶向下扫描执行所述查询计划,寻找可复用的物化类算子,并更改查询计划结构,将线程级物化算子改为全局复用的物化算子;步骤3、对步骤2生成的更改后的查询计划进行并行化处理,生成用于多个线程并行执行的计划森林;步骤4、对步骤3生成的计划森林进行全局复用算子合并处理,生成用于可供多个线程并行执行且可复用物化算子的有向图计划;步骤5、各个线程并行执行所述有向图中的各自的计划部分,第一个执行到全局复用算子的线程称之为主线程,由主线程锁住该全局复用算子并真正执行该算子及其以下的计划,其他线程等待;步骤6、所述主线程执行完该算子之后解锁,其他线程开始从该全局复用算子中读取数据并继续各自的计划树;步骤7、所述主线程等待所有的计划都读取完毕全局复用算子的数据之后释放该算子物化的数据。
-
公开(公告)号:CN102750368A
公开(公告)日:2012-10-24
申请号:CN201210200158.4
申请日:2012-06-18
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种数据库集群数据高速导入方法,其技术特点是:包括以下步骤:步骤1:数据导入驱动组件与数据库集群的交互模块建立连接并获取各个数据库节点连接信息;步骤2:数据导入驱动组件通过步骤1建立的数据库集群连接获取目标表的模式信息及分片存储信息并与相关数据库节点建立连接;步骤3:数据导入驱动组件向相关数据库节点进行数据导入,交互控制模块接收数据导入结果,并更新目标表的相关统计信息。本发明的数据导入驱动组件,解放了控制节点,实现在尽可能少受数据库集群干预的情况下完成数据的导入;同时,采用独立数据导入的方式,可以方便的通过增加客户端来实现并行导入,提升导入性能,从而满足企业对数据高速导入的要求。
-
公开(公告)号:CN102033938A
公开(公告)日:2011-04-27
申请号:CN201010597139.0
申请日:2010-12-10
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F17/30
Abstract: 本发明方法是基于一种二级映射的方法来实现满足负载均衡的动态扩展技术。即首先在第一维对集群的数据按照hash方法进行负载的均衡分布,这是第一级映射。在第一维的基础上采用一个M:N的映射表来进行第二级的映射,从而在第一维实现数据的分布负载均衡,在第二维实现集群的动态扩展。本发明使用了二级映射方法,既保留了集群中常用的hash分发方法的数据分布负载均衡特点,又支持了动态扩展的需要。同时利用了元数据库的事务特性保证了对二级映射表更新时的读写隔离性,保证了扩展的动态在线。和静态扩展技术动辄需要停机几分钟相比,本发明不仅不需停止应用业务,而且操作简单,每扩展一个节点的时间在秒级。
-
公开(公告)号:CN116910099A
公开(公告)日:2023-10-20
申请号:CN202311139421.8
申请日:2023-09-06
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F16/2455 , G06F16/22 , G06F16/2453 , G06F16/2458
Abstract: 本申请公开了一种数据处理方法、装置、设备及介质,数据处理方法包括:获取各第一数据单元和各第二数据单元,其中,各第一数据单元和各第二数据单元分别由第一数据集和第二数据集中的目标数据得到;对各第一数据单元和各第二数据单元执行条件过滤操作,根据第一关联条件对经条件过滤操作后剩余的各第一数据单元和各第二数据单元进行关联过滤操作;对经关联过滤操作后剩余的各第一数据单元执行重组操作,得到各第一数据单元集;根据第一数据单元集对经关联过滤操作后剩余的各第二数据单元执行重组操作,得到各第二数据单元集;其中,各第一数据单元集无交集;对具有映射关系的第一数据单元集和第二数据单元集执行数据处理操作,得到数据处理结果。
-
公开(公告)号:CN116360709A
公开(公告)日:2023-06-30
申请号:CN202310629133.4
申请日:2023-05-31
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F3/06
Abstract: 本发明提供一种数据存取系统,包括,第一SSD缓存阵列,包括多个并联的SSD存储器;处理器,分别连接到多个并联的SSD存储器;第二双SSD目录备份存储器,包括两个互为备份的SSD存储器,且与第一SSD缓存阵列相连;第一HDD磁盘阵列,包括多个HDD磁盘,用于存储数据;多个传感器,用于探测SSD存储器和HDD磁盘的状态数据;性能管理单元,包括第一接口,分别连接到第一SSD缓存阵列中的每个SSD存储器;第三接口,分别连接到第一HDD磁盘阵列中的每个HDD磁盘;第二接口,与处理器相连;第四接口,连接到多个传感器,获取传感器探测的状态数据;第五接口,连接到第二双SSD目录备份存储器。
-
公开(公告)号:CN115630065A
公开(公告)日:2023-01-20
申请号:CN202211272183.3
申请日:2022-10-18
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F16/22 , G06F16/2453 , G06F3/06
Abstract: 本发明提出一种基于多压缩模式子分区表的存储和查询方法,包括:步骤S1、接收一系列按照预定格式流传输的块数据;步骤S2、基于预定格式进行解析,获取所述块数据中的数据组成;步骤S3、分析数据组成的不同部分,对应的采用不同压缩模式对数据块进行压缩;步骤S4、基于所采用的压缩模式,在第一查找表中匹配对应的分区号段,在压缩数据中单独设置的索引分区类型字段,将所述匹配到的索引分区号段作为附加数据;步骤S5、基于所述的分区号标志,存储到对应的子分区表中,并记录对应数据的索引和压缩模式字段;步骤S6、在数据存储过程中,对不同的子分区表,分配不同大小的连续空间进行存储;步骤S7、用户基于数据压缩模式或数据格式类型,在对应的索引存储表中进行检索。
-
公开(公告)号:CN102323946A
公开(公告)日:2012-01-18
申请号:CN201110259524.9
申请日:2011-09-05
Applicant: 天津神舟通用数据技术有限公司
IPC: G06F17/30
Abstract: 一种并行数据库中算子复用的实现方法,包括如下步骤:步骤1、使用普通的查询规划方法为查询生成串行的查询计划,所述查询计划是一个二叉树结构;步骤2、自顶向下扫描执行所述查询计划,寻找可复用的物化类算子,并更改查询计划结构,将线程级物化算子改为全局复用的物化算子;步骤3、对步骤2生成的更改后的查询计划进行并行化处理,生成用于多个线程并行执行的计划森林;步骤4、对步骤3生成的计划森林进行全局复用算子合并处理,生成用于可供多个线程并行执行且可复用物化算子的有向图计划;步骤5、各个线程并行执行所述有向图中的各自的计划部分,第一个执行到全局复用算子的线程称之为主线程,由主线程锁住该全局复用算子并真正执行该算子及其以下的计划,其他线程等待;步骤6、所述主线程执行完该算子之后解锁,其他线程开始从该全局复用算子中读取数据并继续各自的计划树;步骤7、所述主线程等待所有的计划都读取完毕全局复用算子的数据之后释放该算子物化的数据。
-
-
-
-
-
-
-
-
-