元数据的处理方法、系统以及计算设备

    公开(公告)号:CN119271662A

    公开(公告)日:2025-01-07

    申请号:CN202310786272.8

    申请日:2023-06-29

    Abstract: 一种元数据的处理方法、系统以及计算设备,该方法包括:数据生产集群生成共享数据的元数据,数据生产集群将共享数据存储至共享存储;数据生产集群接收元数据操作指令,并根据该元数据操作指令确定目标元数据,该目标元数据是目标共享数据的元数据,数据生产集群将目标元数据发送给数据消费集群;数据消费集群根据目标元数据从共享存储读取目标共享数据。该方法中数据消费集群可以实时获取共享数据的元数据,具有更好的用户体验,同时还可以节省元数据的存储成本。

    缓存管理的方法、装置、设备和存储介质

    公开(公告)号:CN119441081A

    公开(公告)日:2025-02-14

    申请号:CN202311427797.9

    申请日:2023-10-30

    Abstract: 本公开提供了一种缓存管理的方法、装置、设备和存储介质,属于存储技术领域。该方法应用于缓存系统,该缓存系统包括n个缓存层,该n个缓存层中第i+1层的IO速度低于第i层的IO速度,i为正整数,且小于n,该n个缓存层中每层包括冷区和热区,该方法包括:在数据加入该缓存系统时,将该数据以缓存块形式存储在第1层的冷区,在该第i层的冷区中剩余缓存空间不足的情况下,采用先进先出机制,将该第i层的冷区中的缓存块向该第i+1层的冷区移动。每当满足交换条件的情况下,对该第i+1层的热区中被命中缓存块与该第i层的热区中未被命中缓存块执行交换处理。采用本公开提供的方案,能够尽可能应对缓存系统变化的工况。

    一种异常数据识别方法和相关设备

    公开(公告)号:CN117992781A

    公开(公告)日:2024-05-07

    申请号:CN202211351782.4

    申请日:2022-10-31

    Abstract: 本申请实施例公开了一种异常数据识别方法和相关设备,用于识别多元时序数据中的异常数据。在本申请中,在获取了多元时序数据X之后,可以对X进行预处理,得到预处理后的多元时序数据,然后基于所述预处理后的多元时序数据构建数据异常检测模型,并基于所述数据异常检测模型识别异常数据。其中,X={X1,X2,…,XT},Xt为多维特征,T为正整数,t=1,2,…,T,所述处理后的多元时序数据包括W,由于W={Ww,Ww+1,…,WT},Wt={Xt‑w+1,Xt‑w+2,…,Xt},w为小于T的正整数,因此在W相比较X考虑了多元数据在时序上的依赖关系,从而可以更加有效的识别异常数据。

    一种机器学习辅助的查询方法及装置

    公开(公告)号:CN116361325A

    公开(公告)日:2023-06-30

    申请号:CN202310193853.0

    申请日:2023-02-23

    Inventor: 陈旭 曾凯 王静鸿

    Abstract: 本申请提供了一种机器学习辅助的查询方法及装置,涉及信息处理领域。用于通过机器学习强化传统成本模型,提升查询的效率。该方法包括:数据库管理设备生成多个查询计划,多个查询计划中的任一个查询计划都可以用于执行目标查询任务;数据库管理设备根据机器学习增强的成本模型确定多个查询计划对应的预估查询成本;数据库管理设备确定目标查询计划为可执行的查询计划,目标查询计划为多个查询计划中预估查询成本最低的查询计划。

    一种数据处理方法、系统及计算设备集群

    公开(公告)号:CN119903054A

    公开(公告)日:2025-04-29

    申请号:CN202311412603.8

    申请日:2023-10-27

    Abstract: 本申请提供了一种数据处理方法和系统,属于云计算技术领域。该方法包括:数据处理系统接收第一写请求,该数据处理系统包括第一计算集群、第二计算集群和共享存储,共享存储用于存储第一数据表的数据,该第一写请求用于将第一数据写入第一数据表,第一数据表归属于第一计算集群;第二计算集群将归属于第一数据表的第一数据写入共享存储;第二计算集群将第一数据对应的第一元数据发送给第一计算集群;第一计算集群存储第一数据对应的第一元数据。该方法能够满足扩展计算集群支持数据写入的要求,同时仍由表归属的计算集群负责表数据对应的元数据的写入,不需部署单独的元数据管理集群,在降低系统成本的同时不存在元数据管理集群的性能瓶颈问题。

    一种数据处理方法以及相关设备
    6.
    发明公开

    公开(公告)号:CN119719096A

    公开(公告)日:2025-03-28

    申请号:CN202311824307.9

    申请日:2023-12-26

    Abstract: 本申请例提供了一种数据处理方法,用于减少对存储资源的占用,节约存储资源。方法应用于网络设备,包括:获取基表和M个聚合表,基表包括网络设备实际存储的数据,M个聚合表中是根据M个聚合定义对基表包括的数据处理得到的,且M个聚合表各自对应的聚合定义不同,每个聚合定义包括键值对,用于指示处理基表包括的数据的方式。根据M个聚合定义包括的键,从M个聚合表中确定待合并的N个聚合表。对待合并的N个聚合表进行合并,得到合并后的聚合表,合并后的聚合表的数据量小于待合并的N个聚合表的数据量之和。其中,M和N均为大于或等于2的整数,且N小于或等于M。

    基于数据仓库系统的数据处理方法和数据仓库系统

    公开(公告)号:CN118093686A

    公开(公告)日:2024-05-28

    申请号:CN202211667377.3

    申请日:2022-12-23

    Abstract: 本申请公开了一种基于数据仓库系统的数据处理方法和数据仓库系统,属于数据仓库技术领域。该方法应用于该数据仓库系统,在该数据处理方法中,协调节点将数据表的数据写入请求分配给云计算集群中的第一计算节点,由第一计算节点对该数据写入请求对应的目标数据是否符合约束条件进行校验,若校验通过,则通过元数据集群对该目标数据进行再次校验,若元数据集群也校验通过,由云存储集群将该目标数据写入数据表中,可见,该数据仓库系统通过两层索引机制,利用了云原生架构的元数据集群,来校验待写入数据表的数据是否满足约束条件,从而在提供数据约束能力的同时,确保了数据可靠性,也确保了系统运行性能不受影响。

    一种数据分析方法及相关设备
    10.
    发明公开

    公开(公告)号:CN118193560A

    公开(公告)日:2024-06-14

    申请号:CN202211565695.9

    申请日:2022-12-07

    Abstract: 本申请提供了一种数据分析方法,由数据分析系统执行,该系统包括协调节点、元数据管理装置和多个计算集群,计算集群中包括元数据缓存,元数据管理装置中记录有元数据缓存的状态,该方法包括:协调节点接收查询语句,向元数据管理装置下发一致性判断请求,元数据管理装置根据元数据缓存的状态,获得至少一个计算集群的元数据缓存的一致性判断结果,然后向协调节点返回一致性判断结果,接着根据一致性判断结果,从多个计算集群中确定目标计算集群,目标计算集群根据协调节点下发的分析请求,进行数据分析。由于无需在下发的执行计划中携带元数据,降低网络诉求。并且,基于一致性判断结果可以精准获取数据,减少同步次数,降低网络诉求。

Patent Agency Ranking