主键确定方法、装置及计算机可读存储介质

    公开(公告)号:CN120021230A

    公开(公告)日:2025-05-20

    申请号:CN202410088939.1

    申请日:2024-01-22

    Abstract: 本申请提供主键确定方法、装置及计算机可读存储介质,其中,方法步骤为:主键生成系统获取同一流式数据或者不同流式数据中的多个数据记录(包括相同的多个字段),并对多个数据记录进行采样,将采样的数据记录中存在重复值的字段和/或字段组合确定为非候选键,之后确定多个可能候选键(指全集中除非候选键之外剩余的元素,全集包括多个字段和多个字段中至少两个字段的组合),并判断多个可能候选键是否均可作为候选键,在确定均可作为候选键的情况下,从多个可能候选键中选出目标候选键,最后基于每个数据记录中对应目标候选键的值生成每个数据记录的统一主键的值,从而使得后续可以基于统一主键集成多个数据记录,即集成流式数据。

    一种数据资产的生成方法以及装置

    公开(公告)号:CN119515318A

    公开(公告)日:2025-02-25

    申请号:CN202510088608.2

    申请日:2025-01-21

    Abstract: 本申请实施例公开了一种数据资产的生成方法以及装置,用于提升数据资产。本申请实施例方法包括:计算设备基于数据资产特征从工作流抽取目标任务节点集合,目标任务节点集合包括工作流中的一个或多个任务节点,一个或多个任务节点用于识别数据资产。计算设备对目标任务节点集合中一个或多个任务节点的上下文信息进行命名实体识别,确定一个或多个数据资产片段,上下文信息包括任务节点中与数据资产片段相关联的数据。计算设备基于一个或多个数据资产片段生成数据资产。

    节点管理方法和装置
    3.
    发明公开

    公开(公告)号:CN118524038A

    公开(公告)日:2024-08-20

    申请号:CN202310100850.8

    申请日:2023-02-10

    Inventor: 王抗战 吕红

    Abstract: 本申请实施例公开了节点管理方法和装置,涉及计算机技术领域,能够避免分布式集群系统中工作节点被错误摘除。该方法包括:首先监控节点与工作节点集群中的第一工作节点建立心跳会话。然后上述监控节点获取上述第一工作节点的目标事件状态。之后若上述监控节点与上述第一工作节点之间的心跳会话建立超时,且上述第一工作节点执行目标事件超时,则上述监控节点确定上述第一工作节点为异常节点。其中,上述目标事件状态用于指示上述第一工作节点执行目标事件是否超时,上述目标事件包括垃圾回收(GC)和负载均衡(Rebalance)中的至少一项。

    数据查询方法、装置、电子设备以及计算机可读存储介质

    公开(公告)号:CN118152420A

    公开(公告)日:2024-06-07

    申请号:CN202211523534.3

    申请日:2022-11-30

    Abstract: 本申请公开了一种数据查询方法、装置、电子设备以及计算机可读存储介质,属于数据处理技术领域。本方法通对第一查询语句的语义分析操作,除了显示第一查询语句中第一关键字的属性,还显示不确定属性的第二关键字的候选属性,以为第二关键字进行属性推荐,进一步通过对推荐的候选属性的确认操作,来确定第二关键字的属性,从而后续在基于第一查询语句进行数据查询时,以便根据第一查询语句中各个关键字的属性,精确返回数据库中具有这些属性信息的数据,从而提高了数据查询结果的准确性。

    数据处理方法、数据处理引擎、计算设备及存储介质

    公开(公告)号:CN117971892A

    公开(公告)日:2024-05-03

    申请号:CN202211679701.3

    申请日:2022-12-26

    Inventor: 彭磊 王抗战

    Abstract: 本申请提供了一种数据处理方法、数据处理引擎、计算设备及存储介质,属于计算机技术领域。该方法包括:确定数据处理作业待访问的外部数据库以及该外部数据库中的目标访问对象;将该目标访问对象的元数据,从该外部数据库缓存至该数据处理引擎的内存中;从该内存中访问该元数据,以执行该数据处理作业。通过上述方法,将外部数据库中的元数据缓存至数据处理引擎的内存中,从内存访问元数据,能够避免多次通过网络访问外部数据库的目录,进而减少网络开销,同时规避网络的不可用对数据处理作业的执行产生影响,提升数据处理引擎的性能,提高数据处理的效率。

Patent Agency Ranking