一种数据湖与关系型数据库互联的方法

    公开(公告)号:CN114048260A

    公开(公告)日:2022-02-15

    申请号:CN202210029283.7

    申请日:2022-01-12

    Abstract: 本发明提供了一种数据湖与关系型数据库互联的方法,包括以下步骤:S1.在数据湖中添加关系型数据库的数据源类;S2.数据湖匹配使用关系型数据库的数据源类;S3.根据数据源类确定并加载相应驱动以与相应关系型数据库进行连接。本发明通过传参的方式将数据源注册配置文件、关系型数据库配置文件和驱动包目录串联起来,在启动数据湖时,不需要指定具体要使用哪个数据库,直接使用相应的数据库即可,也不需要遍历配置文件,用户按需通过传递参数的形式获取所需的配置信息即可,实现数据湖与关系型数据库之间的高效连接和双向读写。

    一种数据湖与关系型数据库互联的方法

    公开(公告)号:CN114048260B

    公开(公告)日:2022-09-09

    申请号:CN202210029283.7

    申请日:2022-01-12

    Abstract: 本发明提供了一种数据湖与关系型数据库互联的方法,包括以下步骤:S1.在数据湖中添加关系型数据库的数据源类;S2.数据湖匹配使用关系型数据库的数据源类;S3.根据数据源类确定并加载相应驱动以与相应关系型数据库进行连接。本发明通过传参的方式将数据源注册配置文件、关系型数据库配置文件和驱动包目录串联起来,在启动数据湖时,不需要指定具体要使用哪个数据库,直接使用相应的数据库即可,也不需要遍历配置文件,用户按需通过传递参数的形式获取所需的配置信息即可,实现数据湖与关系型数据库之间的高效连接和双向读写。

    一种高性能的数据湖系统及数据存储方法

    公开(公告)号:CN113791742A

    公开(公告)日:2021-12-14

    申请号:CN202111368382.X

    申请日:2021-11-18

    Abstract: 本发明提供了一种高性能的数据湖系统及数据存储方法,数据存储方法包括以下步骤:S1.将文件转成文件流;S2.将文件流转成一个数组嵌套多个子数组的形式;S3.将所述的转成RDD后存储至数据湖的存储层中。本方案提出嵌套的字段结构,为出湖过程的并行处理提供字段结构基础,有效提高出湖性能,并且根据硬件内核灵活生成嵌套的子数组数量,使数据湖具有更强的扩展性能,针对不同的用户均能够保持最佳的入湖效率,满足用户需求。

    一种多源异构数据管理系统及方法

    公开(公告)号:CN118132602A

    公开(公告)日:2024-06-04

    申请号:CN202410157429.5

    申请日:2024-02-04

    Abstract: 本发明公开一种多源异构数据管理系统及方法,涉及数据处理领域;该系统包括:相互连接的数据源管理模块和数据采集模块;数据源管理模块基于简化描述抽象算法对多源异构数据进行分类,得到分类数据源;分类数据源包括:结构化数据源、半结构化数据源、非结构化数据源和二进制数据源;对分类数据源进行设定配置规则的信息配置,得到数据源信息;设定配置规则包括:URL、用户名、密码和驱动;数据采集模块采用设定数据处理方式,对数据源信息进行查询检索并读取,得到读取数据;设定数据处理方式包括:批数据模式和流数据模式;本发明能够高效简便的实现数据的处理。

    一种因果关系数据湖构建方法、系统、电子设备及介质

    公开(公告)号:CN117992433A

    公开(公告)日:2024-05-07

    申请号:CN202410153131.7

    申请日:2024-02-04

    Abstract: 本发明公开一种因果关系数据湖构建方法、系统、电子设备及介质,涉及数据湖、因果推断和数据管理的技术领域。所述方法包括:获取数据湖中各因果分析来源表;将各因果分析来源表按照共同项进行合并得到合成来源表并存储在数据湖中;在所述合成来源表中挑选所有要进行因果分析的属性并调用因果算法包对所有要进行因果分析的属性的值进行因果分析得到多条因果边;根据各所述因果边的ID和预设全局唯一因果关系ID构建因果关系表和来源信息表并将所述因果关系表和所述来源信息表存储在数据湖中,实现因果关系数据湖构建。本发明可解决现有因果分析方法数据来源分散、分析效率低下,以及数据湖本身不具备数据间因果关系的问题。

Patent Agency Ranking