一种面向数据湖的多表语义连接方法

    公开(公告)号:CN115017151A

    公开(公告)日:2022-09-06

    申请号:CN202210413337.X

    申请日:2022-04-20

    Abstract: 本发明提供的一种面向数据湖的多表语义连接方法,基于两个构建列嵌入向量模型构建孪生网络模型,将步骤一获得新表格,根据给定的标签,组建表格对;将多组表格对输入到孪生网络模型中,对其进行训练,因此只需要提供表格具有基本的内容信息就能够进行表格的可连接性预测,并快速计算出结果;该方法没有多余的预处理不需要额外的计算步骤,且设计简单容易实现,提高了多表语义连接方法和预测模型的效率,具备良好的可扩展性、鲁棒性和稳定性;采用Simhash对表格内的行进行抽样,只需按照相同的比例重新构造一张数据行更少的新表格作为输入,这既可以减小表格的输入规模,又可以最大限度的保留表格的特征。

    基于数据价值的可验证索引构建与验证方法

    公开(公告)号:CN114911867A

    公开(公告)日:2022-08-16

    申请号:CN202210408956.X

    申请日:2022-04-19

    Abstract: 本发明公开了一种基于数据价值的可验证索引构建与验证方法,属于区块链数据检索技术领域,本发明方法包括基于数据价值的高效可验证默克尔IR树索引结构与构建方法,针对数据价值的高效可验证top‑k检索算法以及检索结果集的可靠性验证算法;本发明能够有效降低在区块链上维护默克尔IR树结构的维护消耗,提高区块链上对查询数据范围内包含目标关键字数据top‑k查询的效率,并且支持查询客户端对检索结果集的可靠性验证,使得用户能够对检索数据的正确性和完整性进行验证。

    一种基于区块链的图谱查询验证方法

    公开(公告)号:CN114840681A

    公开(公告)日:2022-08-02

    申请号:CN202210385844.7

    申请日:2022-04-13

    Abstract: 本发明涉及链上链下混合存储区块链领域,涉及一种基于区块链的图谱查询验证方法,特别涉及基于混合存储区块链的可验证子图查询处理方法。本发明提供了一种基于区块链的图谱查询验证方法,完善了区块链中图式结构数据的可验证查询机制。本发明通过在服务器端基于大图顶点的结构信息构建树形可验证索引,有效捕获数据以及区块间的复杂拓扑结构,借助区块链的不可篡改和可溯源的性质存储树形可验证索引的根节点以及大图的哈希值,实现了查询结果与验证信息高效并行生成。

    一种基于LSH的非等值可连接数据表直接查询方法

    公开(公告)号:CN115374142A

    公开(公告)日:2022-11-22

    申请号:CN202210396758.6

    申请日:2022-04-15

    Abstract: 本发明提出了一种基于LSH的非等值可连接数据表直接查询方法,基于高维数据近似匹配方法中常用的LSH方法,根据相似度阈值在候选数据表构建列维度的索引,使用相同的哈希函数将查询数据表中的查询列生成哈希值,在创建的候选数据表的索引中查找满足相似度阈值的可连接数据表;本发明方法只需要提供需要丰富数据的数据表,即查询数据表,和候选数据集以及相似度阈值,即可快速地在候选数据集中找到满足相似度阈值的可连接数据表,丰富查询数据;算法没有多余的预处理,不需要额外的计算步骤,且设计简单容易实现,提高了非等值可连接数据表查询算法的查询效率。

    一种基于深度学习的自然语言转化为SQL语句的方法

    公开(公告)号:CN114880347A

    公开(公告)日:2022-08-09

    申请号:CN202210456388.0

    申请日:2022-04-27

    Abstract: 本发明涉及到一种基于深度学习的自然语言转化为SQL语句的方法,特别是使用知识蒸馏方法的获得轻量级的模型技术,属于数据库智能检索、问答系统等技术领域。本发明提出了一种基于深度学习的NL2SQL算法,基于BERT预训练模型对英文和中文的自然语言进行编码训练得到NL2SQL模型,再使用知识蒸馏方法获得轻量级的NL2SQL模型,根据提供的NL2SQL任务数据集训练模型,输入自然语言问题后即可推理出对应的SQL语句;本发明能够处理中文和英文NL2SQL任务;本发明减小模型的计算资源消耗,提高推理速度。

    基于区块链分布式账本与数据库的链上链下混合存储方法

    公开(公告)号:CN114020797A

    公开(公告)日:2022-02-08

    申请号:CN202111249709.1

    申请日:2021-10-26

    Abstract: 本发明公开了一种基于区块链分布式账本与数据库的链上链下混合存储方法,通过构建一种基于区块链分布式账本与数据库的链上链下混合存储机制,帮助数据提供方避免大规模数据上链以及解决图片等类型数据无法上链的问题,帮助数据使用者通过区块链平台更加便捷的使用与访问链下数据库保存的数据;其中使用的HyperledgerFabric能够为本发明提供不可篡改、可溯源等特性,而openGauss为数据提供方提供解决企业级场景需求的方案,本发明为数据使用者以及数据提供方提出更加安全可靠的数据使用方案。

Patent Agency Ranking