基于FPGA-CPU异构环境的大规模数据查询加速装置及方法

    公开(公告)号:CN110990638B

    公开(公告)日:2023-04-28

    申请号:CN201911029459.3

    申请日:2019-10-28

    Applicant: 北京大学

    Abstract: 本发明公布了一种基于FPGA‑CPU异构环境用于图数据库的大规模数据查询加速方法及其在FPGA上的实现装置,将待查询处理的大规模数据表示为资源描述框架RDF格式的大规模图数据集,基于FPGA‑CPU异构环境实现查询加速,解决在大规模数据集上对数据进行快速的查询的问题,加速图数据库查询,可广泛应用于基于图数据处理的应用技术领域。将该方法应用于自然语言问答智能查询中。实施表明,采用本发明方法,查询加速比例在两倍以上,可达到十倍加速,可以更好地满足对响应时间要求较高的应用需求。

    获取同构子图的方法、装置、计算机设备及可读存储介质

    公开(公告)号:CN113779085A

    公开(公告)日:2021-12-10

    申请号:CN202110844838.9

    申请日:2021-07-26

    Applicant: 北京大学

    Inventor: 邹磊 曾立

    Abstract: 本申请实施例提供一种获取同构子图的方法、装置、计算机设备及可读存储介质。方法包括:在第一查询图中确定当前查询的第一节点;响应于第一节点满足第一条件,确定第一节点的至少一个匹配节点,满足第一条件指第一节点的所有邻居节点确定了匹配节点,第一查询图中任一节点的匹配节点指任一节点在第一数据图中对应的具有相同结构的节点;基于查询顺序依次确定第一查询图节点中未确定匹配节点的第二节点的匹配节点;响应于第二节点确定了匹配节点,将第一节点与上述至少一个匹配节点进行匹配;基于匹配结果确定第一查询图的同构子图。该方法基于第一查询图中满足条件的第一节点,确定查询匹配方式,减少重复操作,提高获取同构子图的效率与灵活性。

    确定图数据中结点构成三角形结构个数的方法及系统

    公开(公告)号:CN113742430A

    公开(公告)日:2021-12-03

    申请号:CN202110893175.X

    申请日:2021-08-04

    Applicant: 北京大学

    Inventor: 邹磊 林殷年

    Abstract: 本申请公开了一种确定图数据中结点构成三角形结构个数的方法及系统,属于互联网技术领域。该方法包括:基于各结点对应第一邻居结点的数目,为各结点分配编号;基于图数据中每个边连接两个结点对应编号的大小,确定每个边的第一方向;确定任一结点所连接边的第一方向指向的其他结点,将其他结点确定为任一结点的第二邻居结点;对于任一边连接的两个结点,确定两个结点是否都存在对应的第二邻居结点,如果都存在,则确定各任务结点对中两个结点对应的相同第二邻居结点的目标数目,将每个任务结点对应的目标数目之和,确定为图数据中由结点组成的三角形结构的个数。采用本申请,能够提高在图数据中确定结点构成三角形结构个数的效率。

    基于SIMD指令的图数据库中集合求交方法和装置

    公开(公告)号:CN108897787B

    公开(公告)日:2020-09-29

    申请号:CN201810588419.1

    申请日:2018-06-08

    Applicant: 北京大学

    Inventor: 韩硕 邹磊

    Abstract: 本申请属于数据库技术领域,具体涉及一种基于SIMD指令的图数据库中集合求交方法和装置。该方法通过将目标图中的每个图顶点的邻居顶点集合表示为一个对应的位图,然后将各位图划分为长度相等的数据域,为每个数据域设置一个对应的基址域,再利用SIMD指令对位图进行求交来获取目标图中图顶点的邻居顶点集合的求交结果,可以提高使用SIMD指令进行集合求交时的数据层级并行度,从而节省集合求交所用的时间;另外,通过字节检查方法过滤两个位图的基址域中不可能相等的基址域,再对两个位图的基址域中可能相等的基址域进行对齐比较,然后再获取相等的基址域对应的数据域的逻辑与操作结果,可以减少对两个集合的基址域进行比较的次数,节省了时间。

    基于FPGA-CPU异构环境的大规模数据查询加速装置及方法

    公开(公告)号:CN110990638A

    公开(公告)日:2020-04-10

    申请号:CN201911029459.3

    申请日:2019-10-28

    Applicant: 北京大学

    Abstract: 本发明公布了一种基于FPGA-CPU异构环境用于图数据库的大规模数据查询加速方法及其在FPGA上的实现装置,将待查询处理的大规模数据表示为资源描述框架RDF格式的大规模图数据集,基于FPGA-CPU异构环境实现查询加速,解决在大规模数据集上对数据进行快速的查询的问题,加速图数据库查询,可广泛应用于基于图数据处理的应用技术领域。将该方法应用于自然语言问答智能查询中。实施表明,采用本发明方法,查询加速比例在两倍以上,可达到十倍加速,可以更好地满足对响应时间要求较高的应用需求。

    基于SPARQL查询语言的多查询方法和装置

    公开(公告)号:CN109086376A

    公开(公告)日:2018-12-25

    申请号:CN201810816806.6

    申请日:2018-07-24

    Applicant: 北京大学

    Inventor: 陈佳琪 邹磊

    Abstract: 本申请属于数据库技术领域,具体涉及一种基于SPARQL查询语言的多查询方法和装置。该方法通过获取包括至少两个查询的批量查询簇,当批量查询簇中各查询的查询语言均为SPARQL查询语言时,获取该批量查询簇中任两个以上查询的公共查询三元组模式集,对于每个公共查询三元组模式集,获取该批量查询簇的求值代价,对求值代价最小时对应的公共查询三元组模式集进行求值得到第一求值结果,对每个查询未被包括在该公共查询三元组模式集中的三元组模式进行求值得到该查询的第二求值结果,基于第一求值结果和第二求值结果得到该查询的最终求值结果,可以充分利用各查询之间的结构相似性获取各查询的求值结果,从而减少对多个查询进行求值所用的时间。

    数据查询的方法和装置
    27.
    发明公开

    公开(公告)号:CN107145512A

    公开(公告)日:2017-09-08

    申请号:CN201710208998.8

    申请日:2017-03-31

    Applicant: 北京大学

    Inventor: 韩硕 邹磊

    Abstract: 本发明公开了一种数据查询的方法和装置,属于数据库技术领域。方法包括:获取用户输入的查询信息,对查询信息进行分词得到第一关键词;根据每个第一关键词,从数据图中选择每个第一关键词对应的第二关键词和角色,得到每个第二关键词和每个第二关键词的角色;根据每个第二关键词和每个第二关键词的角色,确定至少一个跨接边,每个跨接边连接角色为顶点的任意两个第二关键词和角色为关系边的任意一个第二关键词;确定每个跨接边的边权,并根据每个跨接边的边权,选择边权最小的预设数目个目标跨接边;根据预设数目个目标跨接边,确定查询图;从数据图中查询查询图对应的查询数据,输出查询数据。提高了数据查询的准确率。

    一种图上两点间最短路径查询方法

    公开(公告)号:CN102521364A

    公开(公告)日:2012-06-27

    申请号:CN201110421889.7

    申请日:2011-12-15

    Applicant: 北京大学

    Abstract: 本发明涉及一种图上两点间最短路径查询方法,其步骤包括:1)从图上随机抽取若干点作为支点,根据各支点间的最短路径得出图上每点的中间性估计值;2)将中间性估计值大于设定值的点作为中心点,将图中各点到各中心点的最短路径信息加入图中各点的hop信息,这些中心点的集合记为Wb;3)将图去除Wb中各点后分割为若干小图Si,并得到点割集Ws;4)对于每个小图Si根据枚举出的任意两点间最短路径,得到该小图Si内的所有点的hop信息;5)根据Wb中各点到Ws中各点的最短路径得到不同小图之间的点的hop信息;6)根据图中各点的hop信息,得到用户输入的两查询点之间的最短路径。本发明的方法可行且高效,能在可接受时间内计算出大规模图上的hop信息。

    图流数据处理的方法
    29.
    发明授权

    公开(公告)号:CN112800288B

    公开(公告)日:2024-08-09

    申请号:CN201911114115.2

    申请日:2019-11-14

    Applicant: 北京大学

    Inventor: 邹磊 苟向阳

    Abstract: 本申请公开了一种图流数据处理的方法,属于数据处理技术领域。该方法应用于FPGA中,该FPGA包括多个控制端口,该FPGA的存储区被配置为包括矩阵区和缓冲区,矩阵区被划分为多个子矩阵区,每个控制端口被配置为控制一个或多个子矩阵区中的图流数据的处理,且不同控制端口控制的子矩阵区不同。该方法包括:确定待查询的图流数据的端点信息;基于端点信息,确定指纹和多个候选存储位置;通过每个控制端口,查询对应的候选存储位置中是否存储有所述指纹,其中,所述对应的候选存储位置位于所述控制端口控制的子矩阵区中。采用本申请,可以有效解决相关技术中图流数据的查询效率低的技术问题。

    一种面向多点对的独立路径计算方法和系统

    公开(公告)号:CN118312646A

    公开(公告)日:2024-07-09

    申请号:CN202410158275.1

    申请日:2024-02-04

    Abstract: 本发明涉及一种面向多点对的独立路径计算方法和系统。该方法包括:将点对集合S划分为大小相同的子集合,称每个子集合为一组;对于每一组点对求解两条独立路径。所述对于每一组点对求解两条独立路径,包括:为同一组中的所有点对同时进行双向宽度优先搜索,得到第一条路径;为存在第一条路径的每对点对更新其对应的图视图;为存在第一条路径的每对点对在更新的图视图上搜索一条路径,称为第二条路径;为存在第一条路径和第二条路径的每对点对调整第一条路径和第二条路径,得到独立路径。在独立路径领域,本发明能够减少访存和计算开销,减少搜索过程中的重复记录;在多实例共享计算领域,本发明能够减少计算冗余和访存冗余,降低计算开销。

Patent Agency Ranking