-
公开(公告)号:CN111400314B
公开(公告)日:2023-10-27
申请号:CN202010136299.9
申请日:2020-03-02
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种利用向量图索引从数据库中检索节点向量的方法及装置。向量图索引将数据库中的各个节点划分在从高到低的各个层中,高层中节点的数量小于低层中节点的数量,每一层的节点在该层以及该层以下的各层中均存在设定数目的邻居,且高层的邻居数目小于低层的邻居数目,节点的向量与其邻居节点的向量之间的匹配度大于预设阈值。在检索时,基于向量图索引,按照从最高层到最低层的顺序依次,从每层的入口节点、入口节点在本层的邻居节点,以及邻居节点在本层的邻居节点中,确定与待检索节点在向量上匹配目标节点,基于本层的目标节点确定下一层的入口节点,并基于从最低层中确定出的目标节点,确定针对第一节点检索得到的节点。
-
公开(公告)号:CN111274265B
公开(公告)日:2023-09-19
申请号:CN202010062528.7
申请日:2020-01-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/535 , G06F16/242 , G06F16/538 , G06F16/55
Abstract: 本说明书实施例提供一种基于多种检索方式融合检索的方法和装置,方法包括:获取目标检索对象对应的目标检索向量和过滤条件;根据目标检索向量,从数据库的备选检索对象集中召回距离目标检索向量最近的第一数目个第一候选对象,第一数目为预先设定的;根据过滤条件,按照条件过滤方式从第一数目个第一候选对象中筛选出第二数目个第一候选对象,并将第二数目添加到累积数目;若累积数目小于预设阈值,则将第一数目个第一候选对象从备选检索对象集中排除,以更新备选检索对象集,并再次从更新的备选检索对象集中召回排序在前的第一数目个第二候选对象,直到筛选出的候选对象的累积数目大于或等于预设阈值。能够兼顾检索性能和返回结果数量。
-
公开(公告)号:CN111309985A
公开(公告)日:2020-06-19
申请号:CN202010163627.4
申请日:2020-03-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/901
Abstract: 本说明书实施例提供一种基于PostgreSQL数据库的高维向量存储方法和装置。该数据库包括多个节点向量,数据库的索引包括多个数据页,数据页用于存储节点向量,且一个节点向量的数据量大于一个数据页的容量。在对第一节点向量进行存储时,生成与第一节点向量对应的第一数据元组,第一数据元组包括向量位置区段和向量数据区段,向量数据区段存储第一节点向量的向量数据;获取索引中待存储数据的第一数据页,从第一数据页的空闲存储区域的开端开始存储第一数据元组,根据剩余数据量至少生成一个第二数据页,并将剩余数据存储至第二数据页;基于第一数据页和第二数据页确定第一节点向量的位置信息,将第一节点向量的位置信息存储至向量位置区段。
-
公开(公告)号:CN111309984A
公开(公告)日:2020-06-19
申请号:CN202010163626.X
申请日:2020-03-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/901 , G06F16/903 , G06F16/906
Abstract: 本说明书实施例提供一种利用索引从数据库中进行节点向量检索的方法及装置。PostgreSQL数据库包括多个节点的向量,索引将多个节点划分到多个簇中,每个簇对应一个中心点。在检索时,基于该索引,将多个簇对应的中心点分别与待检索的第一节点进行向量匹配,从多个中心点中确定与第一节点在向量上最匹配的目标中心点,将目标中心点所在的第一簇中的多个节点分别与第一节点进行向量匹配,根据匹配结果将各个节点加入匹配队列中基于匹配队列中的节点排序,确定针对第一节点检索到的节点。
-
公开(公告)号:CN111309984B
公开(公告)日:2023-09-05
申请号:CN202010163626.X
申请日:2020-03-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/901 , G06F16/903 , G06F16/906
Abstract: 本说明书实施例提供一种利用索引从数据库中进行节点向量检索的方法及装置。PostgreSQL数据库包括多个节点的向量,索引将多个节点划分到多个簇中,每个簇对应一个中心点。在检索时,基于该索引,将多个簇对应的中心点分别与待检索的第一节点进行向量匹配,从多个中心点中确定与第一节点在向量上最匹配的目标中心点,将目标中心点所在的第一簇中的多个节点分别与第一节点进行向量匹配,根据匹配结果将各个节点加入匹配队列中基于匹配队列中的节点排序,确定针对第一节点检索到的节点。
-
公开(公告)号:CN111400314A
公开(公告)日:2020-07-10
申请号:CN202010136299.9
申请日:2020-03-02
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供一种利用向量图索引从数据库中检索节点向量的方法及装置。向量图索引将数据库中的各个节点划分在从高到低的各个层中,高层中节点的数量小于低层中节点的数量,每一层的节点在该层以及该层以下的各层中均存在设定数目的邻居,且高层的邻居数目小于低层的邻居数目,节点的向量与其邻居节点的向量之间的匹配度大于预设阈值。在检索时,基于向量图索引,按照从最高层到最低层的顺序依次,从每层的入口节点、入口节点在本层的邻居节点,以及邻居节点在本层的邻居节点中,确定与待检索节点在向量上匹配目标节点,基于本层的目标节点确定下一层的入口节点,并基于从最低层中确定出的目标节点,确定针对第一节点检索得到的节点。
-
公开(公告)号:CN111309985B
公开(公告)日:2023-08-25
申请号:CN202010163627.4
申请日:2020-03-10
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/901
Abstract: 本说明书实施例提供一种基于PostgreSQL数据库的高维向量存储方法和装置。该数据库包括多个节点向量,数据库的索引包括多个数据页,数据页用于存储节点向量,且一个节点向量的数据量大于一个数据页的容量。在对第一节点向量进行存储时,生成与第一节点向量对应的第一数据元组,第一数据元组包括向量位置区段和向量数据区段,向量数据区段存储第一节点向量的向量数据;获取索引中待存储数据的第一数据页,从第一数据页的空闲存储区域的开端开始存储第一数据元组,根据剩余数据量至少生成一个第二数据页,并将剩余数据存储至第二数据页;基于第一数据页和第二数据页确定第一节点向量的位置信息,将第一节点向量的位置信息存储至向量位置区段。
-
公开(公告)号:CN111274265A
公开(公告)日:2020-06-12
申请号:CN202010062528.7
申请日:2020-01-19
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/242 , G06F16/535 , G06F16/538 , G06K9/62
Abstract: 本说明书实施例提供一种基于多种检索方式融合检索的方法和装置,方法包括:获取目标检索对象对应的目标检索向量和过滤条件;根据目标检索向量,从数据库的备选检索对象集中召回距离目标检索向量最近的第一数目个第一候选对象,第一数目为预先设定的;根据过滤条件,按照条件过滤方式从第一数目个第一候选对象中筛选出第二数目个第一候选对象,并将第二数目添加到累积数目;若累积数目小于预设阈值,则将第一数目个第一候选对象从备选检索对象集中排除,以更新备选检索对象集,并再次从更新的备选检索对象集中召回排序在前的第一数目个第二候选对象,直到筛选出的候选对象的累积数目大于或等于预设阈值。能够兼顾检索性能和返回结果数量。
-
公开(公告)号:CN111008620A
公开(公告)日:2020-04-14
申请号:CN202010147725.9
申请日:2020-03-05
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06K9/00 , G06F16/583 , G06F16/683
Abstract: 本申请公开了一种目标用户识别方法、装置及存储介质、电子设备。该目标用户识别方法,包括:获取目标用户的待识别生物特征向量;在目标索引库中,基于最邻近搜索算法将待识别生物特征向量分别与查找到的起始节点及其邻居节点进行相似度比对,生成候选结果集,其中,目标索引库为通过最邻近搜索算法对生物特征库中的生物特征向量进行索引构造操作后得到的索引,候选结果集包括携带有相似度的候选生物特征向量;根据携带有相似度的候选生物特征向量以及预设的可靠阈值,确定识别结果。
-
-
-
-
-
-
-
-