-
公开(公告)号:CN118964686A
公开(公告)日:2024-11-15
申请号:CN202411013010.9
申请日:2024-07-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/903 , G06F16/907 , G06F16/9035 , G06F16/9038 , G06F9/50
Abstract: 本申请一个或多个实施例提供一种向量检索方法、装置、设备和存储介质;基于原始向量构建的图索引,以及与原始向量对应的压缩向量存储在第一级存储资源中;图索引中的节点关联压缩向量,边表示与边连接的节点存在近邻关系;原始向量存储在第二级存储资源中;第一级存储资源的数据访问性能优于第二级存储资源;该方法包括:响应于查询向量,从第一级存储资源中基于图索引获取与查询向量的相似度最高的至少一个压缩向量,并在获取完成后,从第二级存储资源中获取与至少一个压缩向量对应的至少一个原始向量;分别计算查询向量与至少一个原始向量之间的相似度,并据此对至少一个原始向量进行排序,以基于排序结果确定与查询向量对应的向量检索结果。
-
公开(公告)号:CN118796831A
公开(公告)日:2024-10-18
申请号:CN202410871730.2
申请日:2024-06-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/22 , G06F16/2457 , G06F16/27
Abstract: 本说明书实施例提供一种在向量数据库中写入、搜索向量数据的方法和装置。在向量数据库中写入向量数据的方法包括:接收针对目标向量数据的写入请求;在内存表中向量数据库的动态的第一索引中添加所述目标向量数据对应的索引更新信息;所述第一索引为基于内存的实时读写向量图索引;当所述内存表刷新到磁盘时,将所述内存表中动态的第一索引的索引更新信息存储到分布式文件系统,得到静态的第一索引;将所述分布式文件系统中静态的第一索引转化为第二索引;所述第二索引为基于磁盘的低成本向量图索引。能够兼顾实时性和存储成本。
-
公开(公告)号:CN118964422A
公开(公告)日:2024-11-15
申请号:CN202411008291.9
申请日:2024-07-25
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F16/2455 , G06F18/2411
Abstract: 本申请一个或多个实施例提供一种向量检索方法、装置、设备和存储介质;与原始向量对应的压缩向量存储在第一级存储资源中;原始向量存储在第二级存储资源中;该方法包括:响应于查询向量,从第一级存储资源中,获取与查询向量的相似度最高的至少一个压缩向量;基于分类模型对各个压缩向量进行分类决策,以获取所对应的原始向量为与查询向量最相似的候选向量的至少一个目标压缩向量;从第二级存储资源中,获取与至少一个目标压缩向量对应的至少一个目标原始向量;分别计算查询向量与至少一个目标原始向量之间的相似度,并基于计算出的相似度对至少一个目标原始向量进行排序,以基于排序后的至少一个目标原始向量确定与查询向量对应的向量检索结果。
-
-