-
公开(公告)号:CN115827624A
公开(公告)日:2023-03-21
申请号:CN202211239859.9
申请日:2022-10-11
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/22 , G06F16/2453
Abstract: 本公开关于一种检索数据的处理方法、数据检索方法、装置、电子设备、计算机可读存储介质以及计算机程序产品,通过获取检索数据,针对属性特征相同的目标检索数据,生成与属性特征对应的图结构,并根据各个属性特征之间的相似度,连接各个属性特征分别对应的图结构,得到连接后的目标图结构,进而将目标图结构中每一个节点的初始特征向量转换为目标特征向量,从而得到向量转换后的目标图结构。其通过采用精度较高的初始特征向量构建图结构,从而能够提高图结构中的邻域质量,且在建图过程中考虑了检索数据的属性特征,因此能够用于带属性的检索;通过在建图完成后,将每个节点的较高精度的向量转换为低精度的向量,还能提高后续检索的效率。
-
公开(公告)号:CN115495504A
公开(公告)日:2022-12-20
申请号:CN202211236433.8
申请日:2022-10-10
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/2458 , G06F16/2453 , G06N3/04
Abstract: 本公开关于一种数据查询方法和装置、电子设备、计算机可读存储介质,数据查询方法包括:对待检索向量的属性信息进行编码处理,得到对应的一个编码数据,作为待检索编码数据;获取参考向量集合,参考向量集合包括多个参考向量,每个参考向量关联有参考编码数据,参考编码数据是对关联的参考向量的属性信息进行编码处理后得到的一个编码数据;结合待检索编码数据和参考编码数据,从参考向量集合中,确定出对应于待检索向量的目标向量,目标向量用于进行数据查询。通过将属性信息编码为一个编码数据,可令编码数据参与到检索计算中,利用属性优化检索结果,提高召回率,并可将多属性约束问题转换为单属性约束问题,保障检索效率。
-
公开(公告)号:CN115309807A
公开(公告)日:2022-11-08
申请号:CN202211027623.9
申请日:2022-08-25
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/2458 , G06K9/62
Abstract: 本公开涉及资源数据查找方法、装置、服务器及存储介质。包括:获取资源数据对应的第一向量以及量化后的多个第二向量;分别计算所述第一向量与多个所述第二向量的相似度,确定相似度最高的第一数量的第二向量;对所述第一数量的第二向量进行解量化处理,得到解量化的第二向量;其中,若所述第一数量的第二向量中存在元素的量化值为预设值的目标第二向量,利用预存储的所述元素的浮点数值替换所述预设值;从所述解量化的第二向量中确定与所述第一向量相似度最高的第二数量的第二向量,将所述第二数量的第二向量对应的资源数据作为查找结果。本公开实施例能够提高了资源数据查找的准确率。
-
公开(公告)号:CN115952226A
公开(公告)日:2023-04-11
申请号:CN202310028320.7
申请日:2023-01-09
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/25 , G06F16/174
Abstract: 本公开关于一种模型存储方法及装置。本公开针对存储形式为浮点数的参数,将该参数划分两部分,并仅存储包括该参数符号位、指数位和部分尾数位的部分,使得该参数在存储的时候,无需存储包含该参数剩余尾数位的部分,降低了这类参数的所占用的存储空间,同时还将去除该参数剩余尾数位的部分所带来的偏差一并进行存储,避免了压缩后恢复该参数所带来的失真。
-
公开(公告)号:CN115794809A
公开(公告)日:2023-03-14
申请号:CN202211238792.7
申请日:2022-10-11
Applicant: 北京达佳互联信息技术有限公司
Abstract: 本公开涉及资源数据的检索方法、装置、电子设备及存储介质。所述方法包括:获取资源数据的初始第一向量以及多个量化后的第二向量;其中,所述量化后的第二向量为利用预设的正交矩阵对数据集中的初始第二向量进行特征处理,以及利用缩放因子对特征处理后的第二向量进行量化处理得到,所述特征处理后的第二向量的均匀分布程度高于所述初始第二向量的均匀分布程度;利用所述正交矩阵对所述初始第一向量进行特征处理,得到第一向量;分别计算所述第一向量与多个所述量化后的第二向量的相似度,确定相似度最高的预设数量的量化后的第二向量,并将所述预设数量的量化后的第二向量对应的资源数据作为检索结果。本公开实施例的检索准确率较高。
-
公开(公告)号:CN117407544A
公开(公告)日:2024-01-16
申请号:CN202310692899.7
申请日:2023-06-12
Applicant: 北京达佳互联信息技术有限公司
IPC: G06F16/432 , G06F16/43
Abstract: 本公开关于一种资源查询方法、装置、电子设备和存储介质,所述方法包括:获取初始查询资源的第一资源表征信息、初始查询资源关联的第一资源属性信息、候选资源的第二资源表征信息和候选资源关联的第二资源属性信息,计算第一资源属性信息与第二资源属性信息间的第一相关度和第一资源表征信息与第二资源表征信息间的第二相关度,并对第二相关度进行降权处理,再基于降权后的第二相关度和第一相关度进行资源查询,得到初始查询资源对应的目标查询资源。该方法可以基于资源属性信息确定的相关度和资源表征信息确定的相关度,进行混合查询,可以优先查询目标资源属性域,从而提高了资源查询的效率和准确性。
-
-
-
-
-