-
公开(公告)号:CN117150082A
公开(公告)日:2023-12-01
申请号:CN202311078258.9
申请日:2023-08-25
Applicant: 东北大学
IPC: G06F16/90 , G06F16/901
Abstract: 本发明提供一种面向近似最近邻搜索的近邻图更新方法,涉及数据查询技术领域。该方法首先根据向量数据库系统内的数据序列,构建近邻图及其反向图;并删除近邻图中过期顶点及其连接边;然后补偿过期顶点的前驱邻居顶点的出度;基于最小角度最大化的边选择策略进行边的选择;并补偿过期顶点的后继邻居顶点的入度;同时对插入的新顶点进行二次细化;最后基于历史查询优化近邻图结构。该方法消除了因更新带来的性能下降的问题,支持流式更新,避免了因更新而重建近邻图,这增大了向量数据库的适用范围。
-
公开(公告)号:CN117235112A
公开(公告)日:2023-12-15
申请号:CN202311165331.6
申请日:2023-09-11
Applicant: 东北大学
IPC: G06F16/2453 , G06N3/048 , G06N3/08
Abstract: 本发明提供一种支持数据库复杂LIKE查询的选择度估计方法,涉及数据库技术领域。首先构建复杂LIKE查询负载,基于复杂LIKE查询负载,构建训练数据集和测试数据集,融合查询类型信息;标识通配符的特殊性;基于神经语言模型对选择度信息进行编码;使用前馈神经网络对选择度信息进行解码;返回选择度估计结果。本发明将LIKE查询谓词的查询子串按字符划分成一个序列,借用人工智能中自然语言处理部分方法的思想学习字符序列中蕴含的选择度信息。可以对更多复杂查询类型的LIKE查询进行选择度估计,并且对不同的查询类型不需使用不同的策略分别处理。同时也不需存储额外的数据结构,只需要存储一个经过训练的学习模型即可达到上述效果,降低了对存储空间的需求。
-