一种面向高并发场景的混合向量检索方法及装置

    公开(公告)号:CN116166690A

    公开(公告)日:2023-05-26

    申请号:CN202310199075.6

    申请日:2023-03-03

    Inventor: 张明清 徐小良

    Abstract: 本发明公开了一种面向高并发场景的混合向量检索方法及装置。该方法对于向量数据,使用图和量化编码计算距离构建图和量化索引,对构建得到的索引持久化存储于SSD硬盘上;在查询时,给定大批量高并发的查询向量,首先根据量化索引获得搜索候选点;然后,建立多个队列,将搜索候选点分配进入相应队列中;对每个队列,分配队头的搜索候选点读取硬盘获取持久化存储的图索引邻居信息;最后,使用贪婪算法进行搜索,返回查询点的近似最近邻居;本发明针对大规模、高并发查询的应用场景,通过高效分配调度查询,避免了查询堵塞造成的延迟风险,同时优化了SSD硬盘的读取策略,实现硬盘读取和向量计算的均衡,提高了向量的搜索速度。

    一种具有共享约束的社区查询方法及系统

    公开(公告)号:CN115827996B

    公开(公告)日:2023-05-02

    申请号:CN202310166904.0

    申请日:2023-02-27

    Abstract: 本发明公开了一种具有共享约束的社区查询方法及系统。该方法如下:一、获取目标领域的原始多源异构关系数据,以图的方式构建目标领域的异构网络。异构网络中包含多种不同类型的节点。二、根据查询要求,设定最大共享次数α和目标节点q;目标节点为q为被搜索的对象。之后,在异构网络上依次进行数据处理、初始子图构建、k‑truss属性社区发掘以及社区的调整优化,获取社区查询的查询结果。本发明在传统社区查询方法基础上引入社区的共享约束概念,用以控制查询社区的紧密程度。同时,本发明充分考虑查询实体间的属性关系,使找到的社区除了包含元路径的异构连接关系外,还兼具属性距离小的紧密特性。

    一种具有共享约束的社区查询方法及系统

    公开(公告)号:CN115827996A

    公开(公告)日:2023-03-21

    申请号:CN202310166904.0

    申请日:2023-02-27

    Abstract: 本发明公开了一种具有共享约束的社区查询方法及系统。该方法如下:一、获取目标领域的原始多源异构关系数据,以图的方式构建目标领域的异构网络。异构网络中包含多种不同类型的节点。二、根据查询要求,设定最大共享次数α和目标节点q;目标节点为q为被搜索的对象。之后,在异构网络上依次进行数据处理、初始子图构建、k‑truss属性社区发掘以及社区的调整优化,获取社区查询的查询结果。本发明在传统社区查询方法基础上引入社区的共享约束概念,用以控制查询社区的紧密程度。同时,本发明充分考虑查询实体间的属性关系,使找到的社区除了包含元路径的异构连接关系外,还兼具属性距离小的紧密特性。

    一种面向公共安全异构信息网络的可疑组织查询方法

    公开(公告)号:CN115795117A

    公开(公告)日:2023-03-14

    申请号:CN202211010988.0

    申请日:2022-08-23

    Abstract: 本发明涉及一种面向公共安全异构信息网络的可疑组织查询方法。本发明首先获取公共安全领域的人员关系数据集,根据所述人员关系数据集构建公共安全领域的异构信息网络,然后获取线索可疑人员,根据所述线索可疑人员以元路径对异构信息网络进行遍历,获取与线索可疑人员有关的候选可疑人员集合,然后根据k‑core约束获取紧密可疑人员集合,根据紧密可疑人员集合获取所有可能存在的k‑core子图,最后计算每一个k‑core子图的属性距离,最终得到属性相似且结构紧密的可疑组织。本发明在可疑组织查询的过程中同时将异构网络结构信息以及顶点属性信息结合起来,并且同时考虑可疑人员的文本型属性和数值型属性,找到包含线索可疑人员的结构紧密且属性相似的可疑组织。

    一种面向近邻图向量检索的向量编码学习方法及装置

    公开(公告)号:CN115408571A

    公开(公告)日:2022-11-29

    申请号:CN202211050160.8

    申请日:2022-08-31

    Inventor: 徐小良 岳强

    Abstract: 本发明涉及一种面向近邻图向量检索的向量编码学习方法及装置。在获取原始向量后,先构建原始向量近邻图;然后初始化编码模型参数完成准备工作;在训练过程中,原始向量通过编码模型得到过渡编码;过渡编码对应替换原始向量近邻图中的原始向量得到过渡编码近邻图;通过在过渡编码近邻图上执行近邻搜索,获取并筛选路由数据调整编码模型参数,使得编码模型适应近邻图的搜索特征;迭代训练直到满足训练终止条件,输出最终的压缩编码。本发明在向量编码学习过程中引入基于近邻图的搜索过程,直接优化压缩编码在近邻图下的检索性能,可在降低内存开销的同时提升搜索精度和效率。

    基于闭环交叉耦合迭代学习的水晶研磨控制方法与系统

    公开(公告)号:CN112596389B

    公开(公告)日:2022-05-17

    申请号:CN202011504841.8

    申请日:2020-12-18

    Abstract: 本发明公开了一种基于闭环交叉耦合迭代学习的水晶研磨控制方法与系统,其中方法包括以下步骤:S10,建立水晶研磨伺服系统数学模型;S20,建立离散型闭环交叉耦合迭代学习控制器对位置进行控制;S30,离散型闭环迭代学习控制器产生新的控制信号;S40,控制器根据期望位置信息和实际信息得到新的跟踪误差;S50,经过轮廓误差分配模型补偿到各轴以消除每个轴对其它轴的影响。

    一种基于卷积脉冲神经网络的预注意力提取方法

    公开(公告)号:CN114492650A

    公开(公告)日:2022-05-13

    申请号:CN202210111325.1

    申请日:2022-01-29

    Inventor: 徐小良 徐宇奇

    Abstract: 本发明公开了一种基于卷积脉冲神经网络的预注意力提取方法,对脉冲原始数据极性合并后进行时间维度上的过滤,然后计算所有样本在不同像素位置的累计脉冲激活数量,得到能表示不同位置脉冲出现频率的预注意力样本;在原始脉冲数据通过卷积脉冲神经网络正常前馈的同时,并使预注意力样本共同卷积前馈,在各层通过特定函数转换为预注意力大小分别对各个神经元的膜电位进行调节,以指导各层的神经元的脉冲发放。本发明的方法使得卷积脉冲神经网络结合预注意力进行运算,从而令网络能够更加关注较重要的脉冲事件,并减少对不重要脉冲时间的关注和忽略噪声脉冲,提高网络的整体性能。

    一种基于脉冲事件的时间表面特征提取方法

    公开(公告)号:CN114462527A

    公开(公告)日:2022-05-10

    申请号:CN202210107313.1

    申请日:2022-01-28

    Abstract: 本发明公开了一种基于脉冲事件的时间表面特征提取方法,首先获取事件脉冲样本,先计算事件脉冲样本中每个像素位置的自信息大小,然后计算每个样本中每个像素位置的脉冲出现频率,进而计算得到每个样本中每个像素位置的空间位置重要性,之后结合每个位置的空间位置重要性提取时间表面特征。本发明的方法在提取时间表面特征时结合了空间位置重要性,将模型计算的重点放在重要的位置上,改善了传统时间表面特征提取方法对空间信息不敏感的问题和对事件流中的噪声或微小变化过于敏感的问题。

    一种融合结构化和非结构化数据的混合搜索方法

    公开(公告)号:CN112905644A

    公开(公告)日:2021-06-04

    申请号:CN202110285108.X

    申请日:2021-03-17

    Abstract: 本发明公开了一种融合结构化和非结构化数据的混合搜索方法。该方法首先将数据集中每一个实体所包含的结构化和非结构化数据分别向量化得到包含结构化向量和非结构化向量的实体向量;其次基于结构化向量和非结构化向量相似性组合构建融合结构化和非结构化数据近邻图;然后将查询实体所包含的结构化和非结构化数据通过向量化得到包含结构化向量和非结构化向量的混合查询向量;最后混合查询向量在融合结构化和非结构化数据近邻图上通过贪婪算法执行混合搜索得到查询实体的最近邻。本发明实现了同时对非结构化和结构化数据进行搜索的混合搜索,较之于当前的两种分离的索引系统效率得到较大提升。

    一种基于专利的科技人才推荐方法

    公开(公告)号:CN107656920B

    公开(公告)日:2020-12-18

    申请号:CN201710825493.6

    申请日:2017-09-14

    Abstract: 本发明公开了一种基于专利的科技人才推荐方法。该方法包括以下步骤:对专利数据进行预处理,利用科技词对专利文档进行表示;使用词嵌入模型,以词频为权重进行加权平均,对专利文档语义向量化;聚合科技人才的相关专利文档对其科研能力进行表示;将技术需求进行语义向量化,利用余弦相似度计算技术需求与各专利文档之间的相关度,用高斯核函数确定技术需求与各专利文档的计算权重,最后以局部线性加权的方式得到技术需求与科技人才之间的相关度评分;最后,根据相关度评分进行排序,将评分靠前的科技人才作为推荐结果。该方法对科技人才的科研能力和技术需求等实现了语义化表示,同时克服了传统方法中的维度灾难问题。

Patent Agency Ranking