一种基于查询分布感知的向量数据库系统

    公开(公告)号:CN120067147A

    公开(公告)日:2025-05-30

    申请号:CN202510126887.7

    申请日:2025-01-27

    Inventor: 徐小良 程涛

    Abstract: 本发明涉及向量数据库领域,针对不同分布用户查询导致的高延迟、低召回率问题,提供了一种基于查询分布感知的向量数据库系统,包括索引构建模块、向量检索模块、区间测量模块、日志记录模块、分布感知模块、分布检测模块、分布映射模块、存储模块、接口代理模块和图形化管理界面;本发明为向量数据的存储与检索提供了一套高效解决方案,同时,实时监测用户查询的分布情况,对向量分布进行有效度量,通过用户历史查询优化向量索引结构,保障向量数据库查询质量的稳定和可靠。

    一种基于解耦结构嵌入的知识图谱补全方法及系统

    公开(公告)号:CN119578532A

    公开(公告)日:2025-03-07

    申请号:CN202411893174.5

    申请日:2024-12-20

    Abstract: 本发明公开了一种基于解耦结构嵌入的知识图谱补全方法,该知识图谱补全方法利用预训练语言模型的能力和提示工程的方法,将知识图谱的结构信息通过提示的方式输入了预训练语言模型,并在输出时将文本分数和结果分数融合,避免了预训练语言模型强大的文本处理能力覆盖了提示中提供的结构信息,提高了搜索引擎内知识图谱的质量;同时,本发明在解耦图学习器中添加了关系感知的注意力机制,根据实体在不同三元组中表示不同的含义进行解耦,让知识图谱的结构信息能够更加精准地传递给文本信息,且结构信息能够更有选择性地利用文本信息,达到结构信息与文本信息融合时的平衡,增加了搜索引擎内知识图谱的准确性。

    一种基于近邻图索引自动构建的最近邻检索方法

    公开(公告)号:CN119311700A

    公开(公告)日:2025-01-14

    申请号:CN202411867225.7

    申请日:2024-12-18

    Abstract: 本发明公开了一种基于近邻图索引自动构建的最近邻检索方法,通过自注意力机制特征提取模块和图卷积神经网络分别提取并融合向量数据集和k近邻图的特征,使用参数性能预测模块根据特征提取器模块的输出和参数配置的拼接结果对性能指标进行预测,从而完成近邻图索引的构建。较之于现有的近邻图参数选择的方法,本发明所提出的模型能够提升近邻图参数选择的准确度和效率,且能够满足相关应用在大规模场景下的向量检索要求,优化用户的体验;同时,本发明在对向量数据集进行特征提取时,采用图神经网络进行特征提取,相较于传统的特征工程方式,使用图神经网络能够提取更丰富的特征,因此使得模型在进行近邻图参数性能预测时精度更高。

    一种面向大语言模型智能体的经验抽取与任务规划方法

    公开(公告)号:CN118193160A

    公开(公告)日:2024-06-14

    申请号:CN202410316721.7

    申请日:2024-03-20

    Inventor: 徐小良 李鹤鹏

    Abstract: 本发明提供一种面向大语言模型智能体的经验抽取与任务规划方法,先构建执行历史库,并向智能体提供执行历史上传接口,再提取子任务分解经验、任务执行方案经验和易错点提醒经验;之后对任务描述进行数据增强,以减轻任务描述多样性对语义相似度搜索的影响,最后构建经验库,并向智能体提供经验获取接口,智能体收到任务请求后,调用所述经验获取接口,通过语义相似度检索得到任务相关的经验数据,基于所述任务相关的经验数据,优化智能体的Prompt构造。

    一种基于抽象语义图的事件参数提取方法及系统

    公开(公告)号:CN117874254A

    公开(公告)日:2024-04-12

    申请号:CN202410028677.X

    申请日:2024-01-09

    Inventor: 吴彬 徐小良

    Abstract: 本发明涉及信息抽取领域,具体涉及一种基于抽象语义图的事件参数提取方法及系统。该提取方法包括如下步骤:获取输入文本所对应的抽象语义图;基于图卷积神经网络设计adapter结构,将adapter结构插入预训练语言模型结构的每一层中,微调预训练语言模型;构建事件模板,将事件模板提示和输入文本拼接作为微调后的预训练语言模型的输入,根据已知事件类型的模板提示,填充模板中需要的事件参数,得到最终的事件参数预测结果。本发明可以通过图的方式学习抽象语义图的结构化信息,解决了生成模型对结构信息关注低的问题,通过构建adapter形式的微调方式同预训练模型进行交互,提高了模型训练的稳定性和事件参数抽取的准确率。

    大规模网络下具有精度保障的快速社区查询系统及方法

    公开(公告)号:CN117453970A

    公开(公告)日:2024-01-26

    申请号:CN202311430089.0

    申请日:2023-10-31

    Abstract: 本发明公开了大规模网络下具有精度保障的快速社区查询系统及方法。该方法如下:一、获得源自多种不同来源的属性数据,涉及相关领域的目标信息,根据这些信息以图的方式构建目标领域的大规模社区网络。二、根据查询要求,设定精度约束、置信度、结构约束以及目标节点;目标节点为为被搜索的对象。之后,在大规模社区网络上依次进行属性感知采样、近似估计、候选社区调优以及基于误差的采样参数调整,最终获取社区查询的查询结果。本发明将属性感知采样引入社区查询方法,用以控制查询社区的规模,并利用近似估计方法保证社区质量。同时,本发明综合实体之间的属性关联,还具备相似度较高的密切特性。

    一种融合结构化和非结构化数据的混合搜索方法

    公开(公告)号:CN112905644B

    公开(公告)日:2022-08-02

    申请号:CN202110285108.X

    申请日:2021-03-17

    Abstract: 本发明公开了一种融合结构化和非结构化数据的混合搜索方法。该方法首先将数据集中每一个实体所包含的结构化和非结构化数据分别向量化得到包含结构化向量和非结构化向量的实体向量;其次基于结构化向量和非结构化向量相似性组合构建融合结构化和非结构化数据近邻图;然后将查询实体所包含的结构化和非结构化数据通过向量化得到包含结构化向量和非结构化向量的混合查询向量;最后混合查询向量在融合结构化和非结构化数据近邻图上通过贪婪算法执行混合搜索得到查询实体的最近邻。本发明实现了同时对非结构化和结构化数据进行搜索的混合搜索,较之于当前的两种分离的索引系统效率得到较大提升。

    一种融合地理知识的混合知识图谱构建方法

    公开(公告)号:CN113139065B

    公开(公告)日:2022-07-22

    申请号:CN202110445559.5

    申请日:2021-04-25

    Abstract: 本发明公开了一种融合地理知识的混合知识图谱构建方法,该方法主要包括以下步骤:首先,针对现有知识图谱中部分带有地理知识属性的实体,设计混合知识图谱中的地理知识模型。其次,根据构建好的模型从包含地理实体的公开地理数据集和百科类知识图谱中抽取并清洗地理实体的结构化或半结构化知识。最后,构建一个地理实体的名称字典,并根据名称字典,对处理后两个数据源中的地理实体知识做实体链接工作,完成地理知识和百科知识的融合。本发明可以应用于任何包含大量地理实体的知识图谱中,以融合这些实体间隐含的地理知识,实现对知识图谱下游任务中基于地理位置信息查询的有效支撑。

    一种基于知识图谱的复杂问题语义理解方法

    公开(公告)号:CN114595341A

    公开(公告)日:2022-06-07

    申请号:CN202210264731.1

    申请日:2022-03-17

    Abstract: 本发明公开了一种基于知识图谱的复杂问题语义理解方法,先对复杂问题进行实体识别和关系抽取,获取实体特征及实体间关系特征,生成复杂问题的语义图;使用查询图预测模型对语义图进行预测,生成与语义图相对应的查询图;根据查询图在知识图谱中遍历,得到查询路径后根据复杂问题的逻辑计算得到复杂问题的答案。本发明的方法将输入问题转换为了对应的查询结构,具有优秀的解释性和准确率,结合知识图谱的搜索,能够准确完成复杂问题的解答。

    一种基于近邻图的多模态搜索方法

    公开(公告)号:CN113656678B

    公开(公告)日:2022-03-01

    申请号:CN202111212706.0

    申请日:2021-10-19

    Abstract: 本发明涉及一种基于近邻图的多模态搜索方法,先将参照数据集中每一个参照对象的各个模态数据生成特征向量,然后根据各特征向量先独立计算,再用聚集函数融合计算得到各查询对象间的融合距离,由此构建参照对象的近邻图。接着根据查询内容生成包含多个特征向量的查询向量,使用查询向量在近邻图上执行多模态搜索得到最相似的查询目标。本发明的方法通过查询融合距离而同时对对象的多个模态进行查询,并能通过调整聚集函数而改变不同模态对融合距离的影响权重,从而实现了在搜索过程中对模态重要性的灵活操控,并提高了搜索的效率和精度。

Patent Agency Ranking