一种融合地理知识的混合知识图谱构建方法

    公开(公告)号:CN113139065A

    公开(公告)日:2021-07-20

    申请号:CN202110445559.5

    申请日:2021-04-25

    Abstract: 本发明公开了一种融合地理知识的混合知识图谱构建方法,该方法主要包括以下步骤:首先,针对现有知识图谱中部分带有地理知识属性的实体,设计混合知识图谱中的地理知识模型。其次,根据构建好的模型从包含地理实体的公开地理数据集和百科类知识图谱中抽取并清洗地理实体的结构化或半结构化知识。最后,构建一个地理实体的名称字典,并根据名称字典,对处理后两个数据源中的地理实体知识做实体链接工作,完成地理知识和百科知识的融合。本发明可以应用于任何包含大量地理实体的知识图谱中,以融合这些实体间隐含的地理知识,实现对知识图谱下游任务中基于地理位置信息查询的有效支撑。

    基于闭环交叉耦合迭代学习的水晶研磨控制方法与系统

    公开(公告)号:CN112596389A

    公开(公告)日:2021-04-02

    申请号:CN202011504841.8

    申请日:2020-12-18

    Abstract: 本发明公开了一种基于闭环交叉耦合迭代学习的水晶研磨控制方法与系统,其中方法包括以下步骤:S10,建立水晶研磨伺服系统数学模型;S20,建立离散型闭环交叉耦合迭代学习控制器对位置进行控制;S30,离散型闭环迭代学习控制器产生新的控制信号;S40,控制器根据期望位置信息和实际信息得到新的跟踪误差;S50,经过轮廓误差分配模型补偿到各轴以消除每个轴对其它轴的影响。

    一种基于依存语义注意力机制的词对上下位关系训练方法

    公开(公告)号:CN112434513A

    公开(公告)日:2021-03-02

    申请号:CN202011331498.1

    申请日:2020-11-24

    Inventor: 徐小良 戴乾杰

    Abstract: 本发明提出一种基于依存语义注意力机制的词对上下位关系训练方法。该训练方法依次遍历词对语料库中的所有词对,对于每组词对,在文本语料库中找到所有的词对共现句,对这些共现句进行依存句法分析得到最短依存路径;利用BERT模型和依存语义注意力机制生成最短依存路径的路径向量,然后利用打分函数调整这些路径向量,将它们进行平均池化处理并融合词对的词向量得到分类器输入向量,最后将分类器输入向量通入Softmax函数进行训练。本发明能够有效挖掘句子中隐含的上下位关系,进而提高分类器的识别准确率。

    一种结合VP树和导向近邻图的近似最近邻搜索方法

    公开(公告)号:CN112287185A

    公开(公告)日:2021-01-29

    申请号:CN202011223218.5

    申请日:2020-11-05

    Abstract: 本发明提出的一种结合VP树和导向近邻图的近似最近邻搜索方法,该方法包括两个过程:索引构建过程和搜索过程。索引构建过程包含:(1)针对高维向量数据构建存放入口点的VP树;(2)使用可导航伸展图将高维向量数据构建成K近邻图;(3)将K近邻图中的每个点的邻居集均匀地划分来得到可导向近邻图。搜索过程包含:(1)查找入口点阶段,通过搜索VP树快速得到大致接近查询点的入口点;(2)导向搜索阶段,从入口点开始,得到查询点的局部最近点;(3)穷尽搜索阶段,利用范围搜索算法穷尽搜索查询点附近的点并返回查询点的top–K个最近点。本发明使用混合式搜索策略有效提升了近似最近邻搜索的性能。

    一种应用于大规模高维数据的两阶段近邻图搜索方法

    公开(公告)号:CN111737386A

    公开(公告)日:2020-10-02

    申请号:CN202010493762.5

    申请日:2020-06-03

    Inventor: 徐小良 王梦召

    Abstract: 本发明公开了一种应用于大规模高维数据的两阶段近邻图搜索方法。该方法针对大规模高维数据构建K近邻图;对K近邻图中每一个顶点的邻居集划分得到可导向近邻图;查询时,在可导向近邻图上执行两阶段搜索,第一阶段使用优化导向搜索快速定位到查询点附近,第二阶段在查询点附近使用贪婪算法精确搜索;最后将返回的点作为搜索结果。本发明改进了在近邻图上只执行单一搜索策略的常规方式,使用联合优化导向搜索和贪婪算法的混合式搜索策略。解决了近邻图算法中普遍存在的低搜索效率和易陷入局部最优问题,从而提升了近邻图算法的搜索性能。

    一种基于编码可导航伸展图的近邻文档搜索方法

    公开(公告)号:CN110851563A

    公开(公告)日:2020-02-28

    申请号:CN201910949234.3

    申请日:2019-10-08

    Inventor: 徐小良 王梦召

    Abstract: 本发明公开了一种基于编码可导航伸展图的近邻文档搜索方法。该方法首先对海量文档语义向量化得到海量文档向量;然后计算所有文档向量每一维的大小范围得到区间范围向量并归一化编码后进行压缩存储;接着基于压缩存储的海量文档向量建立编码可导航伸展图;最后对查询文档语义向量化后,在编码可导航伸展图上进行贪婪搜索后返回最接近的TopK篇文档。本发明将优秀的图基近似最近邻搜索方法——可导航伸展图应用在海量文档搜索上,加快了文档搜索速度,使用归一化编码的方法对海量文档向量进行压缩存储,在保证相当搜索速度的同时又大幅度降低了内存消耗。

    基于RSS线性相关与二次加权质心算法的WLAN指纹定位方法

    公开(公告)号:CN106102163A

    公开(公告)日:2016-11-09

    申请号:CN201610393181.8

    申请日:2016-06-03

    Inventor: 徐小良 高健

    CPC classification number: H04W64/006 G01S5/0284 G01S11/06

    Abstract: 本发明公开了一种基于RSS线性相关与二次加权质心算法的WLAN指纹定位方法。本发明首先需要建立离线指纹数据库,在目标定位环境中布置Q个参考点,在参考点采集多组RSS样本并进行滤波处理,生成描述所述参考点的指纹数据库。之后可在所述环境实施定位,计算用户终端接收的实时RSS数据与所述指纹数据库样本数据的线性相关系数,选取最大的k个相关系数所对应参考点,采用二次加权质心算法估算出用户的最终位置。本发明可以降低终端硬件差异对室内定位精度的影响,有效提高室内定位系统的稳定性与精确性。

    一种科技项目相似度计算方法

    公开(公告)号:CN103631858A

    公开(公告)日:2014-03-12

    申请号:CN201310508199.4

    申请日:2013-10-24

    CPC classification number: G06F17/30654

    Abstract: 本发明公开了一种科技项目相似度计算方法。本发明具体包括如下步骤:步骤1:提出一种规则模型并根据它识别出项目中的未登录词;步骤2:根据词的统计信息及语义信息获得关键词,与步骤1得到的未登录词组成特征词;步骤3:对两个项目名称中的特征词进行语义与字面相似度计算,如果求和并归一化后的值低于γ,则项目不相似,结束检测;步骤4:对相关词权重进行加权计算;步骤5:对主要内容中的特征词进行语义与字面相似度计算,得到两个项目主要内容的相似度;步骤6:对步骤3和步骤5的相似值加权求和得到两个项目的相似度。本发明考虑了项目申请书的语义信息,结构信息以及统计信息,该方法提高了科技项目相似度计算的准确率及效率。

    一种基于关键词的评审专家智能检索与推荐方法

    公开(公告)号:CN103605665A

    公开(公告)日:2014-02-26

    申请号:CN201310511342.5

    申请日:2013-10-24

    CPC classification number: G06F17/30911

    Abstract: 本发明公开了一种基于关键词的评审专家智能检索与推荐方法。本发明具体包括如下步骤:步骤1:将专家信息主要文本切分成子串序列并进行中科院ICTCLAS分词,对分词结果进行停用词过滤得到词语集合;步骤2:分字段提取每个专家信息的特征词;步骤3:基于特征词所在字段和权值构建专家知识表示模型,并建立专家信息索引库;步骤4:当用户输入关键词时会根据检索词库进行自动提示,同时利用检索词统计器实时更新检索词词库;步骤5:基于语义等信息计算关键词和专家信息间的检索相关度;步骤6:根据匹配度从高到低列出相关的专家。本发明通过输入关键词实现专家信息的智能全文检索以及推荐,更准确地检索出与待审科技项目相匹配的专家。

    一种基于低码本量化的向量检索方法及系统

    公开(公告)号:CN120067105A

    公开(公告)日:2025-05-30

    申请号:CN202510102075.9

    申请日:2025-01-22

    Abstract: 本发明公开了一种基于低码本量化的向量检索方法及系统,该向量检索方法根据特征向量划分的子空间中数据的分布类型,确认累积分布函数和分位点函数,并通过累积分布函数和分位点函数分别获取特征向量的编码值和码字;根据特征向量的码值和查询向量的距离判断两者之间的相似度,完成向量的检索;相比于传统向量检索中通过迭代来寻找最优的聚类中心,本发明避免了迭代计算,解决了计算量大、处理时间长的问题,减少了整体计算开销,提高了码本生成的效率;同时,本发明在特征向量的集合更新过程中,仅需通过增量计算均值和标准差来更新数据分布,解决了传统检索方法中重新训练模型开销高且无法适应数据动态变化的问题,使得整个过程更为高效。

Patent Agency Ranking