一种基于Geo-BTree的范围查询方法及装置

    公开(公告)号:CN107766433A

    公开(公告)日:2018-03-06

    申请号:CN201710843972.0

    申请日:2017-09-19

    CPC classification number: G06F17/30327

    Abstract: 本发明涉及一种基于Geo-BTree的范围查询方法及装置,本发明方法包括:数据预处理步骤,将数据集中所有位置点编码成长度为n的字符串string,根据字符串按字典序对数据集中的位置点排序并编号ID;空间索引建立步骤,根据排序后的字符串构建B-Tree索引结构;范围查询步骤,以检索B-Tree索引结构返回的ID为起始点双向搜索获取查询域内的ID,经过滤得到ID候选集,并对候选集中ID所对应的位置点验证返回查询范围内的位置点。本发明采用基于geohash编码构建B-Tree索引结构,具有较高的查询效率,可直接用于数据管理系统中;采用geohash空间索引方法,有效支持任意范围查询。

    一种基于关键词倒排与Trie的空间关键词查询方法及装置

    公开(公告)号:CN108776666A

    公开(公告)日:2018-11-09

    申请号:CN201810420941.9

    申请日:2018-05-04

    Abstract: 本发明涉及一种基于关键词倒排与Trie的空间关键词查询方法及装置,本发明方法包括:数据预处理步骤,将数据集D中所有位置点编码成长度为n的字符串,以该字符串为排序对象按字典序对数据集D中每行数据排序并生成编号id,每一行数据称为一条记录r,则由一至多行记录r组成的数据集称为记录集R;空间关键词索引建立步骤,对记录集R中关键词集建立倒排索引,之后,对任一关键词所属id对应的字符串构建Trie,得到关键词倒排与Trie组合的索引结构;空间关键词查询步骤,检索关键词倒排与Trie组合的索引结构,获取满足查询条件的id,经过滤得到id候选集,并对候选集验证返回满足空间查询条件的位置点。本发明可高效支持任意空间范围的关键词查询。

    一种基于特征加权模糊支持向量机的音乐流派分类方法及系统

    公开(公告)号:CN109492664B

    公开(公告)日:2021-10-22

    申请号:CN201811140315.0

    申请日:2018-09-28

    Abstract: 本发明涉及一种基于特征加权模糊支持向量机的音乐流派分类方法及系统,属于音乐内容检索及模式识别技术领域。本发明的分类器选择模糊支持向量机,能够根据不同输入样本对分类贡献的不同,赋以相应隶属度,目的在于能够很好的减少噪声的影响;用reliefF特征选择算法计算出的各特征权重,用于对模糊支持向量机的隶属度的确定方法,考虑到了不同权重的特征对分类影响大小的不同;针对盲区不可分点,用该点到各个类中心的加权欧氏距离进行多类别概率划分,符合当下音乐多元化的实质。

    一种基于特征加权模糊支持向量机的音乐流派分类方法及系统

    公开(公告)号:CN109492664A

    公开(公告)日:2019-03-19

    申请号:CN201811140315.0

    申请日:2018-09-28

    Abstract: 本发明涉及一种基于特征加权模糊支持向量机的音乐流派分类方法及系统,属于音乐内容检索及模式识别技术领域。本发明的分类器选择模糊支持向量机,能够根据不同输入样本对分类贡献的不同,赋以相应隶属度,目的在于能够很好的减少噪声的影响;用reliefF特征选择算法计算出的各特征权重,用于对模糊支持向量机的隶属度的确定方法,考虑到了不同权重的特征对分类影响大小的不同;针对盲区不可分点,用该点到各个类中心的加权欧氏距离进行多类别概率划分,符合当下音乐多元化的实质。

    一种基于文本-域倒排的空间文本查询方法及装置

    公开(公告)号:CN108628950B

    公开(公告)日:2022-07-19

    申请号:CN201810292840.8

    申请日:2018-04-04

    Abstract: 本发明涉及一种基于文本‑域倒排的空间文本查询方法及装置,本发明方法包括:数据预处理步骤,将数据集D中所有位置点编码成长度为n的字符串,以该字符串为排序对象按字典序对数据集中的记录排序并生成编号id,每一行数据称为一条记录r,则由一至多行记录r组成的数据集称为记录集R;空间文本索引建立步骤,对记录集R中的文本建立倒排索引,倒排索引的列表元素为与字符串相对应的id列表,得到文本‑域倒排索引结构;布尔范围查询步骤,检索文本‑域倒排索引结构,获取满足查询条件的id,经过滤得到id候选集,并对候选集验证返回查询范围内的所有位置点。本发明采用文本‑域倒排索引结构可高效支持任意空间范围的文本查询。

    一种基于geohash与Patricia Trie的空间关键词查询方法及装置

    公开(公告)号:CN108846013B

    公开(公告)日:2021-11-23

    申请号:CN201810419803.9

    申请日:2018-05-04

    Abstract: 本发明涉及一种基于geohash与Patricia Trie的空间关键词查询方法,方法包括:通过geohash空间编码方法将数据集D中所有位置点编码成长度为n的字符串geoStr,以geoStr为排序对象按字典序对数据集D中的每行数据排序并生成编号id;对geoStr构建Patricia Trie,Patricia Trie的叶节点指向根据该域内关键词构建的倒排索引,倒排索引的列表元素为关键词及与其相对应的id列表,得到空间关键词索引结构;检索空间关键词索引结构,获取满足查询条件的id,经过滤得到id候选集,并对候选集验证返回满足空间查询条件的位置点。本发明可高效支持任意空间范围的关键词查询。

    一种基于长度分区的集合相似度查询算法

    公开(公告)号:CN110334191A

    公开(公告)日:2019-10-15

    申请号:CN201910634366.7

    申请日:2019-07-15

    Abstract: 本发明涉及一种基于长度分区的集合相似度查询方法,属于数据挖掘和信息检索领域。本发明首先对数据集中的集合即记录进行排序并编号;然后对排序后的数据集构建倒排索引结构并构建长度映射表;再对给定的查询q和相似度阈值t,根据创建的倒排索引结构和长度映射表检索所有与q相似度大于等于t的记录。本发明将长度分区的思想与经典的相似度查询算法ScanCount相结合,通过数据预处理、长度分区及高效的索引结构可快速过滤不可能满足相似度的记录,从而提升算法效率。此外,设计更为精简的计数数组,从而降低了空间开销。因此本发明具有更高的时间和空间效率。

    一种基于关键词倒排与Trie的空间关键词查询方法及装置

    公开(公告)号:CN108776666B

    公开(公告)日:2022-05-20

    申请号:CN201810420941.9

    申请日:2018-05-04

    Abstract: 本发明涉及一种基于关键词倒排与Trie的空间关键词查询方法及装置,本发明方法包括:数据预处理步骤,将数据集D中所有位置点编码成长度为n的字符串,以该字符串为排序对象按字典序对数据集D中每行数据排序并生成编号id,每一行数据称为一条记录r,则由一至多行记录r组成的数据集称为记录集R;空间关键词索引建立步骤,对记录集R中关键词集建立倒排索引,之后,对任一关键词所属id对应的字符串构建Trie,得到关键词倒排与Trie组合的索引结构;空间关键词查询步骤,检索关键词倒排与Trie组合的索引结构,获取满足查询条件的id,经过滤得到id候选集,并对候选集验证返回满足空间查询条件的位置点。本发明可高效支持任意空间范围的关键词查询。

    一种基于Geo-BTree的范围查询方法及装置

    公开(公告)号:CN107766433B

    公开(公告)日:2021-05-14

    申请号:CN201710843972.0

    申请日:2017-09-19

    Abstract: 本发明涉及一种基于Geo‑BTree的范围查询方法及装置,本发明方法包括:数据预处理步骤,将数据集中所有位置点编码成长度为n的字符串string,根据字符串按字典序对数据集中的位置点排序并编号ID;空间索引建立步骤,根据排序后的字符串构建B‑Tree索引结构;范围查询步骤,以检索B‑Tree索引结构返回的ID为起始点双向搜索获取查询域内的ID,经过滤得到ID候选集,并对候选集中ID所对应的位置点验证返回查询范围内的位置点。本发明采用基于geohash编码构建B‑Tree索引结构,具有较高的查询效率,可直接用于数据管理系统中;采用geohash空间索引方法,有效支持任意范围查询。

    一种基于geohash与Patricia Trie的空间关键词查询方法及装置

    公开(公告)号:CN108846013A

    公开(公告)日:2018-11-20

    申请号:CN201810419803.9

    申请日:2018-05-04

    Abstract: 本发明涉及一种基于geohash与Patricia Trie的空间关键词查询方法及装置,本发明方法包括:数据预处理步骤,通过geohash空间编码方法将数据集D中所有位置点编码成长度为n的字符串geoStr,以geoStr为排序对象按字典序对数据集D中的每行数据排序并生成编号id;空间关键词索引建立步骤,对geoStr构建Patricia Trie,Patricia Trie的叶节点指向根据该域内关键词构建的倒排索引,倒排索引的列表元素为关键词及与其相对应的id列表,得到空间关键词索引结构;其中,该域指从根节点到叶节点所构成的字符串;空间关键词查询步骤,检索空间关键词索引结构,获取满足查询条件的id,经过滤得到id候选集,并对候选集验证返回满足空间查询条件的位置点。本发明可高效支持任意空间范围的关键词查询。

Patent Agency Ranking