优先散列索引
    3.
    发明授权

    公开(公告)号:CN102542052B

    公开(公告)日:2016-01-06

    申请号:CN201110449840.2

    申请日:2011-12-29

    CPC classification number: G06F17/30628

    Abstract: 优先散列索引为搜索查询项提供倒排列表的有效查找。优先散列索引是其中用于项的散列值基于这些项的重要性和存储设备的访问速度而被分布在多个存储设备上的数据结构。项被组合到搜索列表中,其中每一个搜索列表包括每一个存储设备上的存储位置。当接收到搜索查询时,项被识别并被散列到第一存储设备上的位置,并且为该项生成独特的散列值。存储设备上用于该项的搜索列表的位置被顺序读取,直至定位用于该项的散列值来访问用于该项的倒排列表。

    用于大文档索引的匹配漏斗

    公开(公告)号:CN102567461B

    公开(公告)日:2015-07-08

    申请号:CN201110373395.6

    申请日:2011-11-22

    CPC classification number: G06F17/30864

    Abstract: 提供了一种用于大文档索引的匹配漏斗。通过以多个阶段评估和修剪候选文档来响应于搜索查询识别并返回搜索结果。该过程采用对文档中发现的义原和文档/义原对的预先计算的评分编索引的搜索索引。当接收到搜索查询时,从搜索查询识别义原且基于所识别的义原生成重新阐述的查询。重新阐述的查询用于识别匹配文档,且使用简化评分函数和搜索索引中预先计算的评分来生成匹配文档的初步评分。基于初步评分来修剪文档,且使用最终排序算法来评估其余文档,最终排序算法提供排序文档的最终集合,其用于响应于搜索查询生成搜索结果以返回。

Patent Agency Ranking