-
公开(公告)号:CN102682073B
公开(公告)日:2017-04-12
申请号:CN201210060934.5
申请日:2012-03-09
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
Abstract: 提供了一种使用在文件中识别的原子来填充搜索索引的方法。识别将被标引的文件,对于每个文件,识别原子并将其分类为一元模型、n元模型和n元组。生成原子/文件对的列表,这样对于每个对能够计算信息度量。信息度量表示与特定文件相关的原子的分级。基于该信息度量,一些原子/文件对被丢弃,其它的被标引。
-
公开(公告)号:CN102693274B
公开(公告)日:2017-08-15
申请号:CN201210079487.8
申请日:2012-03-23
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
Abstract: 为每个片段选择初步片段根和最终片段根。每次当接收到搜索查询时,识别将被用来分解搜索查询的每个片段中的一组节点。从该组节点中选择初步片段根。基于来自该组节点中的每个节点的指示每个节点充当汇编查询执行数据的最终片段根的能力的统计数据,初步片段根通过算法选择最终片段根。将关于最终片段根的身份通知该组节点中的其它节点。
-
公开(公告)号:CN102542052B
公开(公告)日:2016-01-06
申请号:CN201110449840.2
申请日:2011-12-29
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
CPC classification number: G06F17/30628
Abstract: 优先散列索引为搜索查询项提供倒排列表的有效查找。优先散列索引是其中用于项的散列值基于这些项的重要性和存储设备的访问速度而被分布在多个存储设备上的数据结构。项被组合到搜索列表中,其中每一个搜索列表包括每一个存储设备上的存储位置。当接收到搜索查询时,项被识别并被散列到第一存储设备上的位置,并且为该项生成独特的散列值。存储设备上用于该项的搜索列表的位置被顺序读取,直至定位用于该项的散列值来访问用于该项的倒排列表。
-
-