-
公开(公告)号:CN102682073B
公开(公告)日:2017-04-12
申请号:CN201210060934.5
申请日:2012-03-09
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
Abstract: 提供了一种使用在文件中识别的原子来填充搜索索引的方法。识别将被标引的文件,对于每个文件,识别原子并将其分类为一元模型、n元模型和n元组。生成原子/文件对的列表,这样对于每个对能够计算信息度量。信息度量表示与特定文件相关的原子的分级。基于该信息度量,一些原子/文件对被丢弃,其它的被标引。
-
公开(公告)号:CN102693274B
公开(公告)日:2017-08-15
申请号:CN201210079487.8
申请日:2012-03-23
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
Abstract: 为每个片段选择初步片段根和最终片段根。每次当接收到搜索查询时,识别将被用来分解搜索查询的每个片段中的一组节点。从该组节点中选择初步片段根。基于来自该组节点中的每个节点的指示每个节点充当汇编查询执行数据的最终片段根的能力的统计数据,初步片段根通过算法选择最终片段根。将关于最终片段根的身份通知该组节点中的其它节点。
-
公开(公告)号:CN102542052B
公开(公告)日:2016-01-06
申请号:CN201110449840.2
申请日:2011-12-29
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
CPC classification number: G06F17/30628
Abstract: 优先散列索引为搜索查询项提供倒排列表的有效查找。优先散列索引是其中用于项的散列值基于这些项的重要性和存储设备的访问速度而被分布在多个存储设备上的数据结构。项被组合到搜索列表中,其中每一个搜索列表包括每一个存储设备上的存储位置。当接收到搜索查询时,项被识别并被散列到第一存储设备上的位置,并且为该项生成独特的散列值。存储设备上用于该项的搜索列表的位置被顺序读取,直至定位用于该项的散列值来访问用于该项的倒排列表。
-
公开(公告)号:CN102567461B
公开(公告)日:2015-07-08
申请号:CN201110373395.6
申请日:2011-11-22
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 提供了一种用于大文档索引的匹配漏斗。通过以多个阶段评估和修剪候选文档来响应于搜索查询识别并返回搜索结果。该过程采用对文档中发现的义原和文档/义原对的预先计算的评分编索引的搜索索引。当接收到搜索查询时,从搜索查询识别义原且基于所识别的义原生成重新阐述的查询。重新阐述的查询用于识别匹配文档,且使用简化评分函数和搜索索引中预先计算的评分来生成匹配文档的初步评分。基于初步评分来修剪文档,且使用最终排序算法来评估其余文档,最终排序算法提供排序文档的最终集合,其用于响应于搜索查询生成搜索结果以返回。
-
-
-