-
公开(公告)号:CN102682073B
公开(公告)日:2017-04-12
申请号:CN201210060934.5
申请日:2012-03-09
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
Abstract: 提供了一种使用在文件中识别的原子来填充搜索索引的方法。识别将被标引的文件,对于每个文件,识别原子并将其分类为一元模型、n元模型和n元组。生成原子/文件对的列表,这样对于每个对能够计算信息度量。信息度量表示与特定文件相关的原子的分级。基于该信息度量,一些原子/文件对被丢弃,其它的被标引。