-
公开(公告)号:CN107851108A
公开(公告)日:2018-03-27
申请号:CN201680037467.0
申请日:2016-06-22
Applicant: 微软技术许可有限责任公司
Inventor: M·J·霍普克罗夫特 , R·L·古德温
IPC: G06F17/30
CPC classification number: G06F17/30324 , G06F17/30011 , G06F17/30336 , G06F17/30442 , G06F17/30463 , G06F17/30619 , G06F17/30675
Abstract: 本文所描述的技术提供了使用位向量搜索索引来标识用于搜索查询的匹配文档。当接收搜索查询时,从搜索索引标识项目,并且标识对应于该项目的多个位向量。每个位向量包括位阵列,其中每个位向量中的至少一个位指示对应的文档包括该项目。每个位向量还包括指示其他文档包括其它项目的其他位。对被标识的位向量相交以标识包含该项目的匹配文档。
-
公开(公告)号:CN107710201B
公开(公告)日:2021-05-25
申请号:CN201680037378.6
申请日:2016-06-22
Applicant: 微软技术许可有限责任公司
Inventor: M·J·霍普克罗夫特 , R·L·古德温 , D·V·德伊内科
IPC: G06F16/22 , G06F16/93 , G06F16/2453 , G06F16/31 , G06F16/901
Abstract: 本文所描述的技术提供了在位向量搜索索引中存储和取回数据。位向量搜索索引使用位向量来存储关于来自文档的项目的数据。每个位向量包括位的阵列,并且对应于不同的项目集合。位向量中的每个位向量被用来表示文档是否包括来自项目集合的至少一个项目。条带表被用来为具有相似项目特性的项目条带存储位向量配置。每个项目根据针对其所属于的条带的位向量配置而在位向量搜索索引中被索引。在标识针对项目的位向量存储位置时,对于某些项目使用明确映射,并且对于其他项目使用自组织方式。明确映射提供针对项目的特定位置,而自组织方式使用被指派给条带的映射算法。
-
公开(公告)号:CN107820612A
公开(公告)日:2018-03-20
申请号:CN201680037386.0
申请日:2016-06-22
Applicant: 微软技术许可有限责任公司
Inventor: M·J·霍普克罗夫特 , R·L·古德温 , J·G·本内特
IPC: G06F17/30
CPC classification number: G06F17/30324 , G06F17/30336 , G06F17/30619
Abstract: 本文中所描述的技术为搜索系统提供了一种位向量搜索索引。该位向量搜索索引包括数据结构,其用于索引来自文档语料库的关于项目的数据。数据结构包括若干个位向量。每个位向量包括位阵列,并且与不同的项目集合相对应。位向量中的位用于表示与该位相对应的至少一个文档是否包括与该位向量相对应的来自项目集合中的至少一个项目。
-
公开(公告)号:CN107851108B
公开(公告)日:2021-06-04
申请号:CN201680037467.0
申请日:2016-06-22
Applicant: 微软技术许可有限责任公司
Inventor: M·J·霍普克罗夫特 , R·L·古德温
IPC: G06F16/22 , G06F16/2453 , G06F16/31 , G06F16/33 , G06F16/93
Abstract: 本文所描述的技术提供了使用位向量搜索索引来标识用于搜索查询的匹配文档。当接收搜索查询时,从搜索索引标识项目,并且标识对应于该项目的多个位向量。每个位向量包括位阵列,其中每个位向量中的至少一个位指示对应的文档包括该项目。每个位向量还包括指示其他文档包括其它项目的其他位。对被标识的位向量相交以标识包含该项目的匹配文档。
-
公开(公告)号:CN107710201A
公开(公告)日:2018-02-16
申请号:CN201680037378.6
申请日:2016-06-22
Applicant: 微软技术许可有限责任公司
Inventor: M·J·霍普克罗夫特 , R·L·古德温 , D·V·德伊内科
IPC: G06F17/30
CPC classification number: G06F17/30324 , G06F17/30011 , G06F17/30336 , G06F17/30442 , G06F17/30619 , G06F17/30955
Abstract: 本文所描述的技术提供了在位向量搜索索引中存储和取回数据。位向量搜索索引使用位向量来存储关于来自文档的项目的数据。每个位向量包括位的阵列,并且对应于不同的项目集合。位向量中的每个位向量被用来表示文档是否包括来自项目集合的至少一个项目。条带表被用来为具有相似项目特性的项目条带存储位向量配置。每个项目根据针对其所属于的条带的位向量配置而在位向量搜索索引中被索引。在标识针对项目的位向量存储位置时,对于某些项目使用明确映射,并且对于其他项目使用自组织方式。明确映射提供针对项目的特定位置,而自组织方式使用被指派给条带的映射算法。
-
公开(公告)号:CN108475266B
公开(公告)日:2022-05-13
申请号:CN201680037464.7
申请日:2016-06-22
Applicant: 微软技术许可有限责任公司
Inventor: M·J·霍普克罗夫特 , R·L·古德温 , 王帆 , U·简
IPC: G06F16/215 , G06F16/93 , G06F16/22 , G06F16/31 , G06F16/33 , G06F16/2453 , G06F16/335
Abstract: 本文所描述的技术提供了匹配修复阶段,其移除针对搜索查询被标识为实际上不包含来自搜索查询的项目的匹配文档。每个文档的表示(例如,存储针对每个文档的项目列表的正向索引)被用来标识有效匹配文档(即,包含来自搜索查询的项目的文档)和无效匹配文档(即,不包含来自搜索查询的项目的文档)。从针对搜索查询的进一步处理和排名移除任何无效匹配文档。
-
公开(公告)号:CN108475266A
公开(公告)日:2018-08-31
申请号:CN201680037464.7
申请日:2016-06-22
Applicant: 微软技术许可有限责任公司
Inventor: M·J·霍普克罗夫特 , R·L·古德温 , 王帆 , U·简
IPC: G06F17/30
CPC classification number: G06F17/30303 , G06F17/30011 , G06F17/30324 , G06F17/30463 , G06F17/30619 , G06F17/30675 , G06F17/30699
Abstract: 本文所描述的技术提供了匹配修复阶段,其移除针对搜索查询被标识为实际上不包含来自搜索查询的项目的匹配文档。每个文档的表示(例如,存储针对每个文档的项目列表的正向索引)被用来标识有效匹配文档(即,包含来自搜索查询的项目的文档)和无效匹配文档(即,不包含来自搜索查询的项目的文档)。从针对搜索查询的进一步处理和排名移除任何无效匹配文档。
-
-
-
-
-
-