-
公开(公告)号:CN109948044A
公开(公告)日:2019-06-28
申请号:CN201711343103.8
申请日:2017-12-14
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9535 , G06F16/958
Abstract: 本文公开的基于向量最近邻搜索的文档查询的技术方案,将向量近似匹配检索技术应用到搜索引擎中,通过将查询内容和网页文档分别进行语义向量化后,利用向量近似匹配检索的方式,获取与查询内容接近的网页文档,从而能够突破符号匹配的检索方式的限制,提供能够更好地把握用户意图的检索服务。
-
公开(公告)号:CN102542052B
公开(公告)日:2016-01-06
申请号:CN201110449840.2
申请日:2011-12-29
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
CPC classification number: G06F17/30628
Abstract: 优先散列索引为搜索查询项提供倒排列表的有效查找。优先散列索引是其中用于项的散列值基于这些项的重要性和存储设备的访问速度而被分布在多个存储设备上的数据结构。项被组合到搜索列表中,其中每一个搜索列表包括每一个存储设备上的存储位置。当接收到搜索查询时,项被识别并被散列到第一存储设备上的位置,并且为该项生成独特的散列值。存储设备上用于该项的搜索列表的位置被顺序读取,直至定位用于该项的散列值来访问用于该项的倒排列表。
-
公开(公告)号:CN108463818A
公开(公告)日:2018-08-28
申请号:CN201680078539.6
申请日:2016-10-31
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
CPC classification number: G06F17/30958 , G06F17/30
Abstract: 本公开提供了一种用于建立特定于领域的连接分段图谱的方法。所述方法可以包括:从与所述领域相关联的源收集实体数据,以形成针对所述领域的实体数据集;对所述实体数据集进行处理;以及利用经处理的实体数据集来建立所述连接分段图谱,其中,所述建立包括利用包含关于多个领域的知识的知识图谱来丰富所述连接分段图谱。
-
-