-
公开(公告)号:CN102542003A
公开(公告)日:2012-07-04
申请号:CN201110409156.1
申请日:2011-11-30
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明公开了用于顾及当用户在搜索引擎中提出查询时的用户意图的点击模型。一种生成用于搜索引擎的训练数据的方法通过检索涉及用户点击行为的日志数据来开始。基于包括参数的点击模型来分析日志数据以确定多个页面中每一个页面与查询的相关性,该参数涉及表示用户在执行搜索时的意图的用户意图偏差。然后将这些页面的相关性转换成训练数据。
-
公开(公告)号:CN100517311C
公开(公告)日:2009-07-22
申请号:CN200510071689.8
申请日:2005-04-13
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/3064 , Y10S707/99933 , Y10S707/99934 , Y10S707/99935 , Y10S707/99936 , Y10S707/99937
Abstract: 描述了一种用于相关术语提议的系统和方法。在一个方面,生成术语群集作为术语向量的所计算的相似性函数。每个根据搜索结果所生成的术语向量都与先前提交给搜索引擎的高出现次数出现(FOO)历史查询的集合相关。响应于从实体接收术语/短语,根据术语群集中的术语/短语来估计术语/短语以标识一个或多个相关的术语提议。
-
公开(公告)号:CN1758244A
公开(公告)日:2006-04-12
申请号:CN200510089647.7
申请日:2005-04-30
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30867 , Y10S707/99933
Abstract: 一种基于主题的信息丰富度和多样性来排列搜索结果的文档的方法和系统。该排列系统决定在搜索结果中的每一个文档的信息丰富度。该排列系统基于它们的关联性而将搜索结果的文档分组,意味着它们被指向相似的主题。该排列系统将文档排序以保证最高排列文档可以包含覆盖每一个主题的至少一篇文档,那就是说,来自每一个组的一篇文档。该排列系统从在该组中具有最高信息丰富度的文档的每一组中选择文档。当这些文档以某个排列顺序提供给用户时,用户将在搜索结果的第一页中发现覆盖各种类型的主题的文档,而不仅仅是单一的受欢迎的主题。
-
公开(公告)号:CN1691019A
公开(公告)日:2005-11-02
申请号:CN200510078308.9
申请日:2005-04-13
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30687 , G06F17/30663 , Y10S707/99933 , Y10S707/99934 , Y10S707/99935
Abstract: 本发明描述了用于检验项和Web站点内容之间的相关性的系统和方法。在一个方面中,检索来自投标URL的站点内容。计算在语义上和/或上下文上与投标项相关的扩展项。根据投标项、站点内容和扩展项的各个组合计算内容相似性和扩展相似性度量。考虑到经训练的相似性分类器来确定扩展项和站点内容之间的类别相似性度量。该经训练的相似性分类器已根据挖掘的与目录数据相关联的万维站点内容加以训练了。提供了投标项和站点内容之间的相关性的客观度量的信用度值,是考虑到经训练的相关性分类器模型,根据评估多个相似性得分的内容、扩展和类别相似性度量而确定的。
-
公开(公告)号:CN1684072A
公开(公告)日:2005-10-19
申请号:CN200510071689.8
申请日:2005-04-13
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/3064 , Y10S707/99933 , Y10S707/99934 , Y10S707/99935 , Y10S707/99936 , Y10S707/99937
Abstract: 描述了一种用于相关术语提议的系统和方法。在一个方面,生成术语群集作为术语向量的所计算的相似性函数。每个根据搜索结果所生成的术语向量都与先前提交给搜索引擎的高出现次数出现(FOO)历史查询的集合相关。响应于从实体接收术语/短语,根据术语群集中的术语/短语来估计术语/短语以标识一个或多个相关的术语提议。
-
公开(公告)号:CN1637741A
公开(公告)日:2005-07-13
申请号:CN200410082285.4
申请日:2004-09-10
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30997 , G06F17/241 , G06F17/242 , G06F17/30722
Abstract: 这里描述的是笔式计算系统中管理标记的系统和方法。这里描述的本系统和方法提供收集、管理、搜索及共享通过手写标记方式输入的个人信息的方式。标记用于驱动应用程序、作为向导、查找相关信息并进一步管理信息。当用户输入信息时,得到上下文信息,该上下文信息用于帮助确定和定位用户可能感兴趣的相关内容,这些内容不论在本地计算机或因特网或其它网络上的同一或不同文档中。
-
公开(公告)号:CN102929898A
公开(公告)日:2013-02-13
申请号:CN201110238260.9
申请日:2011-08-12
Applicant: 微软公司
IPC: G06F17/30
Abstract: 本发明揭示了一种结构化数据库的语义查询引擎。该语义查询引擎从一个或多个不同的数据来源获得未加工的数据,利用数据加工装置依据应用程序的要求对未加工的数据进行加工。加工后的数据被保存在数据存放库中,在数据存放库中,经加工的数据被以一种或多种模型保存以形成数据实体。基于本体(ontology)创建的共享全局数据模型提供本体实体。本体实体与数据实体之间进行映射。数据存放库中的经加工的数据的模型、共享全局数据模型、以及数据存放库中的数据实体与共享全局数据模型中的本体实体之间的映射关系都由元数据进行描述。
-
公开(公告)号:CN1758245B
公开(公告)日:2010-09-08
申请号:CN200510089648.1
申请日:2005-04-30
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30719 , G06F17/30864
Abstract: 利用摘要来分类显示页的方法和系统。一种根据自动生成的显示页的摘要,来分类显示页的方法和系统。网页分类系统利用网页摘要系统来生成网页的摘要。网页的摘要可以包括与网页首要主题最接近相关的网页的句子。摘要系统可以组合多种摘要技术的好处来识别代表网页首要主题的网页的句子。一旦生成了摘要,分类系统可以对摘要应用传统的分类技术来分类网页。分类系统可以利用传统的分类技术,例如Bayesian分类器或支持向量机器,根据由摘要系统生成的摘要,来识别网页的分类。
-
公开(公告)号:CN100465954C
公开(公告)日:2009-03-04
申请号:CN200510078810.X
申请日:2005-04-13
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30864 , Y10S707/99945
Abstract: 用于相关的术语建议的系统和方法被描述。一方面,在两个或多个多种类型数据对象的单个个体中的关系被鉴别。多种类型数据对象的单个个体包括至少一个第一种类型的一个对象和一个与该第一种类型不同的一个第二种类型的一个对象。该多种类型数据对象由于这些关系的单个个体而反复地被群集化以生成加强群集体。
-
公开(公告)号:CN1694101A
公开(公告)日:2005-11-09
申请号:CN200510078810.X
申请日:2005-04-13
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30864 , Y10S707/99945
Abstract: 用于相关的术语建议的系统和方法被描述。一方面,在两个或多个多种类型数据对象的单个个体中的关系被鉴别。多种类型数据对象的单个个体包括至少一个第一种类型的一个对象和一个与该第一种类型不同的一个第二种类型的一个对象。该多种类型数据对象由于这些关系的单个个体而反复地被群集化以生成加强群集体。
-
-
-
-
-
-
-
-
-