用于顾及当用户在搜索引擎中提出查询时的用户意图的点击模型

    公开(公告)号:CN102542003A

    公开(公告)日:2012-07-04

    申请号:CN201110409156.1

    申请日:2011-11-30

    Applicant: 微软公司

    Inventor: 王刚 陈伟柱 陈正

    CPC classification number: G06F17/30864

    Abstract: 本发明公开了用于顾及当用户在搜索引擎中提出查询时的用户意图的点击模型。一种生成用于搜索引擎的训练数据的方法通过检索涉及用户点击行为的日志数据来开始。基于包括参数的点击模型来分析日志数据以确定多个页面中每一个页面与查询的相关性,该参数涉及表示用户在执行搜索时的意图的用户意图偏差。然后将这些页面的相关性转换成训练数据。

    用于排列搜索结果的文档以改进多样性和信息丰富度的方法和系统

    公开(公告)号:CN1758244A

    公开(公告)日:2006-04-12

    申请号:CN200510089647.7

    申请日:2005-04-30

    Applicant: 微软公司

    CPC classification number: G06F17/30867 Y10S707/99933

    Abstract: 一种基于主题的信息丰富度和多样性来排列搜索结果的文档的方法和系统。该排列系统决定在搜索结果中的每一个文档的信息丰富度。该排列系统基于它们的关联性而将搜索结果的文档分组,意味着它们被指向相似的主题。该排列系统将文档排序以保证最高排列文档可以包含覆盖每一个主题的至少一篇文档,那就是说,来自每一个组的一篇文档。该排列系统从在该组中具有最高信息丰富度的文档的每一组中选择文档。当这些文档以某个排列顺序提供给用户时,用户将在搜索结果的第一页中发现覆盖各种类型的主题的文档,而不仅仅是单一的受欢迎的主题。

    检验关键字和Web站点内容之间的相关性

    公开(公告)号:CN1691019A

    公开(公告)日:2005-11-02

    申请号:CN200510078308.9

    申请日:2005-04-13

    Applicant: 微软公司

    Abstract: 本发明描述了用于检验项和Web站点内容之间的相关性的系统和方法。在一个方面中,检索来自投标URL的站点内容。计算在语义上和/或上下文上与投标项相关的扩展项。根据投标项、站点内容和扩展项的各个组合计算内容相似性和扩展相似性度量。考虑到经训练的相似性分类器来确定扩展项和站点内容之间的类别相似性度量。该经训练的相似性分类器已根据挖掘的与目录数据相关联的万维站点内容加以训练了。提供了投标项和站点内容之间的相关性的客观度量的信用度值,是考虑到经训练的相关性分类器模型,根据评估多个相似性得分的内容、扩展和类别相似性度量而确定的。

    笔式计算系统中的标记管理

    公开(公告)号:CN1637741A

    公开(公告)日:2005-07-13

    申请号:CN200410082285.4

    申请日:2004-09-10

    Applicant: 微软公司

    CPC classification number: G06F17/30997 G06F17/241 G06F17/242 G06F17/30722

    Abstract: 这里描述的是笔式计算系统中管理标记的系统和方法。这里描述的本系统和方法提供收集、管理、搜索及共享通过手写标记方式输入的个人信息的方式。标记用于驱动应用程序、作为向导、查找相关信息并进一步管理信息。当用户输入信息时,得到上下文信息,该上下文信息用于帮助确定和定位用户可能感兴趣的相关内容,这些内容不论在本地计算机或因特网或其它网络上的同一或不同文档中。

    结构化数据库的语义查询引擎

    公开(公告)号:CN102929898A

    公开(公告)日:2013-02-13

    申请号:CN201110238260.9

    申请日:2011-08-12

    Applicant: 微软公司

    Inventor: 徐鹏 陈正

    Abstract: 本发明揭示了一种结构化数据库的语义查询引擎。该语义查询引擎从一个或多个不同的数据来源获得未加工的数据,利用数据加工装置依据应用程序的要求对未加工的数据进行加工。加工后的数据被保存在数据存放库中,在数据存放库中,经加工的数据被以一种或多种模型保存以形成数据实体。基于本体(ontology)创建的共享全局数据模型提供本体实体。本体实体与数据实体之间进行映射。数据存放库中的经加工的数据的模型、共享全局数据模型、以及数据存放库中的数据实体与共享全局数据模型中的本体实体之间的映射关系都由元数据进行描述。

    利用摘要来分类显示页的方法和系统

    公开(公告)号:CN1758245B

    公开(公告)日:2010-09-08

    申请号:CN200510089648.1

    申请日:2005-04-30

    Applicant: 微软公司

    CPC classification number: G06F17/30719 G06F17/30864

    Abstract: 利用摘要来分类显示页的方法和系统。一种根据自动生成的显示页的摘要,来分类显示页的方法和系统。网页分类系统利用网页摘要系统来生成网页的摘要。网页的摘要可以包括与网页首要主题最接近相关的网页的句子。摘要系统可以组合多种摘要技术的好处来识别代表网页首要主题的网页的句子。一旦生成了摘要,分类系统可以对摘要应用传统的分类技术来分类网页。分类系统可以利用传统的分类技术,例如Bayesian分类器或支持向量机器,根据由摘要系统生成的摘要,来识别网页的分类。

Patent Agency Ranking