基于频繁子树来导出记录模板的方法

    公开(公告)号:CN102955796A

    公开(公告)日:2013-03-06

    申请号:CN201110245084.1

    申请日:2011-08-16

    Applicant: 微软公司

    Inventor: 徐鹏 陈正

    Abstract: 本发明公开了一种基于频繁子树来导出记录模板的方法。该方法包括从网页中挖掘最大频繁子树和闭合频繁子树,对从网页挖掘出的最大频繁子树和闭合频繁子树进行分组。在分组内标识模板子树,该模板子树是仅包括所有必要节点的模板。基于标识出的模板子树来标识可选节点并消除噪音。并基于模板子树从各个节点中抽取结构化信息。

    基于异类关系确定目标相似性的方法和系统

    公开(公告)号:CN1728147B

    公开(公告)日:2010-09-08

    申请号:CN200510092244.8

    申请日:2005-05-16

    Applicant: 微软公司

    Abstract: 提供一种用于测量目标的相似性的方法和系统,所述测量基于同种类型的目标和不同类型的目标之间的关系以及这些目标与其它目标之间的相似性。在一个实施例中,相似性系统为每一种目标定义内部型和中间型相似性函数。相似性系统可以将某种类型的内部型和中间型相似性函数组合成该类型的一个整体的相似性函数。在定义了相似性函数之后,相似性系统收集目标的属性值,其包括同种类型的目标之间的关系数据,叫作内部型关系,和不同类型的目标之间的关系,叫作中间型关系。在收集了目标的属性值之后,相似性系统通过反复计算目标的相似性来求解内部型和中间型相似性函数,直到相似性收敛于一解值。

    笔式计算系统中的标记管理

    公开(公告)号:CN1637741B

    公开(公告)日:2010-07-21

    申请号:CN200410082285.4

    申请日:2004-09-10

    Applicant: 微软公司

    CPC classification number: G06F17/30997 G06F17/241 G06F17/242 G06F17/30722

    Abstract: 这里描述的是笔式计算系统中管理标记的系统和方法。这里描述的本系统和方法提供收集、管理、搜索及共享通过手写标记方式输入的个人信息的方式。标记用于驱动应用程序、作为向导、查找相关信息并进一步管理信息。当用户输入信息时,得到上下文信息,该上下文信息用于帮助确定和定位用户可能感兴趣的相关内容,这些内容不论在本地计算机或因特网或其它网络上的同一或不同文档中。

    用于识别与Web站点内容相关的项的方法和计算设备

    公开(公告)号:CN100476814C

    公开(公告)日:2009-04-08

    申请号:CN200510078308.9

    申请日:2005-04-13

    Applicant: 微软公司

    Abstract: 本发明描述了用于检验项和Web站点内容之间的相关性的系统和方法。在一个方面中,检索来自投标URL的站点内容。计算在语义上和/或上下文上与投标项相关的扩展项。根据投标项、站点内容和扩展项的各个组合计算内容相似性和扩展相似性度量。考虑到经训练的相似性分类器来确定扩展项和站点内容之间的类别相似性度量。该经训练的相似性分类器已根据挖掘的与目录数据相关联的万维站点内容加以训练了。提供了投标项和站点内容之间的相关性的客观度量的信用度值,是考虑到经训练的相关性分类器模型,根据评估多个相似性得分的内容、扩展和类别相似性度量而确定的。

    基于人与人之间的关系区分讯息的优先次序的方法和系统

    公开(公告)号:CN1746915A

    公开(公告)日:2006-03-15

    申请号:CN200510109858.2

    申请日:2005-07-29

    Applicant: 微软公司

    CPC classification number: G06Q10/107

    Abstract: 提供了一种基于人与人之间的关系计算人员重要度,并基于讯息参与者的重要度区分讯息优先级的方法和系统。区分优先级系统识别人与之间的关系,并且基于这些人与之间的关系识别一个人相对于另一个人的重要度。在区分优先级系统识别出人员重要度后,区分优先级系统可以基于发信人或收件人的重要度列出讯息的优先级。

Patent Agency Ranking