-
公开(公告)号:CN101331475A
公开(公告)日:2008-12-24
申请号:CN200680046842.4
申请日:2006-11-13
Applicant: 微软公司
IPC: G06F17/00
CPC classification number: G06Q30/02
Abstract: 利用从网络浏览器页面和/或网络搜索查询中提取的特征,以便于检测用户的浏览和/或搜索意图。从这些特征构建的机器学习分类器自动检测用户的在线商业意图(OCI)。用户的意图可以是商业性或非商业性的,其中商业意图是信息性或交易性的。在一个实例中,对搜索引擎采用OCI排序机制,以便于提供根据用户意图排序的搜索结果。这还提供一种将购买广告与更有可能准备进行购买(交易阶段)的潜在顾客相匹配的手段。此外,可以将信息广告匹配到研究潜在(信息阶段)的用户。
-
公开(公告)号:CN1577328A
公开(公告)日:2005-02-09
申请号:CN200410055697.9
申请日:2004-07-28
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30716 , G06F17/218 , G06F17/2247
Abstract: 基于视觉的文档分割标识文档的语义内容的一个或多个部分。所述一个或多个部分通过在所述文档中标识多个可视块,并检测所述多个可视块的可视块之间的一个或多个分隔符来标识。至少部分地基于所述多个可视块和所述一个或多个分隔符对所述文档构造内容结构,并且所述内容结构标识所述文档的语义内容的一个或多个部分。使用基于视觉的文档分割所获得的内容结构能够在文档检索过程中被可任选地使用。
-
公开(公告)号:CN101305370B
公开(公告)日:2013-03-06
申请号:CN200680042170.X
申请日:2006-11-15
Applicant: 微软公司
CPC classification number: G06F17/30707 , Y10S707/99933 , Y10S707/99937
Abstract: 一种用于将源文档分类到一个或两个类别中的机制,该类别或者可能包含期望信息或者不可能包含期望信息。一般地,利用某种形式的基于规则的分类并结合对于较为困难的情况使用高级技术的较深的分析。该基于规则的分类一般对基于数据之间的一般可辨认关系或基于数据是否存在,来删去各种情况不作进一步考虑或标识感兴趣的文档是有用的。较深的分析被用于揭示可以标识感兴趣的文档的数据之间更为复杂的关系。该过程的各部分可以使用整个文档,而该过程的其他部分可以仅使用文档的一部分。
-
公开(公告)号:CN102893275A
公开(公告)日:2013-01-23
申请号:CN201180023860.1
申请日:2011-05-10
Applicant: 微软公司
CPC classification number: G06F17/30867
Abstract: 此处描述的自动社交网络图挖掘和可视化技术从一般(不必是社交应用专用的)网页挖掘社交连接并允许创建社交网络图。该技术使用一个或多个网页上一人/实体的名称和相关人/实体的名称之间的距离来确定各人/实体之间的连接以及这些连接的强度。在一个实施例中,该技术通过使用力指向模型对这些连接进行布局,然后将这些连接聚集在表示相关的人或实体的名称之间的Web连接强度的社交网络图的2-D布局中。
-
公开(公告)号:CN1694105B
公开(公告)日:2011-11-23
申请号:CN200510079221.3
申请日:2005-04-29
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30864 , Y10S707/99931
Abstract: 一种用于根据链接和页面布局分析来确定页面图像相关度的方法和系统。链接分析系统通过首先识别网页内的块,然后分析块对网页、网页对块、以及图像对块的重要性,来确定图像之间的相关度。根据该分析,链接分析系统确定每幅图像与其它各幅图像的相关度。链接分析系统也可以使用图像的相关度产生图像的排列。链接分析系统也可以根据图像的相关度产生图像的矢量表示,并将群集算法应用于矢量表示以识别相关图像群。
-
公开(公告)号:CN1702654A
公开(公告)日:2005-11-30
申请号:CN200510081751.1
申请日:2005-04-29
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30867 , Y10S707/99933 , Y10S707/99935
Abstract: 一种用于确定显示页面的信息区域的重要度的方法和系统。一种确定网页中信息区域或块的重要度的系统。网页块表示看起来涉及相似主题的网页区域。该重要度系统将块的特性或特征提供给重要度函数,该函数生成该块对于其网页的重要度的指示。该重要度系统通过生成基于块的特征和用户指定的这些块的重要度的模型“组合”该重要度函数。为获得该重要度函数,该重要度系统要求用户提供网页集合中各网页的块的重要度指示。
-
公开(公告)号:CN102968419A
公开(公告)日:2013-03-13
申请号:CN201110266733.6
申请日:2011-08-31
Applicant: 微软公司
IPC: G06F17/30
Abstract: 本发明揭示了一种交互式互联网实体名称的消歧方法。该方法包括三个主要的步骤:预处理步骤、迭代排序步骤和呈现步骤。在预处理步骤中,接收查询信息并基于查询信息检索与实体相关的互联网实体名称,将与同一个实体相关的互联网实体名称初始聚合。在迭代排序步骤中,循环执行下述步骤直至满足终止条件:根据排序模型按照与实体的类似程度对互联网实体名称进行排序;产生包含选项的交互问题;向用户呈现交互问题并接收用户选择的选项作为用户反馈;根据用户反馈对排序模型进行优化,并重新对互联网实体名称进行排序。在呈现步骤中,选择排序最前的互联网实体名称并生成与被查询的实体相关的总结页面,向用户呈现总结页面。
-
公开(公告)号:CN1694102A
公开(公告)日:2005-11-09
申请号:CN200510079221.3
申请日:2005-04-29
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30864 , Y10S707/99931
Abstract: 一种用于根据链接和页面布局分析来确定页面图像相关度的方法和系统。链接分析系统通过首先识别网页内的块,然后分析块对网页、网页对块、以及图像对块的重要性,来确定图像之间的相关度。根据该分析,链接分析系统确定每幅图像与其它各幅图像的相关度。链接分析系统也可以使用图像的相关度产生图像的排列。链接分析系统也可以根据图像的相关度产生图像的矢量表示,并将群集算法应用于矢量表示以识别相关图像群。
-
公开(公告)号:CN1702654B
公开(公告)日:2012-03-28
申请号:CN200510081751.1
申请日:2005-04-29
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30867 , Y10S707/99933 , Y10S707/99935
Abstract: 一种用于确定显示页面的信息区域的重要度的方法和系统。一种确定网页中信息区域或块的重要度的系统。网页块表示看起来涉及相似主题的网页区域。该重要度系统将块的特性或特征提供给重要度函数,该函数生成该块对于其网页的重要度的指示。该重要度系统通过生成基于块的特征和用户指定的这些块的重要度的模型“组合”该重要度函数。为获得该重要度函数,该重要度系统要求用户提供网页集合中各网页的块的重要度指示。
-
公开(公告)号:CN101305370A
公开(公告)日:2008-11-12
申请号:CN200680042170.X
申请日:2006-11-15
Applicant: 微软公司
CPC classification number: G06F17/30707 , Y10S707/99933 , Y10S707/99937
Abstract: 一种用于将源文档分类到一个或两个类别中的机制,该类别或者可能包含期望信息或者不可能包含期望信息。一般地,利用某种形式的基于规则的分类并结合对于较为困难的情况使用高级技术的较深的分析。该基于规则的分类一般对基于数据之间的一般可辨认关系或基于数据是否存在,来删去各种情况不作进一步考虑或标识感兴趣的文档是有用的。较深的分析被用于揭示可以标识感兴趣的文档的数据之间更为复杂的关系。该过程的各部分可以使用整个文档,而该过程的其他部分可以仅使用文档的一部分。
-
-
-
-
-
-
-
-
-