-
公开(公告)号:CN1694105B
公开(公告)日:2011-11-23
申请号:CN200510079221.3
申请日:2005-04-29
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30864 , Y10S707/99931
Abstract: 一种用于根据链接和页面布局分析来确定页面图像相关度的方法和系统。链接分析系统通过首先识别网页内的块,然后分析块对网页、网页对块、以及图像对块的重要性,来确定图像之间的相关度。根据该分析,链接分析系统确定每幅图像与其它各幅图像的相关度。链接分析系统也可以使用图像的相关度产生图像的排列。链接分析系统也可以根据图像的相关度产生图像的矢量表示,并将群集算法应用于矢量表示以识别相关图像群。
-
公开(公告)号:CN1694102A
公开(公告)日:2005-11-09
申请号:CN200510079221.3
申请日:2005-04-29
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30864 , Y10S707/99931
Abstract: 一种用于根据链接和页面布局分析来确定页面图像相关度的方法和系统。链接分析系统通过首先识别网页内的块,然后分析块对网页、网页对块、以及图像对块的重要性,来确定图像之间的相关度。根据该分析,链接分析系统确定每幅图像与其它各幅图像的相关度。链接分析系统也可以使用图像的相关度产生图像的排列。链接分析系统也可以根据图像的相关度产生图像的矢量表示,并将群集算法应用于矢量表示以识别相关图像群。
-
公开(公告)号:CN1577328A
公开(公告)日:2005-02-09
申请号:CN200410055697.9
申请日:2004-07-28
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30716 , G06F17/218 , G06F17/2247
Abstract: 基于视觉的文档分割标识文档的语义内容的一个或多个部分。所述一个或多个部分通过在所述文档中标识多个可视块,并检测所述多个可视块的可视块之间的一个或多个分隔符来标识。至少部分地基于所述多个可视块和所述一个或多个分隔符对所述文档构造内容结构,并且所述内容结构标识所述文档的语义内容的一个或多个部分。使用基于视觉的文档分割所获得的内容结构能够在文档检索过程中被可任选地使用。
-
-