-
公开(公告)号:CN100511224C
公开(公告)日:2009-07-08
申请号:CN200510071690.0
申请日:2005-04-13
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30631 , G06F17/30722 , G06F17/30864 , Y10S707/99935 , Y10S707/99942
Abstract: 描述了为改进的文档检索提供内容传播的系统和方法。在一个方面中,识别针对一个或多个文档的参考信息。所述参考信息是从一个或多个数据源中识别出来的,所述一个或多个数据源与包括所述一个或多个文档的数据源无关。从一个或多个数据源中提取被接近地定位到所述参考信息的元数据。对于所述一个或多个文档中相关文档的内容,计算所述元数据的各个特征之间的相关性。对于所述一个或多个文档的每个文档,将所述元数据的相关部分用各自部分的所述特征相关性索引到所述文档的原始内容。所述索引产生了一个或多个改进文档。
-
公开(公告)号:CN1694100A
公开(公告)日:2005-11-09
申请号:CN200510071690.0
申请日:2005-04-13
Applicant: 微软公司
IPC: G06F17/30
CPC classification number: G06F17/30631 , G06F17/30722 , G06F17/30864 , Y10S707/99935 , Y10S707/99942
Abstract: 描述了为改进的文档检索提供内容传播的系统和方法。在一个方面中,识别针对一个或多个文档的参考信息。所述参考信息是从一个或多个数据源中识别出来的,所述一个或多个数据源与包括所述一个或多个文档的数据源无关。从一个或多个数据源中提取被接近地定位到所述参考信息的元数据。对于所述一个或多个文档中相关文档的内容,计算所述元数据的各个特征之间的相关性。对于所述一个或多个文档的每个文档,将所述元数据的相关部分用各自部分的所述特征相关性索引到所述文档的原始内容。所述索引产生了一个或多个改进文档。
-