-
公开(公告)号:CN101295307B
公开(公告)日:2010-08-04
申请号:CN200810005866.6
申请日:2008-02-15
Applicant: 株式会社日立制作所
IPC: G06F17/30
CPC classification number: G06F17/3069
Abstract: 本发明提供一种文档检索系统及文档检索方法,考虑文档中的数值数据的相似度来进行检索。对属性A的数值集合D,生成包含D的全部要素的数值区间集合E,通过使在区间内包含D的要素x的区间对应1、使不包含的区间对应0,来对文档中的数值附加索引。文本部分使用单词频度、数值部分使用所述数值的索引附加方法,来对包含数值的文档数据附加索引。使用如此生成的文档数据的索引,计算基于矢量空间法或概率模型的文档数据间的相似度,从相似度高的文档数据开始依次提示。
-
公开(公告)号:CN101295307A
公开(公告)日:2008-10-29
申请号:CN200810005866.6
申请日:2008-02-15
Applicant: 株式会社日立制作所
IPC: G06F17/30
CPC classification number: G06F17/3069
Abstract: 本发明提供一种文档检索系统及文档检索方法,考虑文档中的数值数据的相似度来进行检索。对属性A的数值集合D,生成包含D的全部要素的数值区间集合E,通过使在区间内包含D的要素x的区间对应1、使不包含的区间对应0,来对文档中的数值附加索引。文本部分使用单词频度、数值部分使用所述数值的索引附加方法,来对包含数值的文档数据附加索引。使用如此生成的文档数据的索引,计算基于矢量空间法或概率模型的文档数据间的相似度,从相似度高的文档数据开始依次提示。
-