-
公开(公告)号:CN101692223A
公开(公告)日:2010-04-07
申请号:CN200810166176.9
申请日:2008-10-06
Applicant: 富士通株式会社
Inventor: 大卫·马尔维特 , 贾瓦哈拉·贾殷 , 斯特吉奥斯·斯特吉奥
IPC: G06F17/30
CPC classification number: G06F17/30675 , G06F17/30672
Abstract: 响应于用户输入精炼搜索空间。在一个实施方式中,对语料库的搜索空间进行搜索以得到结果。所述语料库包括与多个关键词相关联的多个文档,其中各个文档与至少一个指示该文档的至少一个主题的关键词相关联。将一个或更多个关键词确定为不相关关键词。根据所述不相关关键词精炼所述搜索空间。
-
公开(公告)号:CN101408885A
公开(公告)日:2009-04-15
申请号:CN200810166172.0
申请日:2008-10-06
Applicant: 富士通株式会社
Inventor: 大卫·马尔维特 , 贾瓦哈拉·贾殷 , 斯特吉奥斯·斯特吉奥 , 亚历克斯·吉尔曼 , B·托马斯·阿德勒 , 约翰·J·西多罗维奇 , 雅尼斯·拉布罗
CPC classification number: G06F17/3071 , G06F17/30616
Abstract: 利用统计分布对主题进行建模。在一个实施方式中,对主题进行建模的方法包括访问由包括词的文档组成的语料库。选择文档中的词作为该文档的关键词。根据关键词对文档进行聚类,以得到各个群集,其中每一群集对应于一个主题。针对一个群集,根据该群集的文档中的词生成统计分布。利用针对与一个主题相对应的群集生成的统计分布对该主题进行建模。
-