-
公开(公告)号:CN1687924A
公开(公告)日:2005-10-26
申请号:CN200510011644.1
申请日:2005-04-28
Applicant: 中国科学院计算技术研究所
IPC: G06F17/30
Abstract: 本发明涉及互联网信息搜索引擎技术领域,互联网人物相关信息的搜索引擎的生成方法。方法包括:S1,针对人物的数据预处理,主要包括网页去重、网页噪音过滤;S2,同名人物的判别和人物履历的填充,S3:人物事件报道的组织;S4,人物知名度变化的统计。本发明适用于建立大规模商用人物相关信息的搜索引擎。