-
公开(公告)号:CN101609445A
公开(公告)日:2009-12-23
申请号:CN200910054888.6
申请日:2009-07-16
Applicant: 复旦大学
Abstract: 本发明属于文本分析技术领域,具体是一种网络文本信息分析方法,尤其涉及一种基于时间信息的关键子话题提取方法。其步骤是,下载文本信息记录,提取其中的时间信息,再对相同时间点的文本的话题进行识别,然后定义并计算时间引用网络的节点关注度和关注度突变系数,最后根据突变系数与阈值的比较,确定关键子话题。本发明克服了目前基于关键词识别话题的各种方法所存在的问题,为准确确定关键子话题提供了一种有效的方法,适应于各种具有时间信息的文本集的计算机自动分析要求。