-
公开(公告)号:CN103970733B
公开(公告)日:2017-07-14
申请号:CN201410143875.7
申请日:2014-04-10
Applicant: 中国信息安全测评中心 , 北京大学
IPC: G06F17/28
Abstract: 本发明涉及一种基于图结构的中文新词识别方法,其步骤包括:1)根据词之间的邻接关系将文档集抽象成有权有向图;2)遍历所述有权有向图的所有点,基于共现率选出每一个点的备选新词;3)对所述备选新词进行路径拓展,找到共现率始终大于阈值的最大权值路径,从而得到完整的备选新词;4)根据信息熵对所述完整的备选新词进行过滤,得到最终的备选新词集合。本发明首次提出了将文档集抽象为图结构进行新词发现和识别的方法,将新词发现问题转化为在有向有权图上的最大权重路径寻找问题,很好地利用了图的特点,是一种时间复杂度较低、召回率和准确率都较高的新词发现和识别方法。
-
公开(公告)号:CN102708153B
公开(公告)日:2015-05-06
申请号:CN201210114150.6
申请日:2012-04-18
Applicant: 中国信息安全测评中心 , 北京交通大学
IPC: G06F17/30
Abstract: 本发明公开了一种自适应在线社交网络热点话题发展趋势预测方法及系统,预测方法包括如下步骤:a、预处理在线社交网络舆情信息,获得进行预测所需的时间序列;b、分析时间序列,通过判断时间序列本身以及一阶二阶微分后的时间序列的平稳性,给出合适的预测模型;c、对相应的模型进行初始化、并进行参数估计和模型训练;d、采用相应模型预测在线社交网络舆情发展趋势。本发明还公开了一种自适应在线社交网络热点话题发展趋势预测系统。本发明可用于网络安全。
-
公开(公告)号:CN102708153A
公开(公告)日:2012-10-03
申请号:CN201210114150.6
申请日:2012-04-18
Applicant: 中国信息安全测评中心 , 北京交通大学
IPC: G06F17/30
Abstract: 本发明公开了一种自适应在线社交网络热点话题发展趋势预测方法,包括如下步骤:a、预处理在线社交网络舆情信息,获得进行预测所需的时间序列;b、分析时间序列,通过判断时间序列本身以及一阶二阶微分后的时间序列的平稳性,给出合适的预测模型;c、对相应的模型进行初始化、并进行参数估计和模型训练;d、采用相应模型预测在线社交网络舆情发展趋势。本发明还公开了一种自适应在线社交网络热点话题发展趋势预测系统。本发明可用于网络安全。
-
-