-
公开(公告)号:CN102289487B
公开(公告)日:2013-09-04
申请号:CN201110226821.3
申请日:2011-08-09
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于主题模型的网络突发热点事件检测方法。包括如下步骤:1)首先对文档数据集进行分词处理,得到单词列表、文档单词关系矩阵、单词文档分布矩阵、单词日期分布矩阵;2)根据网络热点事件涌现过程中相关单词和文档的突发特性对数据集进行筛选;3)然后通过主题建模得到突发热点事件的特征单词和特征文本;4)计算出热点事件的关注度日期分布。和现有技术相比,本发明使用主题模型进行主题建模,可以更加准确的对主题事件进行描述,其次,本发明还引入了单词的突发特性计算方法,并据此对数据集进行筛选,从而过滤掉时间无关主题,得到真正的突发热点事件。
-
公开(公告)号:CN102289487A
公开(公告)日:2011-12-21
申请号:CN201110226821.3
申请日:2011-08-09
Applicant: 浙江大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于主题模型的网络突发热点事件检测方法。包括如下步骤:1)首先对文档数据集进行分词处理,得到单词列表、文档单词关系矩阵、单词文档分布矩阵、单词日期分布矩阵;2)根据网络热点事件涌现过程中相关单词和文档的突发特性对数据集进行筛选;3)然后通过主题建模得到突发热点事件的特征单词和特征文本;4)计算出热点事件的关注度日期分布。和现有技术相比,本发明使用主题模型进行主题建模,可以更加准确的对主题事件进行描述,其次,本发明还引入了单词的突发特性计算方法,并据此对数据集进行筛选,从而过滤掉时间无关主题,得到真正的突发热点事件。
-
公开(公告)号:CN101320461A
公开(公告)日:2008-12-10
申请号:CN200810062742.1
申请日:2008-07-01
Applicant: 浙江大学
IPC: G06Q30/00
Abstract: 本发明公开了一种基于电阻网络和稀疏数据预测的协同过滤方法。包括如下步骤:1)通过电阻网络计算用户之间或物品之间的相似度;2)根据预先设定的标准提取相似用户或物品的集合;3)对评分矩阵中的稀疏数据进行有选择性地预测;4)根据实际应用的需要进行评分预测。本发明采用了一种新颖的基于电阻网络模型的相似度计算方法,更多的利用了评分矩阵中的有益信息。给出相似邻居的判断标准,抽取有益的信息。给出一种有效的稀疏数据预测算法:集成使用物品间相似度与用户间相似度,有选择性地预测有益的缺失评分,减轻了数据稀疏性的负面影响,在扩大后的评分集合基础上预测最终的用户评分,提高了预测的准确性。
-
-