-
公开(公告)号:CN107885793A
公开(公告)日:2018-04-06
申请号:CN201710981613.1
申请日:2017-10-20
Applicant: 江苏大学 , 无锡恒创医信科技发展有限公司
CPC classification number: G06F16/35 , G06F16/951 , G06F16/955 , G06F17/2775
Abstract: 本发明公开了一种微博热点话题分析预测方法及系统,包括数据采集模块、预处理模块、计算分析模块和展示模块。本发明通过聚类分析技术将采集到的微博进行分类;本发明通过对微博内容进行分词,进行词性标注,对源微博和转发微博进行合并处理,基于社交网络的隐含狄利克雷分配模型微博话题识别方法,并在词汇计算时考虑了微博的类型、时间因素重新构建LDA模型。本发明通过相关性分析微博发送一个小时内的传播信息和24小时之内的传播规模和传播深度得到相关性强的话题热度的评估指标;本发明可以应用于开发商对用户进行消息的推送和广告的推送。
-
公开(公告)号:CN105809451A
公开(公告)日:2016-07-27
申请号:CN201610112424.6
申请日:2016-02-29
Applicant: 江苏大学
CPC classification number: G06Q30/0185 , G06F16/182 , G06F16/254 , G06F17/2785 , G06F17/2795
Abstract: 本发明公开了一种大数据电商网购评价分析预测方法及系统,本发明涉及一种大数据采集与分析预测的方法与系统,通过一个部署于Spark的控制与交换中心结合若干交换代理,将评价内容这非结构文本转换为结构化数据。本发明是基于大数据的前提开发,利用大数据的数据挖掘算法对采集的所有信息进行有效的处理。本发明可应用于网上购物导购,为用户提供准确的网购评价分析,方便用户判断评论是否虚假、网购是否实用,进而决定是否购买该商品。
-