基于微信群信息的数据分析系统

    公开(公告)号:CN108880980A

    公开(公告)日:2018-11-23

    申请号:CN201810403059.3

    申请日:2018-04-28

    Abstract: 本发明公开一种基于微信群信息的数据分析系统,包括:信息采集模块,其每隔预设时间按发送顺序采集一批预设数量的微信群消息的html标签;数据分析模块,其将信息采集模块采集到的html标签通过正则解析得出其中包含的每条群消息的属性,所述群消息属性包括群编号、群消息编号;缓存去重模块,其将每条群消息属性包含的群编号和群消息编号进行哈希运算得到哈希值,再将相邻两批次中的每条群消息的哈希值对比,若有重复部分,则将后一批次中哈希值重复的群消息删除;多媒体提取模块;对象存储模块;关键词提取模块;群消息库模块。本发明具有能将采集到的微信群消息数据进行分析和统计,最后直观的展示出来,可以有效、直观的监测微信群的优点。

    微信公众号的影响力分析方法和系统

    公开(公告)号:CN106909637A

    公开(公告)日:2017-06-30

    申请号:CN201710079050.7

    申请日:2017-02-14

    CPC classification number: G06F17/30861 G06F17/3061

    Abstract: 本发明公开了一种微信公众号的影响力分析方法,包括如下步骤:步骤一、采集某一微信公众号下设定时间内发布的m篇文章中每篇文章的阅读数αi和点赞数βi,并计算阅读数和点赞数的转化率k=阅读总数/点赞总数;步骤二、当微信公众号下某篇文章的阅读数为100000+时,利用αx=k*βx计算得到文章的阅读数,其中αx为篇文章阅读数,βx为文章点赞数,设置单篇文章阅读数1×107为上限;步骤三、依据如下公式计算微信公众号的影响力权重:η为微信公众号的权威性权重;以用于对微信公众号发布信息的管理及对微信公众号的影响力的分析。本发明还公开了一种微信公众号的影响力分析系统。本发明极大地节省了人工成本,大幅度提高公众号影响力的分析效率。

    基于社交网络的用户群体消息传播异常分析方法及装置

    公开(公告)号:CN109145109B

    公开(公告)日:2022-06-03

    申请号:CN201710464424.7

    申请日:2017-06-19

    Abstract: 本发明涉及一种基于社交网络的用户群体消息传播异常分析方法和装置,包括:获取在线社交网络中用户群体的历史聊天记录,根据预先设定的时间跨度,获取历史聊天记录在时间跨度内用户群体中所有用户所发布的消息,作为消息集合;对于消息集合,根据预先设定的时间范围统计用户群体在每个时间范围内所发布的消息总数;基于时序相关性的特征提取法,对每个消息总数的特征进行提取,并将提取结果集合为样本集合;根据消息总数并采用聚类算法为样本集合对样本集合进行聚类,生成异常样本;根据异常样本判定其所在的用户群体存在消息传播异常。由此本发明能够应对数据涌发现象,同时算法直观简单,准确率更高,且本发明应用场景广泛。

    基于微博热门事件计算关键节点的方法及装置

    公开(公告)号:CN108733763B

    公开(公告)日:2022-05-17

    申请号:CN201810338555.5

    申请日:2018-04-16

    Abstract: 本发明公开了一种基于微博热门事件计算关键节点的方法,包括:获取历史热门事件的转发数、评论数、点赞数和阅读数,定义热门值,并确定热门临界值;获取历史热门事件的初步关键博主,获取作为初步关键传播时间,建立关键传播时间的计算公式;获取目标事件的转发数、评论数、点赞数和阅读数,若目标事件的热门值达到热门临界值,则计算出目标事件的的关键传播时间,获得关键时间点;选取在关键时间点附近发微博的若干博主,获取其中与其它博主关联次数最多的博主,即为目标事件的关键博主。本发明还提供了基于微博热门事件计算关键节点的装置。本发明能够在微博热门事件在不可控地爆发之前,找到推动此事件的关键博主,从而使得事件得以控制。

    基于多次单类型采集结果的综合异常判断的系统

    公开(公告)号:CN108429649B

    公开(公告)日:2020-11-06

    申请号:CN201810244277.7

    申请日:2018-03-23

    Abstract: 本发明公开了一种基于多次单类型采集结果的综合异常判断系统,涉及网络预警技术领域。所述系统包括:阈值生成单元和异常判断单元;所述阈值生成单元,在从被采集系统上获取到的采集数据的基础上,计算判断阈值;所述异常判断单元,在所述判断阈值和所述采集数据的基础上,判断被采集系统运行是正常还是异常。本发明所述系统对采集到的数据进行多种方式进行判断,从而在不接触被监测系统后台日志或硬件数据的情况下准确识别出被检测系统的运行状况,解决了因使用平均值计算抗干扰性太弱,固定阈值判断性能太差,阈值波动范围设置方案单一且低效的问题。

    一种网络话题热度预测方法

    公开(公告)号:CN106557552B

    公开(公告)日:2020-08-21

    申请号:CN201610958001.6

    申请日:2016-10-27

    Abstract: 本发明公开了一种网络话题热度预测方法。它包括话题检测、热度预测建模、预测热度值计算三个步骤。话题检测部分负责从网络数据中获取与用户给定话题关键词相关的话题数据。预测建模部分按照用户设定的时间粒度大小统计话题检测结果中每个时间段内的话题热度值,并计算高斯过程模型关于话题热度统计时间点的协方差矩阵,构建基于高斯过程的预测模型。预测热度值计算部分针对用户给定的预测时间点,利用构建的高斯过程模型计算话题在给定时间点的热度值。本发明综合利用信息检索技术、分类技术进行话题检测,利用高斯过程模型来进行话题热度预测,提高了话题预测的实用性和有效性。

Patent Agency Ranking