一种识别微博异常用户的方法和系统

    公开(公告)号:CN103150374B

    公开(公告)日:2017-02-08

    申请号:CN201310076056.0

    申请日:2013-03-11

    Abstract: 本发明涉及一种识别微博异常用户的方法,包括:获取多个用户微博数据存储入数据库中;根据用户微博数据,以用户行为的时间间隔的统计分布做为用户的行为时间特征,并生成行为时间特征向量和界定参数;计算正常用户行为时间特征向量与待测用户行为时间特征间的Kullback-Leibler距离,将计算出的Kullback-Leibler距离超出界定参数的待测用户判定为异常用户;对异常用户的内容进行关键词抽取和展示。对应该方法,本发明还提供了一种识别微博异常用户的系统。本发明可以快速提取出异常用户的博文内容关键词,可以准确识别营销,广告等垃圾信息发布者,适用于多个微博服务平台检测,且具有准确性高,效率高,适用性广的优点。

    一种针对特定群体的微博热点话题检测方法及装置

    公开(公告)号:CN103823890B

    公开(公告)日:2016-11-02

    申请号:CN201410085760.7

    申请日:2014-03-10

    Abstract: 本发明涉及一种针对特定群体的微博热点话题检测方法及装置,包括以下步骤:根据认证用户与被认证用户关注的用户之间的关注关系对微博中的所有用户进行社区分类;根据获取的各个认证用户及其关注的用户发布的微博的内容抽取话题,得到多个概要话题类;根据用户社区和概要话题类构建社区话题矩阵;将与微博文本矢量对应的微博文本放到与微博文本矢量的余弦相似度最大的概要话题类中;选取社区话题矩阵中若干个矩阵元素数值最大的概要话题类分别进行聚簇分类,分别提取每个事件聚簇类的中心热点事件,并将得到的中心热点事件展示给对应的用户社区。本发明获取热点话题事件的多层次结果,最终通过微博来代表某个社区所感兴趣的热点事件。

    一种面向流量测试的网络流水印标记和溯源方法

    公开(公告)号:CN105187265A

    公开(公告)日:2015-12-23

    申请号:CN201510379939.8

    申请日:2015-07-01

    Abstract: 本发明涉及一种面向流量测试的网络流水印标记和溯源方法。该方法的步骤包括:1)在生成测试流量时,将水印内容转换成0-1比特序列,然后将0-1比特序列转换成数据流中数据包发送的时间间隔,从而实现对测试流量的标记;2)在接收测试流量时,将数据流中数据包的时间间隔转换成0-1比特序列,进而根据0-1比特序列获取对应的水印内容,从而实现对测试流量的溯源。本发明首次将流水印技术应用到流量测试领域当中,将0-1比特信息与基于时间间隔的流水印结合起来,能够达到标记任意信息的目的;将时间戳与哈希置换结合起来,能够大大提高的流水印的安全性和隐私性。

    一种基于微博的事件实时监测方法及系统

    公开(公告)号:CN103955505A

    公开(公告)日:2014-07-30

    申请号:CN201410168703.5

    申请日:2014-04-24

    CPC classification number: G06F17/30616 G06F17/30702

    Abstract: 本发明涉及一种基于微博的事件实时监测方法及系统,所述方法包括:异常事件检测步骤,输入事件关键词,统计与事件关键词相关的微博数量,采用波峰识别方法将统计的微博数量以曲线图展示,将曲线图中的波峰时间作为事件的异常时间点,将存在异常时间点的事件作为异常事件;地理位置定位步骤,在与异常事件相关的微博文本内容中,抽取出地理位置实体,并采用聚类方法从抽取的地理位置实体中筛选出异常事件发生的地理位置。此外,还包括有相关事件推荐步骤和/或事件相关度分析步骤。本发明对用户所关心的事件进行实时监测,监控该事件在微博平台上的传播和发展趋势,能精准地挖掘出事件发生的异常时间点和地理位置,并推荐给用户其感兴趣的话题。

    一种工作流的任务调度方法、多工作流调度方法及其系统

    公开(公告)号:CN103914754A

    公开(公告)日:2014-07-09

    申请号:CN201410089720.X

    申请日:2014-03-12

    Abstract: 本发明涉及一种工作流的任务调度方法以及多工作流调度方法和系统,所述任务调度方法包括:步骤1,计算工作流中每个任务的向上权值,按向上权值的降序将任务放入待调度任务列表;步骤2,选择向上权值最大的任务,遍历并计算该任务在每个处理机上的最早完成时间,将该任务部署到最早完成时间最短的处理机上;步骤3,按待调度任务列表中的任务顺序,采用步骤2的方法为其余任务部署相应的处理机。所述多工作流调度方法主要原理为:将实时接收的工作流的优先级与正在被调度执行的工作流的优先级相比较,根据比较结果实施公平性策略或回填策略,再利用WSS策略进行任务调度。本发明基于云计算环境,能在效地进行多优先级的多工作流调度。

    一种针对特定群体的微博热点话题检测方法及装置

    公开(公告)号:CN103823890A

    公开(公告)日:2014-05-28

    申请号:CN201410085760.7

    申请日:2014-03-10

    CPC classification number: G06F17/30864 G06F17/30705

    Abstract: 本发明涉及一种针对特定群体的微博热点话题检测方法及装置,包括以下步骤:根据认证用户与被认证用户关注的用户之间的关注关系对微博中的所有用户进行社区分类;根据获取的各个认证用户及其关注的用户发布的微博的内容抽取话题,得到多个概要话题类;根据用户社区和概要话题类构建社区话题矩阵;将与微博文本矢量对应的微博文本放到与微博文本矢量的余弦相似度最大的概要话题类中;选取社区话题矩阵中若干个矩阵元素数值最大的概要话题类分别进行聚簇分类,分别提取每个事件聚簇类的中心热点事件,并将得到的中心热点事件展示给对应的用户社区。本发明获取热点话题事件的多层次结果,最终通过微博来代表某个社区所感兴趣的热点事件。

    一种自动分发、运行和更新可执行程序的方法及系统

    公开(公告)号:CN103473287A

    公开(公告)日:2013-12-25

    申请号:CN201310385972.2

    申请日:2013-08-30

    Abstract: 本发明涉及一种自动分发、运行和更新可执行程序的方法及系统,包括客户端将可执行程序及相关文件所在目录打包成一个文件,并采用大文件分割及索引存储方法将打包文件存储到状态存储集群;工作节点定期到状态存储集群检测索引状态,当检测到有新的索引或已有索引有更新,按照索引方式将可执行程序下载到本地目录;工作节点定期到状态存储集群获取程序相关信息;工作节点根据程序相关信息,每隔心跳时间到本地目录检测可执行程序的下载状态,直到检测到可执行程序下载完成时,执行可执行程序;本发明可实现可执行程序的自动分发、运行及更新,尤其在线更新正在执行的可执行程序,无需重新提交Job信息,增加了系统的灵活性与稳定性。

    一种识别微博异常用户的方法和系统

    公开(公告)号:CN103150374A

    公开(公告)日:2013-06-12

    申请号:CN201310076056.0

    申请日:2013-03-11

    Abstract: 本发明涉及一种识别微博异常用户的方法,包括:获取多个用户微博数据存储入数据库中;根据用户微博数据,以用户行为的时间间隔的统计分布做为用户的行为时间特征,并生成行为时间特征向量和界定参数;计算正常用户行为时间特征向量与待测用户行为时间特征间的Kullback-Leibler距离,将计算出的Kullback-Leibler距离超出界定参数的待测用户判定为异常用户;对异常用户的内容进行关键词抽取和展示。对应该方法,本发明还提供了一种识别微博异常用户的系统。本发明可以快速提取出异常用户的博文内容关键词,可以准确识别营销,广告等垃圾信息发布者,适用于多个微博服务平台检测,且具有准确性高,效率高,适用性广的优点。

    一种基于FCE算法的动态泄密风险评估方法及装置

    公开(公告)号:CN114157628A

    公开(公告)日:2022-03-08

    申请号:CN202111208786.2

    申请日:2021-10-18

    Abstract: 本发明公开了一种基于FCE算法的动态泄密风险评估方法及装置,包括获取待评估用户数据的风险项数据信息;基于风险项数据信息与各风险项的风险等级设定阈值,结合FCE算法进行模拟专家归一化打分,得到各风险项的打分数组;利用所述打分数组,构建用户综合风险特征矩阵;将专家设定的各风险项归一化得分数组与用户综合风险特征矩阵进行矩阵乘法,并根据矩阵乘法结果,获取待评估用户的综合风险等级。本发明根据用户实时数据,动态地进行研判并对泄密风险进行量化评估,得到的结果会更加偏向于业务人员的需求。

Patent Agency Ranking