-
公开(公告)号:CN106878102B
公开(公告)日:2020-05-22
申请号:CN201611204278.6
申请日:2016-12-23
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种基于网络流量多字段识别的人流量检测方法,步骤包括:1)获取网络流量,对所含的数据包进行预处理,包括IP碎片重组、链接还原和协议识别;2)识别预处理后的数据包所含的多字段信息,该多字段信息包括基准字段、设备指纹字段、位置信息和时间戳信息;3)将多字段信息填充于设备表中;4)通过检测设备表中的联网设备位置信息和时间戳信息来统计人流量。本发明还提供一种基于网络流量多字段识别的人流量检测系统,包括流量获取模块、数据预处理模块、多字段识别模块、设备表模块及人流量统计模块。
-
公开(公告)号:CN105468681B
公开(公告)日:2018-11-23
申请号:CN201510783824.5
申请日:2015-11-16
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于话题模型的网络负面信息影响最小化方法,包括如下步骤:1)采用有向图表示社交网络中信息的传播,通过话题模型分别计算负面信息的概率分布和每条边上的历史信息的概率分布;2)分别计算负面信息的概率分布和每条边上的历史信息的概率分布的距离,即KL散度d(w,i),其中d表示KL散度的计算结果,w表示历史信息的话题分布,i表示负面信息的话题分布;3)计算和其中b(w)和o(w)分别为中心度和出度入度算法的计算结果,然后从大到小排序,并去掉前k个节点,使负面信息的传播范围最小。本发明对于恶意信息已经爆发的社交网络能进行有效地控制,使负面信息的影响范围大大降低。
-
公开(公告)号:CN103955505B
公开(公告)日:2017-09-26
申请号:CN201410168703.5
申请日:2014-04-24
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种基于微博的事件实时监测方法及系统,所述方法包括:异常事件检测步骤,输入事件关键词,统计与事件关键词相关的微博数量,采用波峰识别方法将统计的微博数量以曲线图展示,将曲线图中的波峰时间作为事件的异常时间点,将存在异常时间点的事件作为异常事件;地理位置定位步骤,在与异常事件相关的微博文本内容中,抽取出地理位置实体,并采用聚类方法从抽取的地理位置实体中筛选出异常事件发生的地理位置。此外,还包括有相关事件推荐步骤和/或事件相关度分析步骤。本发明对用户所关心的事件进行实时监测,监控该事件在微博平台上的传播和发展趋势,能精准地挖掘出事件发生的异常时间点和地理位置,并推荐给用户其感兴趣的话题。
-
公开(公告)号:CN103150374B
公开(公告)日:2017-02-08
申请号:CN201310076056.0
申请日:2013-03-11
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种识别微博异常用户的方法,包括:获取多个用户微博数据存储入数据库中;根据用户微博数据,以用户行为的时间间隔的统计分布做为用户的行为时间特征,并生成行为时间特征向量和界定参数;计算正常用户行为时间特征向量与待测用户行为时间特征间的Kullback-Leibler距离,将计算出的Kullback-Leibler距离超出界定参数的待测用户判定为异常用户;对异常用户的内容进行关键词抽取和展示。对应该方法,本发明还提供了一种识别微博异常用户的系统。本发明可以快速提取出异常用户的博文内容关键词,可以准确识别营销,广告等垃圾信息发布者,适用于多个微博服务平台检测,且具有准确性高,效率高,适用性广的优点。
-
公开(公告)号:CN103823890B
公开(公告)日:2016-11-02
申请号:CN201410085760.7
申请日:2014-03-10
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种针对特定群体的微博热点话题检测方法及装置,包括以下步骤:根据认证用户与被认证用户关注的用户之间的关注关系对微博中的所有用户进行社区分类;根据获取的各个认证用户及其关注的用户发布的微博的内容抽取话题,得到多个概要话题类;根据用户社区和概要话题类构建社区话题矩阵;将与微博文本矢量对应的微博文本放到与微博文本矢量的余弦相似度最大的概要话题类中;选取社区话题矩阵中若干个矩阵元素数值最大的概要话题类分别进行聚簇分类,分别提取每个事件聚簇类的中心热点事件,并将得到的中心热点事件展示给对应的用户社区。本发明获取热点话题事件的多层次结果,最终通过微博来代表某个社区所感兴趣的热点事件。
-
公开(公告)号:CN105187265A
公开(公告)日:2015-12-23
申请号:CN201510379939.8
申请日:2015-07-01
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种面向流量测试的网络流水印标记和溯源方法。该方法的步骤包括:1)在生成测试流量时,将水印内容转换成0-1比特序列,然后将0-1比特序列转换成数据流中数据包发送的时间间隔,从而实现对测试流量的标记;2)在接收测试流量时,将数据流中数据包的时间间隔转换成0-1比特序列,进而根据0-1比特序列获取对应的水印内容,从而实现对测试流量的溯源。本发明首次将流水印技术应用到流量测试领域当中,将0-1比特信息与基于时间间隔的流水印结合起来,能够达到标记任意信息的目的;将时间戳与哈希置换结合起来,能够大大提高的流水印的安全性和隐私性。
-
公开(公告)号:CN104392002A
公开(公告)日:2015-03-04
申请号:CN201410779353.6
申请日:2014-12-15
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 本发明涉及一种大规模网页集合近似重复查找的方法,使用文档的点签名来过滤网页内容噪声,结合分区和倒排索引剪枝来完成近似重复查找,使得近似重复查找效率高,仅计算点签名的Jaccard相似度使得方法的复杂度很低。
-
公开(公告)号:CN103955505A
公开(公告)日:2014-07-30
申请号:CN201410168703.5
申请日:2014-04-24
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30616 , G06F17/30702
Abstract: 本发明涉及一种基于微博的事件实时监测方法及系统,所述方法包括:异常事件检测步骤,输入事件关键词,统计与事件关键词相关的微博数量,采用波峰识别方法将统计的微博数量以曲线图展示,将曲线图中的波峰时间作为事件的异常时间点,将存在异常时间点的事件作为异常事件;地理位置定位步骤,在与异常事件相关的微博文本内容中,抽取出地理位置实体,并采用聚类方法从抽取的地理位置实体中筛选出异常事件发生的地理位置。此外,还包括有相关事件推荐步骤和/或事件相关度分析步骤。本发明对用户所关心的事件进行实时监测,监控该事件在微博平台上的传播和发展趋势,能精准地挖掘出事件发生的异常时间点和地理位置,并推荐给用户其感兴趣的话题。
-
公开(公告)号:CN103914754A
公开(公告)日:2014-07-09
申请号:CN201410089720.X
申请日:2014-03-12
Applicant: 中国科学院信息工程研究所
IPC: G06Q10/06
Abstract: 本发明涉及一种工作流的任务调度方法以及多工作流调度方法和系统,所述任务调度方法包括:步骤1,计算工作流中每个任务的向上权值,按向上权值的降序将任务放入待调度任务列表;步骤2,选择向上权值最大的任务,遍历并计算该任务在每个处理机上的最早完成时间,将该任务部署到最早完成时间最短的处理机上;步骤3,按待调度任务列表中的任务顺序,采用步骤2的方法为其余任务部署相应的处理机。所述多工作流调度方法主要原理为:将实时接收的工作流的优先级与正在被调度执行的工作流的优先级相比较,根据比较结果实施公平性策略或回填策略,再利用WSS策略进行任务调度。本发明基于云计算环境,能在效地进行多优先级的多工作流调度。
-
公开(公告)号:CN103823890A
公开(公告)日:2014-05-28
申请号:CN201410085760.7
申请日:2014-03-10
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30864 , G06F17/30705
Abstract: 本发明涉及一种针对特定群体的微博热点话题检测方法及装置,包括以下步骤:根据认证用户与被认证用户关注的用户之间的关注关系对微博中的所有用户进行社区分类;根据获取的各个认证用户及其关注的用户发布的微博的内容抽取话题,得到多个概要话题类;根据用户社区和概要话题类构建社区话题矩阵;将与微博文本矢量对应的微博文本放到与微博文本矢量的余弦相似度最大的概要话题类中;选取社区话题矩阵中若干个矩阵元素数值最大的概要话题类分别进行聚簇分类,分别提取每个事件聚簇类的中心热点事件,并将得到的中心热点事件展示给对应的用户社区。本发明获取热点话题事件的多层次结果,最终通过微博来代表某个社区所感兴趣的热点事件。
-
-
-
-
-
-
-
-
-