-
公开(公告)号:CN101714166A
公开(公告)日:2010-05-26
申请号:CN200910236817.8
申请日:2009-10-30
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本发明提出了一种大规模多关键词精确匹配算法的性能测试系统,所述系统包括如下模块:测试数据产生模块,具体包括:随机关键词生成子模块,随机文本数据生成子模块;待匹配文本生成子模块;关键词集合预处理性能测试模块,具体包括:匹配算法预处理接口调用子模块,测试信息生成子模块。本发明解决了不同网络信息安全设备之间的接口标准和互操作访问问题,实现他们之间的协同工作和联动,最终实现各网络信息安全设备的无缝集成。它能够对各种多关键词精确匹配算法的性能指标进行测试。
-
公开(公告)号:CN100452055C
公开(公告)日:2009-01-14
申请号:CN200710065392.X
申请日:2007-04-13
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本方法涉及一种文本或网络内容分析的大规模多关键词匹配方法,属于计算机数据处理技术领域。本方法包括关键词集预处理和文本或网络内容匹配两个阶段。关键词集预处理阶段建立跳跃表和关键词表,计算各表项的跳跃值,并将关键词关联到关键词表的相应表项。匹配阶段将一个窗口置于待分析的文本或网络内容的开始处,对窗口内的数据块进行哈希运算,检索跳跃表中对应跳跃值,若不为零,则按此值移动窗口,若为零,则对该数据块再进行哈希运算,检索关键词表,根据该表项中的跳跃值移动窗口,并将该表项中关联的关键词依次与文本中相应字段进行比较,确认是否匹配。本发明方法的优点是算法评测性能优异,满足实用要求,硬件可扩展性好。
-
公开(公告)号:CN111445119B
公开(公告)日:2022-06-24
申请号:CN202010213302.2
申请日:2020-03-24
Applicant: 清华大学
Abstract: 本发明提供一种配电设备运行状态关联关系在线检测方法及装置,所述方法包括:基于获取到的每一配电设备的监测指标数据,确定每一配电设备的运行状态特征矩阵;对所有的运行状态特征矩阵进行聚类分析,确定每一运行状态特征矩阵的簇类标记值;利用关联规则算法对所有的运行状态特征矩阵的簇类标记值进行关联分析,确定配电设备运行状态之间的关联关系。本发明提供的配电设备运行状态关联关系在线检测方法及装置,基于数据中心配电设备的实时监测数据,通过构造特征矩阵,建立在线配电设备运行状态关联性分析模型,实现对配电设备运行状态关联关系的在线检测,为配电系统的运行状况的分析提供可靠依据,降低了配电系统中告警的误报或漏报次数。
-
公开(公告)号:CN111445119A
公开(公告)日:2020-07-24
申请号:CN202010213302.2
申请日:2020-03-24
Applicant: 清华大学
Abstract: 本发明提供一种配电设备运行状态关联关系在线检测方法及装置,所述方法包括:基于获取到的每一配电设备的监测指标数据,确定每一配电设备的运行状态特征矩阵;对所有的运行状态特征矩阵进行聚类分析,确定每一运行状态特征矩阵的簇类标记值;利用关联规则算法对所有的运行状态特征矩阵的簇类标记值进行关联分析,确定配电设备运行状态之间的关联关系。本发明提供的配电设备运行状态关联关系在线检测方法及装置,基于数据中心配电设备的实时监测数据,通过构造特征矩阵,建立在线配电设备运行状态关联性分析模型,实现对配电设备运行状态关联关系的在线检测,为配电系统的运行状况的分析提供可靠依据,降低了配电系统中告警的误报或漏报次数。
-
公开(公告)号:CN107391581A
公开(公告)日:2017-11-24
申请号:CN201710476335.4
申请日:2017-06-21
Applicant: 清华大学
IPC: G06F17/30
Abstract: 本发明提供社会网络信息传播行为预测方法和设备用于解决现有的研究无法评估用户在传播同一源信息时不同情感倾向对信息后续传播的影响问题。其中方法,包括以下步骤:S101、从待分析社会网络上获取文本信息和信息传播关系,根据信息传播关系构建实时信息传播拓扑;S102、基于种子情感词典对文本信息进行预处理,从文本信息中提取特征词,运用机器学习算法对特征词进行语料情感分类,获得用户情感类别;S103、分析实时信息传播拓扑中的用户社交特征、信息内容特征、时间特征及传播结构特征;该方法对不同社会网络平台具有良好的适应性和扩展性。
-
公开(公告)号:CN103618702B
公开(公告)日:2017-01-18
申请号:CN201310567756.X
申请日:2013-11-14
Applicant: 清华大学
Abstract: 本发明公开了一种社会网络信息传播态势感知方法,包括步骤:S1.初始化信息传播感知向量V,该向量装载每一时刻的信息态势感知数值;S2.通过t时刻的信息传播节点V(n)和信息传播关系E(m)构建信息传播树Tr(t);S3.计算t时刻Tr(t)的模块度数值M(t);S4.判断t时刻是否为初始时间,若是,则将初始时间的模块度装载入感知向量V,同时将t赋值为t+1,执行步骤S6,若否,则执行步骤S5;S5.通过t+1时刻前的所有时刻的模块度,利用三次指数平滑方法,计算t+1时刻模块度预测值Mp(t+1);S6.将Mp(t+1)装载向量V;S7.判断t+1是否为最终时刻,若否,则将t赋值为t+1,返回步骤S2,若是,则执行步骤S8;S8.获取最终感知向量V。
-
公开(公告)号:CN101714948B
公开(公告)日:2016-03-30
申请号:CN200910236907.7
申请日:2009-10-27
Applicant: 清华大学
Abstract: 本发明提出了一种多域的网包的分类方法和装置,针对现有技术中多域的网包过滤规则繁复导致网包过滤效率低的问题而发明。本发明的方法包括:将多域的网包的过滤规则划分为两个或两个以上规则子集;确定多域的网包对应的规则子集,然后所述网包包头与规则子集进行匹配。本发明的装置包括:分类单元,所述分类单元将多域的网包的过滤规则划分为两个或两个以上规则子集;接收单元,所述接收单元接收多域的网包,并提取所述网包的包头;控制单元,所述控制单元连接所述接收单元和分类单元;所述控制单元将接收单元接收到的网包的包头,并根据包头确定多域的网包对应的规则子集,然后所述网包包头与规则子集进行匹配。
-
公开(公告)号:CN102984131B
公开(公告)日:2015-11-25
申请号:CN201210447220.X
申请日:2012-11-09
IPC: H04L29/06
Abstract: 本发明实施例公开了一种信息识别方法和装置,该方法包括:根据训练数据集获得二维正态分布模型参数,所述训练数据集包括具有类型标识的数据包,所述二维正态分布模型参数包括数据包载荷均值、间隔时间均值、数据包载荷方差、间隔时间方差和相关系数;根据所述二维正态分布模型获得待识别数据包的分类特征;根据所述训练数据集和所述待识别数据包的分类特征对所述待识别数据包进行特征识别,获得所述待识别数据包的类型标识。采用本发明,可以提高加密协议识别的正确率。
-
公开(公告)号:CN103546333A
公开(公告)日:2014-01-29
申请号:CN201210246765.4
申请日:2012-07-16
Applicant: 清华大学
Abstract: 本发明提供了一种加密网络流声纹特征向量提取方法,包括步骤:S2.为加密网络流建立一个声纹特征向量提取滑动窗口;S3.使用当前数据包更新声纹特征向量提取滑动窗口;S5.过滤声纹特征向量提取滑动窗口;S7.从滑动窗口中筛选出连续超过k个单元的单元组;S9.按顺序提取每个单元组的声纹特征。本发明提取的声纹特征能够有效地刻画网络流的动态特征。本发明的方法不仅继承了传统的网络流统计特征提取方法的优势,还能够提供更加丰富且可靠的知识,可以为高速网络中高性能流量分类系统的设计和实现提供技术支持。
-
公开(公告)号:CN103546307A
公开(公告)日:2014-01-29
申请号:CN201210246855.3
申请日:2012-07-16
Applicant: 清华大学
Abstract: 本发明提供了一种网络流存储方法,包括步骤:S1.初始化Client表和Server表;S2.查找捕获到的新进数据包在流表中对应的网络流;S3.更新Client表和Sever表。本发明的方法通过快速地将属于同一个节点的网络流聚合在一起,能够帮助流量分类系统深度挖掘网络流之间的关系,应对新型应用层协议带来的挑战,可以为高速网络中高性能流量分类系统、内容监控系统的设计和实现提供技术支持。
-
-
-
-
-
-
-
-
-