-
公开(公告)号:CN112506789A
公开(公告)日:2021-03-16
申请号:CN202011492806.9
申请日:2020-12-17
Applicant: 中国科学院计算技术研究所
IPC: G06F11/36 , G06F16/903 , G06F8/41
Abstract: 本发明提供了一种用于数据包检测的并行模式匹配方法,包括:步骤1,将特征字符串编译成AC自动机;步骤2,将数据包依据匹配线程的数量分片,每个分片由对应的线程执行AC算法,寻找匹配的特征字符串;步骤3,每个线程在处理完毕所分配的数据包分片后,除了最后一个分片对应的线程之外的其他线程跨越数据包分片分割点继续执行AC算法,通过比较各个AC自动机的状态深度和越过分割点后所检测的字符个数,确定最小冗余区域长度,寻找匹配的特征字符串。
-
公开(公告)号:CN116502153A
公开(公告)日:2023-07-28
申请号:CN202310392001.4
申请日:2023-04-13
Applicant: 中国科学院计算技术研究所
IPC: G06F18/243 , H04L61/4511 , H04L61/103 , G06F18/213 , G06N3/0442 , G06N3/08
Abstract: 本发明提供一种用于域名分类的分类模型构建方法,所述分类模型为随机森林模型,且所述随机森林模型中包括多个决策树分类器,所述方法包括如下步骤:S1、获取来自于DNS服务器的DNS响应数据并对其进行预处理以得到带域名类型标签的训练集,其中,所述域名类型标签为一次性域名标签或非一次性域名标签;S2、对步骤S1得到的训练集进行多种特征提取以获取训练集中每个域名样本对应的特征集合;S3、基于经步骤S2进行特征提取后的训练集,以域名样本对应的特征集合为输入,域名样本类型为输出构建随机森林模型。本发明采用由多个决策树分类器组成的随机森林模型进行域名分类,以缓解现有方法中预测时间长、检测效率低的问题。
-
公开(公告)号:CN112506789B
公开(公告)日:2022-08-02
申请号:CN202011492806.9
申请日:2020-12-17
Applicant: 中国科学院计算技术研究所
IPC: G06F11/36 , G06F16/903 , G06F8/41
Abstract: 本发明提供了一种用于数据包检测的并行模式匹配方法,包括:步骤1,将特征字符串编译成AC自动机;步骤2,将数据包依据匹配线程的数量分片,每个分片由对应的线程执行AC算法,寻找匹配的特征字符串;步骤3,每个线程在处理完毕所分配的数据包分片后,除了最后一个分片对应的线程之外的其他线程跨越数据包分片分割点继续执行AC算法,通过比较各个AC自动机的状态深度和越过分割点后所检测的字符个数,确定最小冗余区域长度,寻找匹配的特征字符串。
-
-