-
公开(公告)号:CN114050912A
公开(公告)日:2022-02-15
申请号:CN202111158750.8
申请日:2021-09-30
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511 , G06K9/62 , G06N3/08
Abstract: 本发明涉及一种基于深度强化学习的恶意域名检测方法和装置。该方法的步骤包括:获取待检测域名的真实DNS流量;查询并记录真实DNS流量中待检测域名的whois信息;根据待检测域名本身以及whois信息,对待检测域名进行特征提取,生成待检测域名的特征向量;将待检测域名的特征向量输入至深度强化学习模型中,判断待检测域名是否具有恶意行为。本发明使用基于深度强化学习的方法来解决真实DNS流量中良性与恶意样本数据不平衡的分类问题,能够快速有效地发现真实DNS流量中存在的低比例恶意样本,在低平衡率时依旧保持较好的效果。
-
公开(公告)号:CN108399152B
公开(公告)日:2021-05-07
申请号:CN201810119184.1
申请日:2018-02-06
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种数字查找树的压缩表示方法、系统、存储介质及规则匹配装置。该方法包括:采用完全矩阵表示法建立数字查找树的结点,并建立状态转换表;建立基值表,并利用数组记录叶子结点状态中对应的规则编号;利用基值表对状态行进行归一化,生成归一化矩阵;利用数组来记录归一化矩阵的状态,对归一化矩阵的状态进行去重,得到约简的状态转移矩阵;利用位图对约简的状态转移矩阵进行修正,使其中的元素能够用一个字节来表示;利用基值表、记录归一化矩阵状态的数组、位图和修正后的矩阵进行状态的匹配,并输出匹配结果。本发明以完全矩阵表示法为原型,能够保证结点间状态转移的时间复杂度为O(1),同时可大幅度减少数据结构的存储空间。
-
公开(公告)号:CN107515897B
公开(公告)日:2021-02-02
申请号:CN201710589808.1
申请日:2017-07-19
Applicant: 中国科学院信息工程研究所
IPC: G06F16/903
Abstract: 本发明涉及一种串匹配场景下数据集生成方法、设备和可读存储介质。该方法包括以下步骤:1)独立地生成模式串的每个字符,形成预设规模和预设长度的随机模式串集合;2)根据已生成的随机模式串集合,构造指定命中水平的文本数据集;3)输出生成的随机模式串集合和文本数据集。该设备包括通过总线连接的接收器、处理器、存储器和发送器,所述存储器用于存储串匹配场景下数据集生成指令。本发明能够生成预设规模预设长度的随机模式串集合,根据已生成的随机模式串集合可以构造指定命中水平的文本数据集,该随机模式串集合和文本数据集能够用于串匹配算法的功能测试和性能测试,对串匹配算法的进一步研究和性能提升有重要的作用。
-
公开(公告)号:CN108090115A
公开(公告)日:2018-05-29
申请号:CN201711070628.9
申请日:2017-11-03
Applicant: 中国科学院信息工程研究所
CPC classification number: G06F17/30097 , G06F17/30153 , H04L67/02 , H04L67/06
Abstract: 本发明提出一种针对Gzip压缩数据的过滤方法,根据Gzip压缩数据的特点,并结合KR多模式匹配算法,提升Gzip压缩数据的过滤速度,同时提高处理的实时性和安全性。本发明还提出一种针对Gzip压缩数据的过滤系统,用于执行该方法。
-
公开(公告)号:CN116170168B
公开(公告)日:2025-05-06
申请号:CN202210253611.1
申请日:2022-03-15
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明公开一种基于深度支持向量数据描述的DGA域名检测方法及系统,涉及网络安全领域,为解决解决已有工作检测未知DGA家族方法单一、检测率低的问题,本发明首先从真实DNS流量获取不可解析域名作为待检测域名,然后对不可解析域名提取特征向量,最后将特征向量输入至深度支持向量数据描述算法模型中,判别每个不可解析域名是否是DGA域名。
-
公开(公告)号:CN116628303B
公开(公告)日:2025-03-14
申请号:CN202310462355.1
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/951 , G06F16/958 , G06F16/353 , G06F18/2415 , G06F40/186 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于提示学习的半结构化网页属性值抽取方法和系统,涉及互联网领域,首先根据DOM树简化算法检索变量节点的DOM树视角提示,然后设计包含任务描述的任务模板获得模板视角提示信息,最后引入基于encoder‑decoder结构的预训练语言模型,并以“提示”为核心操作,全面分析领域数据特点和目标任务特点,设计两种视角的提示信息,通过模板填充融合双视角提示信息,通过提示学习的方式在语义层面和任务层面联合引导预训练语言模型进行任务学习,实现预训练语言模型和属性值抽取任务的有效结合,实现了领域标注数据稀缺场景下优越的模型性能。
-
公开(公告)号:CN118646570A
公开(公告)日:2024-09-13
申请号:CN202410715623.0
申请日:2024-06-04
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511 , G06F18/214 , G06F18/2433 , G06N3/042 , G06N3/0895
Abstract: 本发明公开了一种基于元伪标签的半监督恶意域名检测方法及系统,属于网络安全领域。本发明从DNS流量中提取域名之间的关联关系并建立域名关联图,提取域名特征并作为域名关联图中节点的初始化向量;将由金标签节点和无标签节点输入到伪标签生成器,推测出无标签节点上的伪标签,得到伪标签节点;将金标签节点和伪标签节点输入到域名分类器中,预测出良性域名和恶意域名;通过对伪标签生成器和域名分类器进行循环迭代训练,优化域名分类器的内循环参数和伪标签生成器的外循环参数;利用训练好的域名分类器对网络DNS流量中的恶意域名进行检测。本发明能够检测出隐藏在孤立节点中的恶意域名。
-
公开(公告)号:CN115630145A
公开(公告)日:2023-01-20
申请号:CN202211175448.8
申请日:2022-09-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/33 , G06N5/04
Abstract: 本发明公开了一种基于多粒度情感的对话推荐方法及系统。本方法为:1)利用对话推荐系统中的编码器对历史对话上下文语句进行语义编码;其中,所述语义编码包括历史对话上下文语义向量编码和多粒度情感感知向量编码;所述历史对话上下文语义向量编码方法为:使用词向量嵌入矩阵和位置嵌入矩阵将历史对话上下文中的每个文本单元表示为对应的文本单元语义向量,得到历史对话上下文的语义表示向量;所述多粒度情感感知向量编码方法为:对历史对话上下文中的情感词进行编码得到历史对话上下文的多粒度情感感知向量;2)对语义编码进行线性变换映射,并将映射结果与历史对话上下文进行拼接后输入对话推荐系统中的解码器,得到推荐的回复语句。
-
公开(公告)号:CN108090115B
公开(公告)日:2022-05-17
申请号:CN201711070628.9
申请日:2017-11-03
Applicant: 中国科学院信息工程研究所
IPC: G06F16/13 , G06F16/174 , H04L67/02 , H04L67/06
Abstract: 本发明提出一种针对Gzip压缩数据的过滤方法,根据Gzip压缩数据的特点,并结合KR多模式匹配算法,提升Gzip压缩数据的过滤速度,同时提高处理的实时性和安全性。本发明还提出一种针对Gzip压缩数据的过滤系统,用于执行该方法。
-
公开(公告)号:CN108073679B
公开(公告)日:2021-09-28
申请号:CN201711103789.3
申请日:2017-11-10
Applicant: 中国科学院信息工程研究所
IPC: G06F16/903
Abstract: 本发明涉及一种串匹配场景下随机模式串集合生成方法、设备和可读存储介质。该方法包括以下步骤:1)获取基于字符出现的频率建立的基于马尔可夫链的模型;2)利用基于马尔可夫链的模型生成指定长度和规模的随机模式串集合。该设备包括接收器、处理器、存储器和发送器。本发明生成的随机模式串集合符合现实世界的概率分布特征,能够依据真实模式串集合的概率分布特征生成任意长度、任意规模、特定类型的随机模式串集合,从而用于串匹配算法的功能测试和性能测试。
-
-
-
-
-
-
-
-
-