-
公开(公告)号:CN116886327A
公开(公告)日:2023-10-13
申请号:CN202310469489.6
申请日:2023-04-27
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明公开了一种基于异质图自监督学习的恶意域名检测方法和系统。所述方法包括:将DNS场景建模为一个原始异质图;其中,所述原始异质图中的节点包括:域名、客户端和IP地址;在数据层面上引入轻微的扰动来生成所述原始异质图的轻微扰动图;根据域名级的对比损失和图级的相似性损失,获取所述原始异质图中域名的节点表示;其中,所述域名级的对比损失是对原始异质图和轻微扰动图中域名的节点表示进行相似性对比得到,所述图级的相似性损失是对原始异质图和轻微扰动图的图嵌入表示进行相似性对比得到;基于所述原始异质图中域名的节点表示,得到所述DNS场景的恶意域名检测结果。本发明可以在域名标签稀疏的困境下解决恶意域名模型过拟合的问题。
-
公开(公告)号:CN116663532A
公开(公告)日:2023-08-29
申请号:CN202310312449.0
申请日:2023-03-28
Applicant: 中国科学院信息工程研究所
IPC: G06F40/216 , G06F40/284 , G06F40/30 , G06N3/045 , G06N3/08
Abstract: 本发明公开一种基于核对齐推理的对比自蒸馏BERT加速方法及装置。所述方法包括:构建推理模型;其中,所述推理模型是每一transformer层之后额外添加一个早退分类器的BERT模型;基于分类损失、对比损失和蒸馏损失,训练推理模型;使用训练后的推理模型进行任务预测,并基于核对齐的退出机制输出所述任务的预测结果。本发明实现了高加速比情况下优越的模型性能。
-
公开(公告)号:CN115424025A
公开(公告)日:2022-12-02
申请号:CN202210927391.6
申请日:2022-08-03
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种稠密子图抽取方法和系统,属于计算机软件技术领域。该方法包括:对原图采用Mas策略进行子图分割,得到节点序列L;对节点序列L进行合并检查,无法通过合并检查的结点重新回到原图做后续的分割;对通过合并检查的子图结点进行合并,构成K边联通子图。本发明在图分解框架中使用了最大S‑T流解决路径数搜索问题,对现有Mas策略的不足提出了改进方法,使得本方法在K‑ECC抽取工作中提高了现有工作的准确率。
-
公开(公告)号:CN108399152A
公开(公告)日:2018-08-14
申请号:CN201810119184.1
申请日:2018-02-06
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种数字查找树的压缩表示方法、系统、存储介质及规则匹配装置。该方法包括:采用完全矩阵表示法建立数字查找树的结点,并建立状态转换表;建立基值表,并利用数组记录叶子结点状态中对应的规则编号;利用基值表对状态行进行归一化,生成归一化矩阵;利用数组来记录归一化矩阵的状态,对归一化矩阵的状态进行去重,得到约简的状态转移矩阵;利用位图对约简的状态转移矩阵进行修正,使其中的元素能够用一个字节来表示;利用基值表、记录归一化矩阵状态的数组、位图和修正后的矩阵进行状态的匹配,并输出匹配结果。本发明以完全矩阵表示法为原型,能够保证结点间状态转移的时间复杂度为O(1),同时可大幅度减少数据结构的存储空间。
-
公开(公告)号:CN108073679A
公开(公告)日:2018-05-25
申请号:CN201711103789.3
申请日:2017-11-10
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种串匹配场景下随机模式串集合生成方法、设备和可读存储介质。该方法包括以下步骤:1)获取基于字符出现的频率建立的基于马尔可夫链的模型;2)利用基于马尔可夫链的模型生成指定长度和规模的随机模式串集合。该设备包括接收器、处理器、存储器和发送器。本发明生成的随机模式串集合符合现实世界的概率分布特征,能够依据真实模式串集合的概率分布特征生成任意长度、任意规模、特定类型的随机模式串集合,从而用于串匹配算法的功能测试和性能测试。
-
公开(公告)号:CN118631477A
公开(公告)日:2024-09-10
申请号:CN202310221375.X
申请日:2023-03-09
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511 , G06F18/241 , G06F18/214 , G06N3/04 , G06N3/0985 , G06F16/901
Abstract: 本发明涉及一种基于元学习的小样本恶意域名检测方法及装置。所述方法包括:将DNS场景建模为异质图;所述异质图的节点包括:客户端、域名和IP地址,所述异质图的边包括:客户端查询域名、域名解析为IP地址和域名的规范名称;基于异质图神经网络HGT来学习域名的节点表示,以得到更新后的域名特征向量;使用基于元学习的小样本分类器对所述更新后的域名特征向量进行分类,以得到恶意域名检测结果。本发明可以获取更好的恶意域名检测效果。
-
公开(公告)号:CN116668076A
公开(公告)日:2023-08-29
申请号:CN202310469493.2
申请日:2023-04-27
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明公开了一种基于异质图鲁棒对抗学习的恶意域名检测方法和装置。所述方法包括:将DNS场景建模为一个原始异质图;其中,所述原始异质图中的节点包括:域名、客户端和IP地址;对原始异质图进行攻击注入,以得到若干个受攻击图;基于DoDe‑CL模型和多层感知机,计算原始异质图和受攻击图中的域名嵌入表示后,对同一域名进行域名嵌入表示组合,并根据组合后的域名嵌入表示,得到所述DNS场景中的恶意域名检测结果。本发明可以提升模型面对基于异质图的攻击时的鲁棒性。
-
公开(公告)号:CN116628303A
公开(公告)日:2023-08-22
申请号:CN202310462355.1
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/951 , G06F16/958 , G06F16/35 , G06F18/2415 , G06F40/186 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于提示学习的半结构化网页属性值抽取方法和系统,涉及互联网领域,首先根据DOM树简化算法检索变量节点的DOM树视角提示,然后设计包含任务描述的任务模板获得模板视角提示信息,最后引入基于encoder‑decoder结构的预训练语言模型,并以“提示”为核心操作,全面分析领域数据特点和目标任务特点,设计两种视角的提示信息,通过模板填充融合双视角提示信息,通过提示学习的方式在语义层面和任务层面联合引导预训练语言模型进行任务学习,实现预训练语言模型和属性值抽取任务的有效结合,实现了领域标注数据稀缺场景下优越的模型性能。
-
公开(公告)号:CN116170168A
公开(公告)日:2023-05-26
申请号:CN202210253611.1
申请日:2022-03-15
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明公开一种基于深度支持向量数据描述的DGA域名检测方法及系统,涉及网络安全领域,为解决解决已有工作检测未知DGA家族方法单一、检测率低的问题,本发明首先从真实DNS流量获取不可解析域名作为待检测域名,然后对不可解析域名提取特征向量,最后将特征向量输入至深度支持向量数据描述算法模型中,判别每个不可解析域名是否是DGA域名。
-
公开(公告)号:CN113472742B
公开(公告)日:2022-09-27
申请号:CN202110588732.7
申请日:2021-05-28
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L41/142 , G06K9/62 , G06N3/04
Abstract: 本发明涉及一种基于门控循环单元的内部威胁检测方法和装置。该方法的步骤包括:解析用户审计日志以获取用户动作信息,将每个用户的动作按照时间先后顺序构建用户动作序列;利用门控循环单元GRU从用户动作序列中提取用户行为的时序特征;将提取的时序特征输入LR分类器进行分类,判别其为正常或异常,从而实现内部威胁检测。本发明融合多域的用户活动记录以全面地刻画用户行为,GRU可以更好地捕获用户动作序列的长期依赖,该方案能够实现用户行为细粒度的分析并提高了内部威胁检测的准确率。
-
-
-
-
-
-
-
-
-