-
公开(公告)号:CN104008136A
公开(公告)日:2014-08-27
申请号:CN201410191247.6
申请日:2014-05-07
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30657
Abstract: 本发明提供一种文本快速查找的方法和装置,包括:优化数据存储结构,建立有限状态自动机,存储每个状态的单链表;存储扇出系数大于指定阈值的单链表Vi的字符域和状态域,其中i为单链表节点状态域的值,i≥0且取整数,将其转化为线性表Li且释放所述单链表Vi的存储空间,对所述线性表Li的字符域进行排序;计算所述有限状态自动机的跳转函数、失效函数和输出函数,其中,计算所述跳转函数时,若当前状态等于所述单链表Vi的状态域,对所述线性表Li进行二分查找;完成文本的匹配和查找。本发明加快了下一状态的跳转速度,既降低了AC算法的空间复杂度,减少了内存消耗,又提高了算法的效率。
-
公开(公告)号:CN116432042A
公开(公告)日:2023-07-14
申请号:CN202111659455.0
申请日:2021-12-30
Applicant: 中国科学院信息工程研究所
IPC: G06F18/22 , G06F18/241 , G06N3/0464 , G06N3/0442 , G06N3/042 , G06N3/045 , G06F21/10 , G06F21/56 , G06F21/57
Abstract: 本发明提供一种二进制函数相似性检测方法及装置,包括:分别对待检测的两个二进制函数进行预处理,得到各个二进制函数的中间语言序列和控制流程图;基于第一预设神经网络模型,分别对各个二进制函数的中间语言序列进行语义特征提取,得到各个二进制函数的语义特征向量表示,并基于第二预设神经网络模型,分别对各个二进制函数的控制流程图进行结构特征提取,得到各个二进制函数的结构特征向量表示;将每个二进制函数的语义特征向量表示和结构特征向量表示输入到预设多层感知机分类器,得到两个二进制函数的相似性检测结果。本发明的方法有效地解决了语法和结构特征易受干扰等现有技术缺陷,提高了二进制函数相似性检测的精度和鲁棒性。
-
公开(公告)号:CN116431802A
公开(公告)日:2023-07-14
申请号:CN202111653782.5
申请日:2021-12-30
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F40/284 , G06F18/214 , G06F18/241
Abstract: 本发明提供一种单词识别方法、装置、电子设备及存储介质,该方法包括:将待识别文本输入单词识别模型;利用所述单词识别模型输出所述待识别文本中各个单词的单词类别,所述单词类别包括方面词、方面词子词、观点词、其他词和其他子词中的至少一个;其中,所述单词识别模型为根据多个训练样本训练得到。本发明通过多个训练样本训练得到单词识别模型,并利用该单词识别模型输出得到待识别文本中各个单词的单词类型,能准确识别出待识别文本中各个单词的单词类型,进而能准确得知待识别文本中哪些单词是方面词和观点词。
-
公开(公告)号:CN116150750A
公开(公告)日:2023-05-23
申请号:CN202211659438.1
申请日:2022-12-22
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56
Abstract: 本发明提供一种恶意软件检测方法、装置、电子设备及存储介质,该方法包括:对待检测软件进行动态分析,得到待检测软件的异质图;将待检测软件的异质图输入预设的神经网络模型进行检测,得到检测结果;其中,所述异质图包括系统资源节点和应用程序接口节点,且所述应用程序接口节点指向所述系统资源节点;所述预设的神经网络模型以恶意软件的异质图和正常软件的异质图为样本,以及与恶意软件的异质图和正常软件的异质图相对应的标签训练得到。本发明的目的是解决现有技术在对恶意软件进行检测时,无法有效应对较少的API调用,无法生成有效的API行为图,导致无法对恶意软件进行有效的准确检测的问题。
-
公开(公告)号:CN113037749B
公开(公告)日:2022-06-03
申请号:CN202110252226.0
申请日:2021-03-08
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40
Abstract: 本发明提供一种C&C信道判别方法及系统,包括:获取待识别流量;基于行为刻画对所述待识别流量进行分类,得到具有预设种类个数和预设行为特征个数的若干个原始特征;对所述若干个原始特征进行特征选择,得到待判断行为特征;基于预设机器学习算法识别所述待判断行为特征,得到时间槽信道类型推断结果;根据预设C&C信道特征对所述时间槽信道类型推断结果进行综合判定,得到C&C信道架构类型判定结果。本发明通过监控单一主机网络流量,提出的行为特征、时间槽划分、推理和综合判断的机制适用于具备复杂网络行为的恶意程序,且运用特征选择方法在确保判别正确性的前提下有效提升了信道架构类型分析的速度。
-
公开(公告)号:CN111680120B
公开(公告)日:2022-06-03
申请号:CN202010367249.1
申请日:2020-04-30
Applicant: 中国科学院信息工程研究所
IPC: G06F16/33 , G06F16/953 , G06K9/62
Abstract: 本发明实施例提供了一种新闻类别检测方法及系统,所述方法包括:获取待检测新闻的内容文本和社会属性文本;将内容文本以及社会属性文本输入至新闻类别粗检测模型,得到新闻类别粗检测模型输出的待检测新闻的第一类类别文本。所述方法还包括:将所述第一类类别文本、所述内容文本以及所述社会属性文本输入至新闻类别细检测模型,得到所述新闻类别细检测模型输出的所述待检测新闻的第二类类别文本。通过新闻类别粗检测模型以及细检测模型,实现特征提取、特征融合,并在特征融合时考虑到社会属性文本,使融合结果更加准确,也使得基于融合结果确定的检测结果更准确。
-
公开(公告)号:CN113037749A
公开(公告)日:2021-06-25
申请号:CN202110252226.0
申请日:2021-03-08
Applicant: 中国科学院信息工程研究所
IPC: H04L29/06
Abstract: 本发明提供一种C&C信道判别方法及系统,包括:获取待识别流量;基于行为刻画对所述待识别流量进行分类,得到具有预设种类个数和预设行为特征个数的若干个原始特征;对所述若干个原始特征进行特征选择,得到待判断行为特征;基于预设机器学习算法识别所述待判断行为特征,得到时间槽信道类型推断结果;根据预设C&C信道特征对所述时间槽信道类型推断结果进行综合判定,得到C&C信道架构类型判定结果。本发明通过监控单一主机网络流量,提出的行为特征、时间槽划分、推理和综合判断的机制适用于具备复杂网络行为的恶意程序,且运用特征选择方法在确保判别正确性的前提下有效提升了信道架构类型分析的速度。
-
公开(公告)号:CN112508849A
公开(公告)日:2021-03-16
申请号:CN202011242471.5
申请日:2020-11-09
Applicant: 中国科学院信息工程研究所
Abstract: 本发明实施例提供一种数字图像拼接检测方法及装置,该方法包括:以预设大小的滑动窗口和步长,遍历待检测图像,得到多个图像块;将所述多个图像块,分别输入预设的第一卷积神经网络模型,得到每个图像块的拼接检测结果;若第一卷积神经网络模型判为拼接的图像块数量,占总图像块数量的比例大于预设阈值,则待检测图像为拼接图像;其中,第一卷积神经网络模型,根据已知拼接结果作为标签的图像块,进行训练后得到。该方法通过预设大小的滑动窗口和步长,遍历待检测图像,得到多个图像块,可以使用相对简单的策略进行训练,提高了模型的计算效率。此外,利用深度学习的特征提取及学习方式,大大提高在复杂彩色图像上的检测准确率,泛化能力较强。
-
公开(公告)号:CN108875374B
公开(公告)日:2020-09-25
申请号:CN201810333712.3
申请日:2018-04-13
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56
Abstract: 本发明实施例公开一种基于文档节点类型的恶意PDF检测方法及装置,能有效的提高检测的准确率,加强对模拟攻击的检测能力。方法包括:S1、以节点为单位对待检测的PDF文档进行划分,并对所述待检测的PDF文档的节点进行类型划分,以不同类型节点出现的属性分布为特征,对所述特征进行向量化表达;S2、将所述向量化表达的结果输入预先构建的检测模型,得到所述待检测的PDF文档是否为恶意PDF文档的检测结果。
-
公开(公告)号:CN109858248A
公开(公告)日:2019-06-07
申请号:CN201811601084.9
申请日:2018-12-26
Applicant: 中国科学院信息工程研究所
IPC: G06F21/56
Abstract: 本发明实施例提供一种恶意Word文档检测方法和装置,所述方法包括:提取待检测的Word文档中的可疑代码及负载;根据恶意文档代码特征库对待检测的Word文档中的可疑代码及负载进行扫描和模式匹配,获取待检测的Word文档的特征向量;将所述待检测的Word文档的特征向量输入至恶意文档分类模型中,获取所述恶意文档分类模型输出的分类结果;根据所述分类结果和所述待检测的Word文档的特征向量,生成所述待检测的Word文档的检测报告。本发明实施例有针对性地提取Word文档中嵌入的恶意代码和恶意负载,可节省检测时间,且不受限于Word版本,对代码混淆攻击和未知类型的攻击也有很好的适应能力。
-
-
-
-
-
-
-
-
-